syd【TNSRE 2021】AttnSleep:基于注意力的单导EEG睡眠分期方法

0. Abstract

睡眠阶段自动分类对睡眠质量的监测具有重要意义，本文提出了一种基于注意力的深度网络AttnSleep，利用单导EEG进行睡眠分期。用多分辨率卷积网络（MRCNN）提取特征，通过自适应特征重校准(AFR)对特征之间的依赖进行建模；第二模块是时间上下文编码器（TCE），用多头注意机制（MHA）来捕获所提取特征之间的时间关系，在三个公开数据集上评估了模型性能。

1. Intorduction

研究意义：睡眠的重要性；PSG人工分类；

研究现状：特征工程+分类器；深度学习方法，CNN，CNN+RNN（时间相关性），注意力机制；类不均衡问题，过采样。

本文贡献：所以本文提出了AttnSleep，MRCNN提取高频、低频特征，AFR对特征依赖进行建模，加强特征学习；时间上下文编码器（TCE），多头注意力+因果卷积来捕获特征中的时间相关性；针对类不均衡问题设计了类相关的损失函数；在三个公开数据集上进行实验。

2. Method

2.1 总框架

总体框架如图1，由三部分组成：1)特征提取块，2)时间上下文编码块，3)分类块。MRCNN提取高频、低频特征，ARF自适应地选择和突出最重要的特征；TCE模块来捕获特征中的时间相关性；softmax进行分类，类感知的损失函数。

2.2 特征提取

2.2.1 MRCNN

不同的睡眠阶段具有不同的频率范围，所以两个不同卷积核的卷积分支，探索不同的频带，捕获不同的时间步长范围（4s，0.5s）；EEG具有非平稳特征，不同类型的特征组合对非平稳特征信号有重要意义。

在MRCNN模块中使用GELU激活函数，因为它允许输入的一些负权值通过，对很小的负值有较强的控制力（与leakyrelu等相比）

2.2.2 ARF

AFR的目的是对MRCNN学习的特征进行重新校准，以提高其性能。通过residual SE块对特征之间的依赖性进行建模，自适应地选择最具鉴别性的特征。

在residualSE块中，包含两层卷积（kerner和stride均为1）；再用自适应平均池化来压缩全局的空间信息得到s，经过线性层-激活函数-线性层-激活函数得到e，

利用e对F进行放缩，得到加权求和：

shortcut连接，将原始输入I和residualSE的输出相加，得到ARF最终的输出：

“Squeeze-and-Excitation(SE)”单元，对通道间的依赖关系进行建模，可以自适应的调整各通道的特征响应值；学习每个通道的重要程度，增强有用的特征，抑制无用的特征

SE block主要由三部分构成，Squeeze操作,Excitation操作，Fscale操作。

首先，Ftr把输入的X映射为特征图U，Ftr可以是一个最常见的卷积操作或者其他操作。

其次，Squeeze操作对U进行一个全局的池化操作，比如最大池化或者平均池化(WxH空间范围内进行池化)，产生一个embedding（1x1xC）。

再次，Excitation操作将上面产生的embedding进行一系列非线性映射(比如FC+RELU+FC)，最后跟一个sigmoid得到每个通道的权重。

最后，将上面得到的每个通道的权重作用于U，对每个通道的U进行加权求和。至此，就完成了整个SE block的映射。

核心思想是不同通道的权重应该自适应分配，由网络自己学习出来。

https://zhuanlan.zhihu.com/p/70881455