583

2023-03-20

该论文来自” ieee transactions on neural systems and rehabilitation engineering”期刊, 发表于 2021 年 1 月 16 日, 论文名称为”cross-disciplinary emotion recognition based on similarity of eeg signal transfer learning domain”.

为了解决通过脑电图(eeg)信号迁移学习进行跨被试情绪识别中由于源域数据的负迁移而导致的准确率下降问题, 这篇论文提供了一种新的方法来动态选择适合迁移学习的数据, 并消除可能导致负迁移的数据. 这种方法被称为跨被试源域选择(cross-subject source domain selection, csds).

改论文提出的方法主要分为三个部分. 首先, 根据 copula 函数理论建立 frankcopula 模型, 用于研究源于和目标域之间的相关性, 用 kendall 相关系数来描述. 然后改进了最大平均差异的计算方法, 以确定单个源中类之间的距离. 归一化后叠加肯德尔相关系数, 并设置阈值已识别最合适迁移学习的源于数据. 最后在迁移学习的过程中, 在流形嵌入分布对齐的基础上, 使用局部切线空间对其方法对非线性流形的局部集合进行低维线性估计, 保持了降维后样本数据的局部特征. 最后的实验结果表明, 与传统方法相比, csds 方法使情绪分类的准确率提高了约 2.8%, 运行时间缩短了 65%.

方法介绍

他们首先提出使用 copula 函数对跨受试者脑电信号之间的非线性相关性进行建模并设置权重，然后通过改进的最大均方差（mmd）方法将源域数据集的权重相加，对源域数据进行滤波，以更好地传输滤波后的数据。最后，基于 meda，他们提出了一种迁移学习方法，该方法在将数据投影到流形空间时，在降维过程中使用局部切线空间对齐（ltsa）来保持数据的原始空间结构，以提高分类精度。

学习报告基于脑电信号迁移学习领域相似性的跨被试情绪识别-z6尊龙旗舰厅

copula 函数也被称为连接函数，用于描述多个变量之间的所有相关性。

f 是 d 维随机变量的联合分布函数，对应的边分布为，c()是 d 元 copula 函数，使得所有。

设随机变量对应的连续分布函数为，可以得到

。它服从[0,1]的均匀分布，随机变量的联合分布是：

是的伪逆数，被定义为：

假设 n 维向量的边缘密度函数为 ,copula 函数的密度为：

两个随机变量的连续累积分布是指分别对两个服从[0,1]均匀分布的随机变量应用概率积分变换得到的分布，它们的相关性可以用变换后的分布的相关性代替。然后，它被简化为在两个均匀分布上定义联合分布，这是一个 copula 函数，分为三种类型：阿基米德型、椭圆型和二次型。

对于脑电信号的情绪模型，不同受试者在不同时间的脑电图像是不同的。当使用 copula 函数建模时，样本分布函数和概率密度不能被清楚地假设；因此，非参数估计不假设基本分布，而是主要利用随机样本的信息来判断估计器的优缺点，这适合于 eeg 信号建模。

spearman 相关系数ρ也被称为秩相关系数，使用两个变量的秩进行线性相关分析：

和分别表示 x 和 y 的秩，和分别代表和的等级，越大相关性越强。

肯德尔相关系数τ表示分类变量的统计数据，它用于反映分类变量的相关性，适用于两个分类变量按顺序分类的情况。

其中，代表观测数据。τ越大，变量之间的相关性更高。

mmd 是衡量两个分布在重现核希尔伯特空间中的距离。它是一种内核学习的一种方法。定义为：

表示原始数据到希尔伯特空间的映射。这个公式用于确定核空间中两堆数据之间的平均距离。作者提出了改进的 mmd 公式，用于计算源域中类间距离的总和。

c 表示源域内的类别，表示单个源域中类别之间的距离。如图 1 是分两类结果核源域中类间距离之和的相关性，可以看到类间距离之和越大，对应的准确率越高。

图 1

不同的源域被赋予不同的置信度，叠加上文中 copula 相关系数的置信度来筛选数据迁移学习的源域。

在传统特征匹配的领域自适应方法中。条件分布和边际分布的重要程度是不相等的，在原始空间对齐分布会导致其特征的失真。这种效果并不理想。新的研究中提出了一种避免特征失真并定量估计边缘分布和条件分布的重要性的方法。首先，为了消除退化的特征，流形特征泛函 g(.)是在格拉斯曼流形 g(d)中研究的，引用测地流核(the geodesic flow kernel，gfk)来

促进其域适应。

动态分布的目的是定量评估两种分布在域适应中的重要性：