论文概要
近期,华南师范大学软件学院脑机交互与混合智能团队提出了一种新的PD自动检测模型,称为多尺度卷积原型网络(The Multiscale Convolutional Prototype Network,MCPNet),它集成了改进的多尺度卷积神经网络和原型学习。一方面,利用多尺度卷积神经网络从不同尺度提取大脑特征,增强特征的多样性和利用率;另一方面,引入了一种原型校准策略,降低了数据噪声对原型生成的影响,提高了模型的泛化性能。
该论文已被IEEE Transactions on Instrumentation and Measurement(中科院二区,IF=5.6)接收,题目为《A Novel EEG-based Parkinson's Disease Detection Model using Multiscale Convolutional Prototype Networks》 。由华南师范大学邱丽娜副研究员为第一作者, 潘家辉教授为通讯作者,其中华南师范大学为第一单位。
图1 MCPNet整体框架图
研究背景
阿金森病(PD)是一种以黑质多巴胺能神经元丧失为特征的慢性进行性退行性疾病。它会导致行为、认知和情绪障碍,对PD患者及其家人的日常生活造成严重的负面影响。准确的诊断对于有效的预后和治疗至关重要。目前,PD的临床诊断主要依靠运动障碍学会的诊断标准。这些标准包括运动迟缓的基本特征,至少有一种静止性震颤或强直,这些症状与多巴胺能神经元密切相关。然而,这种诊断在一定程度上依赖于医疗专业人员的主观判断,存在误诊和漏诊的风险。
尽管基于机器学习的PD自动检测方法已经显示出有希望的结果,但大多数算法并没有尝试评估它们在不同受试者中的表现。由于脑电图信号的小样本量和跨被试可变性,基于留一个被试(LOSO)交叉验证的疾病检测精度往往不能令人满意。同时,目前的大多数研究只验证了模型在特定数据集上的有效性,对其他数据集的泛化性还需要进一步验证。在实践中,由于跨数据集的可变性,来自一个公共数据集的预训练模型可能无法准确预测来自另一个公共数据集的新数据,即该模型只在其训练数据集上表现良好。因此,一种不依赖于临床运动特征检测的更有效的诊断方法对于改善PD患者的预后至关重要。
方法与结果分析
本文提出了一种新的基于脑电图的PD自动检测模型,MCPNet模型主要由三个部分组成:特征提取、原型学习和原型校准。首先,我们利用基于多尺度卷积神经网络的编码器M作为MCPNet模型的特征提取器。它从多个尺度的输入特征中提取信息,并将其转换成新的特征向量。随后,在原型学习过程中,为每个分类类生成原型,并根据样本与原型的距离对样本进行分类。此外,在测试阶段的原型生成过程中,引入了一种原型校准策略,以减轻来自跨主题和跨数据集变化的数据噪声。
1)特征提取模块(Feature Extraction Module)
如图2所示,我们设计的编码器M作为特征提取器,由一个输入层、两个子网络和一个输出层组成。两个子网络并行运行,每个子网络由不同尺度的卷积块组成,从输入特征的不同维度捕获信息。其中,子网1主要由5×5-sized卷积块组成,子网2主要由7×1和5×1-sized卷积块组成。此外,我们在初始卷积和池化后的第一个子网络中引入残差学习的概念,其中使用具有5×5卷积核大小的残差块。样本数据在两个独立的子网络中进行卷积、池化和其他操作。最后,在两个子网络的末端,这些不同尺度的特征矩阵被平铺并连接,产生一个新的特征向量作为输出层的输出。
图2 编码器M的框架示意图
2)原型学习模块(Prototype Learning Module)
原型学习的目的是通过学习一组原型来实现分类,这些原型通常由样本或特征向量表示,作为不同类别或类别簇的代表,从而将共享的内在特征封装在类别中。在该模块中,首先对编码器M映射的特征向量进行计算,将其平均值作为每个类的原型。然后,对于给定的样本,使用欧几里得距离度量来计算其在嵌入空间中到每个类原型的距离。最后,通过softmax操作将这些距离转换成类间的概率分布,得到样本属于某一类的概率,
3)原型校准策略(Prototype Calibration Strategy)
在实际应用中,深度学习模型往往表现出较差的泛化性能。在本研究中,我们对MCPNet模型进行了数据集内和跨数据集的跨主题验证实验。在数据集内验证中,测试样本和训练样本来自同一数据集,但来自不同的被试。相反,在跨数据集验证中,测试和训练样本取自两个完全独立的数据集。由于数据采集设备和环境的变化,每个数据集都有特定的配置,包括放大器、电极帽、采样率和带通滤波设置,这可能导致显著的跨数据集可变性。如果直接在另一个数据集上测试从一个数据集获得的预训练模型,可能会削弱模型的性能。这是因为模型在其训练数据集的结构上变得高度专业化,并且难以很好地泛化到不同的数据集。因此,跨被试、跨数据集的变化对模型泛化能力的影响是不可避免的。为了减轻这些变化引起的模型性能下降的潜在风险,我们在测试过程中引入了原型校准策略。该策略通过消除一定的样本噪声来提高类原型的可靠性,从而增强MCPNet模型的泛化能力。
对于数据集内分类,采用无监督原型校准策略。具体来说,首先使用K-Means算法将支持集中的所有样本分成两个簇。随后,分别计算每个样本点到这两个聚类中心质心的距离,将远离两个聚类质心的20%的点标记为噪声点并去除。最后,对每个类别中剩余的样本,计算它们的平均值,得到分类查询集样本的原型。
对于跨数据集分类,采用有监督的原型校准策略。此策略分两个阶段执行,如图3所示。在第一阶段,通过计算从支持集中生成的特征向量(图3中特征点)的平均值,为每个类建立初始原型(图3中称为C1初始原型和C2初始原型)。随后,根据每个特征向量与初始原型之间的距离,将远离所有初始原型的特征向量按比例修剪(此处设置为10%)并作为噪声点(如图3所示)。在第二阶段,将查询集的特征向量(如图3所示为目标点)分别添加到第一阶段修剪后的每个类别的剩余特征向量中。通过对这些特征向量进行平均,得到新的原型。然后,计算支持集中的特征向量与新原型之间的距离,并按一定比例(10%)再次修剪与所有新原型相距较远的特征向量。来自支持集的剩余数据被用来构建用于分类查询集的最终原型。查询集中的数据保持不变,只参与原型的校准。
图3 跨数据集分类中原型校准策略的工作流程
另外,本文通过在三个国际公开数据集UC dataset、UNM dataset和Iowa dataset上进行实验,来验证所提出的MCPNet模型在数据集内和跨数据集的跨主题PD检测性能。同时,我们将实验结果与几种最先进的方法进行了比较,结果均显示我们模型的优越性。
表1实验结果显示,MCPNet模型在三个数据集上的五组实验中均显示出优异的PD检测性能。在所有实验中,HC和PD(包括ON和OFF状态)的分类准确率、灵敏度、特异性和AUC均在80%以上或接近80%。值得注意的是,在UNM数据集的HC与PDOFF分类中,其准确率为92.5%,灵敏度为93.1%,特异性为91.9%,AUC值为92.4%,表现出最佳性能。
表1 MCPNet在三个数据集上PD与HC分类的性能(%)
此外,本文还对提出的方法与其他基于LOSO交叉验证的最新方法的进行性能比较,结果表明,与这些研究相比,尽管由于预处理方法和特征的差异,我们的结果未能在数据集中实现PD患者和HC之间的最高分类精度,但仍在可比较的范围内。特别值得注意的是,我们的模型在数据集上显示出优越的PD检测精度,超过了当前的方法。
表2 本文提出的方法与其他基于LOSO交叉验证的最新方法的性能比较(%)
综上,本文提出的MCPNet模型在PD检测研究取得了很好的研究结果,所提出的MCPNet模型对PD和HC具有优越的分类性能。据我们所知,之前的大多数研究都是在单个数据集上进行验证的,本文对模型进行了多次跨数据集泛化验证,这在当前PD检测研究领域并不常见。同时,我们提出的方法仅使用2-3分钟的脑电静息状态数据就能获得稳定且足够准确的结果,有望在未来的实际应用中实现实时可靠的PD辅助检测。
结论
本研究提出了一种新的基于脑电图的PD自动检测模型MCPNet,该模型集成了多尺度卷积神经网络和原型学习,并引入了原型校准策略。这些方法共同提高了模型对PD患者和hc的跨学科分类性能。为了证明所提出模型的优越性,我们使用LOSO方法在三个不同的EEG数据集上进行了多次数据集内和跨数据集实验,并使用各种评估指标来验证结果。我们的模型在数据集中的跨主题分类中达到了最高的准确率、灵敏度、特异性和AUC,分别为92.5%、93.1%、91.6%和92.4%。与其他先进方法的对比分析也证实了我们模型的优越性。在跨数据集分类中,由于数据集的变化,模型的性能会有所减弱,但我们发现这种减弱可以通过引入原型校准策略来部分补偿。引入原型校准策略后,跨数据集分类准确率提高到90.2%,比不使用原型校准策略提高了4.0%。研究结果表明,该模型可能是一种有前途的PD自动检测工具。
撰稿人:李建平
审稿人:邱丽娜