第47届认知科学年度会议(Cognitive Science Society Annual Conference,简称 CogSci 2025)将于 2025 年 7 月 30 日至 8 月 2 日在美国旧金山的Marriott Marquis酒店隆重举行。CogSci是认知科学领域极具权威性和影响力的国际旗舰会议之一,同时也是CCF(中国计算机学会)和CAAI(中国人工智能学会)推荐的B类会议。在此次会议上,脑机交互与混合智能团队有4篇研究成果被录用,取得了丰硕成果。
1.基于先验提示的多模态步态抑郁症识别框架
2024级研究生徐昱涛在周成菊老师指导下,研究成果《Prior-Prompt-Based GCN for Depression Recognition Through Gait Observation》被录用为口头报告并进行全文发表,基于先验提示的图卷积网络(PP-GCN),通过融合骨架与文本多模态信息,显著提升了步态抑郁症检测的准确性。该研究首次将大型语言模型生成的先验知识与关节角度特征相结合,为解决传统方法难以捕捉抑郁症患者细微步态差异的难题提供了全新方案。主要贡献包括:
(1)传统基于步态的抑郁症检测方法依赖骨架坐标数据,但抑郁症患者的步态特征往往存在摆臂幅度减少、步速缓慢等细微差异,仅凭坐标信息难以精确捕捉,缺乏对先有医学先验知识的有效利用。该框架利用GPT-4生成针对不同身体部位的步态描述文本,将医学先验知识转化为可计算的文本特征。再通过骨架-文本特征对齐,强化模型对抑郁相关步态细节的敏感性,减少误判。
图1 基于生成动作提示模块(GAP)和角度特征提取模块(AFM)的PP-GCN网络框架图
(2)抑郁症患者的关节运动模式与健康人群存在显著统计学差异,但传统方法依赖的坐标数据难以直接表征这些特征。该框架通过角度特征提取模块(AFM),以手、肘、膝、足为锚点,计算其与相邻关节的余弦相似度,量化动作僵硬程度,将角度信息与坐标数据结合,提升模型对于关节处细微差异的捕捉能力。
(3)在D-Gait数据集上的实验结果表明,PP-GCN框架在抑郁症步态识别任务上超过了现有的基于骨架数据的单模态SOTA方法,取得了57.91%的F1-score。通过消融实验证明了选择ViT-L/14文本编码器效果最佳,单独使用生成动作提示模块(GAP)或角度特征提取模块(AFM)时,模型性能均有所下降,双模块协同使召回率提升至73.59%。这一成果为抑郁症的早期识别与公共场所隐蔽检测提供了技术支撑,仅需普通摄像头采集步态,避免传统脑电、眼动检测的设备依赖和患者抵触,结合心理量表评估结果,可辅助医生快速筛查高风险人群,缓解医疗资源压力。
2.基于多任务EEG和Agent Transformer的抑郁症筛查研究
2023 级研究生温奥君在黄海云老师指导下,研究成果《Advancing Adolescent Depression Detection through Multi-Task EEG Signals and Biosignal Learning》被录用为海报展示并进行全文发表。该研究提出了一种创新性的多任务框架,通过结合注意力任务和静息任务的脑电图(EEG)信号,利用Biosignal Learning和Agent Transformer(BLAT)模型实现了青少年抑郁症的高效检测。主要贡献包括:
(1)该研究通过创新的生物信号标记化模块,将多通道EEG信号转换为统一的“sentence”结构,并通过Agent Transformer高效处理这些复杂信号,显著提升了抑郁症检测的准确率。
图2 BLAT模型架构图
(2)实验涉及100名青少年参与者,包括50名抑郁症患者和50名健康对照组成员。通过BLAT模型对多任务EEG信号进行分类,在独立测试集上实现了85%的准确率,显著优于其他现有模型。
表1 不同模型的分类性能
(3)研究结果表明,多任务EEG信号的整合能够捕捉抑郁症患者与健康对照组之间的细微差异,为早期干预和个性化治疗提供了科学依据。这一成果为青少年抑郁症的早期筛查提供了新的技术路径,有望推动相关技术在医疗领域的广泛应用。
表2 不同任务组合的分类性能
3. 基于单通道EEG信号的波形感知自动睡眠分期模型
2023 级研究生郑泽昆在王斐副教授指导下,研究成果《DilatedSleepNet: A Novel EEG Waveform-Aware Model for Single-Channel Automatic Sleep Staging》被录用为海报展示并进行全文发表。该研究提出了一种新颖的多尺度膨胀卷积策略,能够有效捕捉脑电(EEG)信号中的波形特征,实现基于单通道 EEG 输入的精确睡眠阶段分类。主要贡献如下:
(1)该研究提出了一种基于单通道 EEG 信号的自动睡眠分期方法DilatedSleepNet,该方法在仅使用单通道数据的情况下表现出色。具体结构如下图所示:
图3 DilatedSleepNet的模型框架图
(2)我们引入了分层时间膨胀网络(Hierarchical Temporal Dilation Network)与多尺度时间膨胀集成模块(Multi-Scale Temporal Dilation Integrator),能够有效提取睡眠过程中关键的频率信息与频率转换特征。标准卷积和膨胀卷积的感受野区别如下图所示。
图4 标准卷积与空洞卷积感受野的对比分析
(3) 我们在三个公开数据集上系统评估了 DilatedSleepNet 的性能,如下表所示,模型在各数据集上分别达到了 86.8%、83.2% 和 85.4% 的分类准确率。实验结果表明,DilatedSleepNet 在多个数据集上展现出优越的泛化能力与鲁棒性,为睡眠相关疾病的诊断与研究提供了坚实的技术基础。
表3 DilatedSleepNet(本研究方法)与其他方法的对比分析
4. 基于多尺度卷积神经网络和对抗判别领域自适应的跨受试者P300脑电解码研究