团队4篇论文被CCF B类国际会议ICASSP 2025录用

2025年IEEE国际声学、语音与信号处理会议(IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2025)将于2025年4月6日至11日在印度海得拉巴隆重举行。作为IEEE信号处理学会的旗舰会议,ICASSP致力于推动声学、语音和信号处理领域的前沿研究与创新,并促进跨学科合作与交流。每年,该会议都会吸引全球顶尖学者和工程师汇聚一堂,是信号处理领域极具影响力的学术盛会之一,也被中国计算机学会列为权威学术会议(CCF B类)。在本次会议中,由潘家辉、梁艳、王斐等老师指导的团队成员郝岩、陈明辉、李卓蓉、郑泽昆,凭借出色的研究成果,成功投稿了4篇论文,且均以full paper形式被顺利录用。

论文1:

郝岩(2021级研究生)和梁艳老师研究成果《An End-to-End Graph-Guided Spatiotemporal Model for Adaptive Frame-Level Facial Affect Analysis in the Wild》的主要工作:

  1. 提出了一种具有节点编码器的端到端图引导时空卷积网络(graph-guided spatiotemporal convolutional network, GSTCN)用于帧级别的情感分析,利用图结构对人脸图像信息进行建模,并利用图卷积网络和时序卷积网络对表情序列的空间时序信息进行提取。如图1所示。
  2. 提出了一种基于轨迹振荡系数(trajectory oscillating coefficient, TOC)算法的自适应情感编码模型,帮助GSTCN自动选择最具代表性的运动区域作为视频序列中图结构的节点。
  3. 采用了一种新的帧级别损失函数,提高基于一致性相关系数(Concordance Correlation Coefficient, CCC)的模型在训练过程中的优化效果。

实验结果表明,该方法优于最先进的方法。此外,所提出的方法在端到端的愉悦度-唤醒度(valence-arousal, VA)估计方面的有效性也得到了可视化。

图1 GSTCN模型结构图

论文2:

陈明辉(2023级研究生)和潘家辉教授的研究成果《Meta-MMD Fusion: Enhancing Cross-Subject Motor Imagery Classification》主要贡献如下:

  1. 提出META-MMD方法:该研究提出了一种新的跨受试者运动想象分类方法META-MMD。该方法通过最大均值差异(MMD)度量,利用元梯度更新最小化支持集和查询集之间的分布差异,从而有效提升分类性能。
  2. 创新元学习训练策略:研究设计了一种结合留一法交叉验证(LOOCV)的元学习训练策略。通过构建多个元任务,每次将一个样本作为查询集,其余样本作为支持集进行循环迭代,从而增强模型的鲁棒性和泛化能力。这一策略有效解决了数据有限的问题,并显著提升了模型对未见受试者的适应能力。
  3. 实现SOTA性能:META-MMD方法通过结合元学习和MMD技术,实现了跨受试者运动想象分类的SOTA性能。该方法能够全面学习和对齐不同受试者之间的特征,展现了其在不同受试者间的广泛适应性及特征的有效性。

图2 Meta-MMD结构图

论文3:

李卓蓉(2022级研究生)和王斐副教授研究成果《DARN: An Attention-Based Neural Network Using Residual Blocks for Sleep Micro-Events Detection》的主要工作:

1. 基于卷积神经网络,结合注意力机制与双向长短期记忆单元来提取时间特征,有效地捕获了时间序列中的长距离依赖关系,提高检测的性能和模型的鲁棒性。

2. 引入残差模块,促进更深层次网络的训练。该方法解决了梯度消失和网络退化等常见问题,从而提升检测精度,使得模型更加准确地识别潜在的睡眠特征波。

3. 研究的方法用于检测不同的睡眠特征波,包括睡眠纺锤波和K复合波,验证方法的泛化能力以及不同场景和数据分布下的稳健性。

图3 DARN模型结构图

论文4:

郑泽昆(2023级研究生)和王斐副教授研究成果《EfficientSleepNet: A Novel Lightweight End-to-End Model for Automated Sleep Staging on Single-Channel EEG》的主要工作:

  1. 提出了一种名为EfficientSleepNet的单通道自动睡眠分期方法。该方法在显著降低了参数量和计算复杂度的同时,仍具有较好的性能,且具有应用于实时睡眠监测的潜力,如图4所示。
  2. 提出了一种新颖的多历元输入自动睡眠分期模型,将当前历元与前四个单历元模型的输出结合,作为多历元模型的输入。该方法能够有效捕捉历元之间的时间依赖关系,同时避免依赖未来数据,从而显著提升模型的实时性能。
  3. 提出了一种新的卷积特征提取方法,该方法结合了分组卷积、通道重排(channel shuffling)和膨胀卷积,以降低模型复杂度并扩展感受野,从而捕获更全面的特征信息。

fig.1

图4 EfficientSleepNet模型结构图


登录用户可以查看和发表评论, 请前往  登录 或  注册
SCHOLAT.com 学者网
免责声明 | 关于我们 | 用户反馈
联系我们: