本篇学习报告的内容来自《Developing a Novel Tactile P300 Brain-Computer Interface With a Cheeks-Stim Paradigm》,作者介绍了一种刺激位置位于脸颊的触觉P300脑机接口。这种脑机接口在未来可应用于高位截瘫尤其是颈部以下触觉功能受损的患者。
脑机接口(BCI)通过获取和分析用户的脑电数据,为用户提供了一种无需额外活动就可与外界交流的有效手段。近年来BCI迅速发展,在医疗康复领域得到了广泛应用。P300是一种事件相关电位,是一种出现于异常刺激后的300ms左右的正波。基于P300的范式已经得到了广泛研究,其刺激方式主要通过视觉,听觉或触觉来呈现。其中,由于视觉刺激的BCI需要用户的视觉注意力参与,因此不适用于许多眼球运动受损或是视力受损的患者。因此越来越多的研究人员开始研究基于听觉和触觉刺激的P300脑机接口。本文介绍的正是刺激位置位于脸颊的触觉P300脑机接口。这种脑机接口可应用于视觉或听觉受损,以及高位截瘫尤其是颈部以下触觉功能受损的患者。
本文通过与刺激位置位于手腕处的传统触觉刺激范式进行对比,来验证提出的脸颊位置的触觉刺激范式的可行性和有效性,两种范式仅目标刺激的位置不同,其他参数完全相同。
图(1) 两种范式的目标刺激位置
5个振动器分别放置于受试者的左右脸颊(或者左右手腕),腹部以及左右脚踝位置。如图1所示,目标刺激只会出现在左脸颊或是右脸颊(传统触觉刺激范式为左手腕或是右手腕),其他位置的刺激则作为标准刺激(即非目标刺激),以降低目标刺激出现的概率从而诱发幅度更大的P300反应。
图(2) 电极位置
如图2所示,实验根据国际10-20系统标准,采集了Fz、FC1、FC2、C3、Cz、C4、CP1、CP2、CP5、CP6、P3、Pz、P4、Oz14个电极位置的脑电。FPz和A分别作为接地电极和参考电极。带通滤波器设置在0.1-30Hz之间,陷波设置为50Hz,采样率为256Hz。
图(3) 实验过程
9位健康受试者需要进行离线训练和在线测试两个session的实验。其中离线训练阶段获得的脑电数据用于建立分类模型,在线测试阶段获得的脑电数据用于评估BCI范式的性能。图3展示了实验过程。每次trial前会有一个1.5s的目标刺激振动提示告知受试者目标刺激的位置。然后5个振动器会以随机顺序各振动1次,其中1个位置作为目标刺激,另外4个位置作为非目标刺激。受试者需要默数目标刺激的振动次数来将注意力放在目标刺激上。每个振动器的振动时间为200ms,振动之间间隔400ms,所有振动器的振动强度都相同。
将振动刺激后的前800ms数据进行分割。得到了750个数据片段,包括150个目标刺激和600个非目标刺激。然后用巴特沃斯滤波器对这些片段进行0.1~30Hz的带通滤波,并从256Hz降至36.6Hz进行降维。对每个通道的脑电数据进行了winsorized(即计算所有样本的第10和90个百分位数,然后将小于第10个百分位数和大于第90 个百分位数的样本分别替换为第10个或第90个百分位数),来防止眨眼或震源的振动干扰而造成的数据中的大幅度离群点。
采用贝叶斯线性判别分析(Bayesian linear discriminant analysis,BLDA)作为分类器来建立分类模型。在在线测试的每个trail中,将从五个刺激位置中获得五个特征向量输入到分类器中,计算它们属于目标类的概率分布。最后将概率分布最大的刺激位置作为分类结果。
对于离线实验数据,用事件相关电位(ERP)幅值和r²来表示两种范式中目标和非目标之间的ERP成分和特征差异。r²计算公式如下:
其中Xi表示每个类的特征,Ni表示每个类的样本数(i=1,2)。r²表示分析的事件相关电位成分为正,-r²表示分析的事件相关电位成分为负。同时也计算了9个被试者在离线实验中1-10次试验的平均离线分类准确率,单次试验的离线分类准确率,3个时间窗(1-300ms、251-450ms、451-800ms)的离线分类准确率,以及两个范式的单目标离线分类准确率。
在线试验数据里,主要考虑分类准确率、原始比特率(raw bit rate,RBR)以及每个受试者的平均试验次数。分类准确率和平均试验次数通过贝叶斯线性判别分析(BLDA)结合自适应方法获得。原始比率计算公式如下:
其中,P表示分类准确率,N表示每次trial中的目标种类数,M表示每分钟的命令数,M计算公式如下:
其中AVT是输出目标所需的平均trial数,T是完成一次trial所需的时间。在本实验中,N设置为2,T设置为3.0s(每次试验5次刺激,刺激呈现异步(Stimulus Onset Asynchrony,SOA,指从刺激呈现起到目标刺激呈现之间的时间,实验中SOA=开始时间+结束时间)为0.6s),plustime设为1.7s(目标呈现1.5s,目标呈现与第一次振动之间停顿0.2s)。
对数据进行配对样本t检验来研究数据之间的统计差异。
图(4) 9位受试者14个电极的总平均目标刺激ERPs
图(5) 9位受试者在0-1000ms的ERPs的r²平均值(a)手腕刺激范式(b)脸颊刺激范式
图4和图5分别展示了9为受试者在0-1000ms的14个电极的总平均目标刺激ERPs以及ERPs的r²平均值。可以观察到,脸颊刺激范式和手腕刺激范式在目标刺激的ERPs没有明显差异,但脸颊刺激范式的目标和非目标差异显著大于手腕刺激范式。
图(6) 9位受试者在1-10次trial中的平均离线分类准确率
图(7) 9位受试者两种范式的单次实验分类准确率
图6为9位受试者在1-10次trial中重叠的平均离线分类准确率。它是通过15次交叉验证计算出来的。显然,脸颊刺激范式相较于手腕刺激范式有着更高的离线平均分类准确率。图7显示了9位受试者在两个范式中的单次实验分类精度。这是根据15个blocks的所有单次实验(150次trials)的准确率计算平均值得到的。配对样本t检验结果显示脸颊刺激范式的单次实验准确率显著高于手腕刺激范式(t=3.141,p<0.05)。
图(8) 3个时间窗对离线分类准确率的贡献(a)手腕刺激范式(b)脸颊刺激范式
图(9) 9位受试者的单目标准确率(a)手腕刺激范式(b)脸颊刺激范式
图8显示了三个时间窗(1-300ms,251-450ms,451-800ms)对于两种范式的离线分类准确率的贡献。可以看出,不同时间窗对于不同受试者有不同的贡献。但总的来看,251-450ms时间窗对于分类准确率的贡献最大。经过配对样本t检验,两种范式只在251-450ms时间窗的贡献有显著性差异(t=2.973,p<0.05)。图9显示9位受试者在两种范式中的单目标分类精度。可以看出两种范式中,左侧刺激相较于右侧刺激有着更高的准确率,但根据配对样本t检验,两种范式中两边位置的刺激之间并无显著性差异,而对于两个范式来说,脸颊刺激范式的左边刺激和右边刺激的准确率都显著高于手腕刺激范式(左:t=3.386,p<0.05;右:t=2.423,p<0.05)。
表1显示了每个受试者在线测试性能数据。其中脸颊刺激范式的分类准确率和RBR显著高于手腕刺激范(t=4.264,p<0.05;t=3.124,p<0.05),而平均实验次数无显著性差异(t=−1.206,p>0.05)。
通过离线数据分析可以发现,两种范式的目标刺激ERP并没有显著差异,但脸颊刺激范式的目标与非目标之间的差异更加显著。同时脸颊刺激范式在离线测试中也获得了更高的平均分类准确率以及单次实验准确率。通过对时间窗贡献的分析可以看出,两种范式的延迟并没有显著差异。两种范式的单目标准确率也显示出刺激的左右位置并不会对准确率有显著性影响。
通过对比在线实验数据可以看出,脸颊刺激范式在分类准确率和信息传输率方面都显著高于传统的手腕刺激范式。验证了本文提出的刺激范式的可行性和有效性。
本文提出的范式相较于传统的手腕刺激触觉P300脑机接口有着更高的性能,验证了该触觉P300脑机接口的有效性,提出了一种可以应用于颈部以下触觉功能受损患者的触觉脑机接口的思路。
虽然相比于手腕刺激范式的触觉脑机接口有着更高的在线准确率,但相较于视觉脑机接口以及多模态脑机接口依然较低。且本实验的受试者较少且均为健康人,无法验证其在普遍人群或是病人身上的可用性。
[1] J. Jin et al., "Developing a Novel Tactile P300 Brain-Computer Interface With a Cheeks-Stim Paradigm" J. IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING., vol. 67, NO. 9, Sep.2020.
撰稿人:张嘉俊
指导老师:王斐