A Contrastive Learning Based Convolutional Neural Network for ERP Brain-Computer Interfaces
作者: Yuntian Cui, Xinke Shen, Dan Zhang, Chen Yang
分类: eess.SP, cs.LG, cs.RO
发布日期: 2024-07-02
备注: 5 pages, 2 figures, 2 tables
💡 一句话要点
提出基于对比学习的卷积神经网络,用于提升脑机接口中ERP信号的跨个体泛化能力。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)
关键词: 脑机接口 事件相关电位 对比学习 卷积神经网络 跨个体泛化
📋 核心要点
- 跨个体ERP信号检测面临信号复杂、信噪比低和个体差异大的挑战,严重影响脑机接口的可用性。
- 采用对比学习框架,通过最大化同类信号相似性,最小化个体差异,提取个体不变的ERP信号特征。
- 实验表明,该方法在P300数据集上取得了最佳AUC性能,并在拼写器解码任务中显著优于现有算法。
📝 摘要(中文)
本研究针对基于ERP的脑机接口中,由于ERP信号复杂、信噪比低和个体差异大导致的跨个体ERP信号检测难题,提出了一种基于对比学习的训练框架和一个Inception模块。该框架旨在提取ERP信号中与个体无关的成分,利用线性Inception模块和非线性投影器构建基础编码器,将原始数据投影到潜在空间。通过最大化不同目标下信号的相似性,最小化潜在空间中个体间的脑电信号差异。提取的时空特征用于ERP目标检测。在P300数据集的单次试验二分类任务中,该算法取得了最佳AUC性能,并在拼写器解码任务中显示出优于现有算法的显著优化。
🔬 方法详解
问题定义:论文旨在解决脑机接口中基于ERP的脑电信号检测所面临的跨个体泛化问题。现有的方法难以有效处理不同个体间ERP信号的差异性,导致模型在新的个体数据上表现不佳。这种个体差异源于生理结构、认知状态等多种因素,使得模型难以学习到通用的ERP信号特征。
核心思路:论文的核心思路是利用对比学习,将来自同一目标的不同个体的ERP信号在潜在空间中拉近,而将来自不同目标的信号推远。通过这种方式,模型能够学习到与个体无关、与目标相关的ERP信号特征,从而提高跨个体泛化能力。Inception模块用于提取多尺度时空特征,进一步增强特征的表达能力。
技术框架:整体框架包含三个主要模块:基础编码器、投影器和对比损失计算模块。基础编码器由卷积层和Inception模块组成,用于提取原始脑电信号的时空特征。投影器是一个非线性网络,将提取的特征映射到潜在空间。对比损失计算模块计算潜在空间中信号之间的相似度,并根据目标标签计算对比损失。训练过程中,模型通过最小化对比损失来学习个体不变的ERP信号特征。
关键创新:最重要的技术创新点在于将对比学习引入到ERP脑机接口领域,用于解决跨个体泛化问题。与传统的监督学习方法不同,对比学习能够更好地利用无标签数据,学习到更具鲁棒性的特征表示。Inception模块的引入也增强了模型提取多尺度时空特征的能力。
关键设计:基础编码器使用线性Inception模块提取多尺度时空特征。投影器使用非线性网络,增强特征的表达能力。对比损失函数采用InfoNCE损失,鼓励模型学习到信息量更大的特征表示。具体的参数设置(如卷积核大小、网络层数等)根据实验结果进行调整。
📊 实验亮点
实验结果表明,该方法在P300数据集上取得了最佳的AUC性能,超越了现有的算法。在拼写器解码任务中,该方法也显示出显著的优化效果。这些结果验证了该方法在提高跨个体ERP信号检测性能方面的有效性。
🎯 应用场景
该研究成果可应用于多种基于ERP的脑机接口系统,例如P300拼写器、指令控制等。通过提高跨个体泛化能力,可以减少脑机接口系统的校准时间,提高用户体验,并促进脑机接口技术在医疗康复、辅助生活等领域的应用。
📄 摘要(原文)
ERP-based EEG detection is gaining increasing attention in the field of brain-computer interfaces. However, due to the complexity of ERP signal components, their low signal-to-noise ratio, and significant inter-subject variability, cross-subject ERP signal detection has been challenging. The continuous advancement in deep learning has greatly contributed to addressing this issue. This brief proposes a contrastive learning training framework and an Inception module to extract multi-scale temporal and spatial features, representing the subject-invariant components of ERP signals. Specifically, a base encoder integrated with a linear Inception module and a nonlinear projector is used to project the raw data into latent space. By maximizing signal similarity under different targets, the inter-subject EEG signal differences in latent space are minimized. The extracted spatiotemporal features are then used for ERP target detection. The proposed algorithm achieved the best AUC performance in single-trial binary classification tasks on the P300 dataset and showed significant optimization in speller decoding tasks compared to existing algorithms.