Cortical-SSM: A Deep State Space Model for EEG and ECoG Motor Imagery Decoding
作者: Shuntaro Suzuki, Shunya Nagashima, Masayuki Hirata, Komei Sugiura
分类: cs.CV, cs.AI
发布日期: 2025-10-17
💡 一句话要点
提出Cortical-SSM,利用深度状态空间模型解码脑电和皮层脑电运动想象信号
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 脑电信号 皮层脑电信号 运动想象 深度状态空间模型 脑机接口 时间序列建模 生理伪影
📋 核心要点
- 现有基于Transformer的方法难以捕捉脑电和皮层脑电信号中细粒度的时空频域依赖关系,影响运动想象解码的准确性。
- 提出Cortical-SSM,扩展深度状态空间模型,旨在捕捉脑电和皮层脑电信号在时间、空间和频率域上的综合依赖关系。
- 在三个基准数据集上验证,包括大规模公开脑电数据集和临床皮层脑电数据集,均优于现有基线方法,并能有效捕捉神经生理相关区域。
📝 摘要(中文)
运动想象(MI)期间获得的脑电图(EEG)和皮层脑电图(ECoG)信号的分类具有巨大的应用潜力,包括为运动障碍患者提供通信辅助和康复支持。然而,这些信号容易受到生理伪影(如眨眼、吞咽)的影响,这带来了持续的挑战。虽然基于Transformer的脑电和皮层脑电信号分类方法已被广泛采用,但它们通常难以捕捉信号中细粒度的依赖关系。为了克服这些限制,我们提出了一种名为Cortical-SSM的新型架构,它扩展了深度状态空间模型,以捕捉脑电和皮层脑电信号在时间、空间和频率域上的综合依赖关系。我们在三个基准数据集上验证了我们的方法:1) 包含超过50个受试者的两个大型公共MI脑电数据集,以及2) 从肌萎缩侧索硬化症患者记录的临床MI皮层脑电数据集。我们的方法在三个基准数据集上均优于基线方法。此外,从我们的模型中导出的可视化解释表明,它可以有效地捕捉脑电和皮层脑电信号中与神经生理学相关的区域。
🔬 方法详解
问题定义:论文旨在解决运动想象脑电(EEG)和皮层脑电(ECoG)信号解码问题,现有基于Transformer的方法难以有效捕捉信号在时间、空间和频率域上的细粒度依赖关系,导致解码精度受限,且易受生理伪影影响。
核心思路:核心思路是利用深度状态空间模型(Deep State Space Model, SSM)来建模脑电和皮层脑电信号的动态过程,从而捕捉信号在时间、空间和频率域上的综合依赖关系。SSM能够有效地建模时间序列数据,并具有较强的抗噪声能力,因此适合处理易受伪影影响的脑电信号。
技术框架:Cortical-SSM的整体架构基于深度状态空间模型,输入为脑电或皮层脑电信号,经过嵌入层处理后,输入到SSM层进行时序建模,最后通过分类器进行运动想象类别的预测。模型主要包含以下模块:嵌入层(将原始信号映射到高维空间)、SSM层(捕捉时序依赖关系)、分类器(预测运动想象类别)。
关键创新:关键创新在于将深度状态空间模型应用于脑电和皮层脑电信号的运动想象解码,并设计了专门的网络结构Cortical-SSM,以有效捕捉信号在时间、空间和频率域上的综合依赖关系。与传统的Transformer方法相比,Cortical-SSM更擅长建模时序数据,并具有更强的抗噪声能力。
关键设计:论文中可能涉及的关键设计包括:SSM层的具体结构(例如,选择哪种类型的SSM,如线性SSM或非线性SSM),嵌入层的设计(如何将原始信号映射到高维空间),损失函数的选择(例如,交叉熵损失函数),以及训练过程中的超参数设置等。具体参数设置和网络结构细节需要在论文原文中查找。
📊 实验亮点
Cortical-SSM在三个基准数据集上均优于基线方法,包括两个大规模公开脑电数据集和一个临床皮层脑电数据集。模型能够有效捕捉脑电和皮层脑电信号中与神经生理学相关的区域,这表明该模型具有较强的可解释性。具体的性能提升幅度需要在论文原文中查找。
🎯 应用场景
该研究成果可应用于运动障碍患者的通信辅助和康复支持系统,例如脑机接口(BCI)控制。通过解码患者的运动想象脑电信号,可以实现对外部设备的控制,帮助患者恢复运动功能或进行交流。此外,该技术还可用于神经科学研究,例如研究运动想象过程中大脑的活动模式。
📄 摘要(原文)
Classification of electroencephalogram (EEG) and electrocorticogram (ECoG) signals obtained during motor imagery (MI) has substantial application potential, including for communication assistance and rehabilitation support for patients with motor impairments. These signals remain inherently susceptible to physiological artifacts (e.g., eye blinking, swallowing), which pose persistent challenges. Although Transformer-based approaches for classifying EEG and ECoG signals have been widely adopted, they often struggle to capture fine-grained dependencies within them. To overcome these limitations, we propose Cortical-SSM, a novel architecture that extends deep state space models to capture integrated dependencies of EEG and ECoG signals across temporal, spatial, and frequency domains. We validated our method across three benchmarks: 1) two large-scale public MI EEG datasets containing more than 50 subjects, and 2) a clinical MI ECoG dataset recorded from a patient with amyotrophic lateral sclerosis. Our method outperformed baseline methods on the three benchmarks. Furthermore, visual explanations derived from our model indicate that it effectively captures neurophysiologically relevant regions of both EEG and ECoG signals.