DSAINet: An Efficient Dual-Scale Attentive Interaction Network for General EEG Decoding
作者: Zhiyuan Ma, Zeyuan Li, Zihao Qiu, Jinhao Li, Lingqin Meng, Xinche Zhang, Yixuan Liu, Xinke Shen, Sen Song
分类: cs.AI
发布日期: 2026-04-20
🔗 代码/项目: GITHUB
💡 一句话要点
提出DSAINet,用于解决通用脑电解码中跨任务泛化性差的问题。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 脑电解码 注意力机制 双尺度网络 通用性 脑机接口
📋 核心要点
- 现有脑电解码方法依赖于任务定制的架构设计,引入了任务特定的时间归纳偏置,导致跨任务泛化能力不足。
- DSAINet通过构建共享时空token表示,利用双尺度并行卷积分支建模时间动态,并通过注意力机制自适应地整合跨尺度的任务相关特征。
- 在十个公共数据集上的实验表明,DSAINet在严格的受试者独立评估下,显著优于13个基线方法,且参数量仅为77K。
📝 摘要(中文)
本文提出了一种高效的双尺度注意力交互网络DSAINet,用于通用脑电解码。针对非侵入式脑电(EEG)实际应用中,特定解码器在独立于受试者的设置下,跨不同任务的泛化能力有限的问题,DSAINet通过构建共享的时空token表示,并利用并行卷积分支在精细和粗略尺度上建模不同的时间动态。然后,通过分支内注意力自适应地细化表示,以强调显著的尺度特定模式,并通过分支间注意力整合跨尺度的任务相关特征,最后进行自适应token聚合,产生用于预测的紧凑表示。在十个公共数据集上的五个下游脑电解码任务的大量实验表明,在严格的独立于受试者的评估下,DSAINet始终优于13个代表性基线。值得注意的是,该性能是在跨数据集使用相同的架构超参数的情况下实现的。此外,DSAINet以大约77K个可训练参数实现了良好的准确性-效率权衡,并提供了可解释的神经生理学见解。代码已公开。
🔬 方法详解
问题定义:现有脑电解码方法在实际应用中,尤其是在非侵入式脑电(EEG)领域,面临着跨任务泛化性差的问题。这些方法通常针对特定任务设计,引入了任务特定的时间归纳偏置,导致模型难以适应新的任务,需要针对不同任务修改模型结构和超参数。
核心思路:DSAINet的核心思路是构建一个通用的、与任务无关的脑电解码框架,通过共享的时空token表示和双尺度注意力机制,自适应地学习不同任务中的时间动态。这种设计避免了对特定任务的依赖,提高了模型的泛化能力。
技术框架:DSAINet的整体架构包括以下几个主要模块:1) 时空Token表示:从原始脑电信号中提取共享的时空特征表示。2) 双尺度并行卷积分支:使用两个并行的卷积分支,分别在精细和粗略尺度上建模时间动态。3) 注意力机制:包括分支内注意力和分支间注意力,用于自适应地细化表示,并整合跨尺度的任务相关特征。4) Token聚合:将学习到的特征表示聚合为紧凑的向量,用于最终的预测。
关键创新:DSAINet的关键创新在于其双尺度注意力交互机制。通过并行的卷积分支,模型可以同时捕捉到不同时间尺度上的脑电信号特征。分支内注意力机制可以突出每个尺度上重要的特征模式,而分支间注意力机制则可以整合不同尺度上的互补信息。这种双重注意力机制使得模型能够更全面、更准确地理解脑电信号。
关键设计:DSAINet的关键设计包括:1) 使用深度可分离卷积来降低模型参数量。2) 使用自注意力机制来学习特征之间的关系。3) 设计了分支内和分支间两种注意力机制,以实现更精细的特征选择和融合。4) 采用自适应token聚合方法,将学习到的特征表示压缩为紧凑的向量表示,以提高模型的效率。
🖼️ 关键图片
📊 实验亮点
DSAINet在10个公共数据集上的5个脑电解码任务中,显著优于13个代表性基线方法。在严格的受试者独立评估下,DSAINet在跨数据集使用相同超参数的情况下,仍然取得了优异的性能。此外,DSAINet仅使用约77K个可训练参数,实现了良好的准确率-效率权衡。
🎯 应用场景
DSAINet具有广泛的应用前景,可用于构建通用的脑机接口系统,实现对不同脑电信号的解码和控制。例如,可以应用于运动想象、情绪识别、认知负荷评估等领域,为残疾人提供辅助工具,改善人类生活质量。此外,该研究也有助于深入理解脑电信号的神经生理机制。
📄 摘要(原文)
In real-world applications of noninvasive electroencephalography (EEG), specialized decoders often show limited generalizability across diverse tasks under subject-independent settings. One central challenge is that task-relevant EEG signals often follow different temporal organization patterns across tasks, while many existing methods rely on task-tailored architectural designs that introduce task-specific temporal inductive biases. This mismatch makes it difficult to adapt temporal modeling across tasks without changing the model configuration. To address these challenges, we propose DSAINet, an efficient dual-scale attentive interaction network for general EEG decoding. Specifically, DSAINet constructs shared spatiotemporal token representations from raw EEG signals and models diverse temporal dynamics through parallel convolutional branches at fine and coarse scales. The resulting representations are then adaptively refined by intra-branch attention to emphasize salient scale-specific patterns and by inter-branch attention to integrate task-relevant features across scales, followed by adaptive token aggregation to yield a compact representation for prediction. Extensive experiments on five downstream EEG decoding tasks across ten public datasets show that DSAINet consistently outperforms 13 representative baselines under strict subject-independent evaluation. Notably, this performance is achieved using the same architecture hyperparameters across datasets. Moreover, DSAINet achieves a favorable accuracy-efficiency trade-off with only about 77K trainable parameters and provides interpretable neurophysiological insights. The code is publicly available at https://github.com/zy0929/DSAINet.