DARE-EEG: A Foundation Model for Mining Dual-Aligned Representation of EEG
作者: Yang Shao, Peiliang Gong, Qun Dai, Daoqiang Zhang
分类: cs.AI, cs.HC, cs.LG
发布日期: 2026-05-18
备注: 22 pages, 10 pages of main text + 12 pages of appendices
💡 一句话要点
DARE-EEG:通过双重对齐表征学习脑电图的通用基础模型
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 脑电图 基础模型 自监督学习 对比学习 表征学习 脑机接口 迁移学习
📋 核心要点
- 现有脑电图基础模型在处理不完整观测数据时,难以保证表征的一致性,导致迁移性能下降。
- DARE-EEG通过双重对齐学习,显式地增强掩码不变性,从而提升模型的泛化能力和鲁棒性。
- 实验表明,DARE-EEG在多个脑电图数据集上取得了领先的性能,并具有良好的跨数据集可移植性。
📝 摘要(中文)
本文提出DARE-EEG,一个自监督脑电图基础模型,旨在通过双重对齐表征学习显式地增强掩码不变性。现有方法在处理同一信号的不同掩码视图重叠较少时,无法约束它们到一致的潜在子空间,导致迁移性能下降。DARE-EEG通过对比学习引入掩码对齐,约束同一脑电图样本的多个掩码视图的表征;同时,通过将掩码表征与动量更新的完整特征对齐,实现语义稳定性。此外,提出了conv-linear-probing,一种参数高效的策略,通过解耦频谱-空间投影,使预训练表征适应异构电极配置和采样率。在多个脑电图基准测试上的实验表明,DARE-EEG在保持相对较低的参数复杂度和优越的跨数据集可移植性的同时,始终如一地实现了最先进的准确性性能,并有助于有效发现和利用脑电图中丰富的潜在表征。
🔬 方法详解
问题定义:现有基于掩码重建的脑电图基础模型,在预训练过程中,当同一信号的不同掩码视图重叠较少时,无法保证学习到的表征对掩码具有不变性。这导致模型在迁移到新的脑电图任务时,性能会显著下降。现有方法缺乏对掩码不变性的显式约束。
核心思路:DARE-EEG的核心思路是通过双重对齐表征学习,显式地增强模型对掩码的鲁棒性。具体来说,通过对比学习,使同一脑电信号的不同掩码视图的表征尽可能接近,同时将掩码后的表征与完整信号的表征对齐,从而保证表征的语义一致性。
技术框架:DARE-EEG的整体框架包括预训练和微调两个阶段。在预训练阶段,模型通过自监督学习,利用大量的无标签脑电数据学习通用的表征。预训练过程包含掩码对齐和锚点对齐两个模块。掩码对齐通过对比学习,使同一脑电信号的不同掩码视图的表征尽可能接近。锚点对齐将掩码后的表征与动量更新的完整信号表征对齐,保证语义一致性。在微调阶段,使用conv-linear-probing策略,将预训练的表征适配到特定的脑电图任务。
关键创新:DARE-EEG的关键创新在于提出了双重对齐表征学习,显式地增强了模型对掩码的鲁棒性。与现有方法相比,DARE-EEG不仅考虑了掩码视图之间的相似性,还考虑了掩码视图与完整信号之间的语义一致性。此外,conv-linear-probing策略提供了一种参数高效的迁移学习方法,可以快速适应不同的电极配置和采样率。
关键设计:DARE-EEG使用了对比学习损失函数来对齐不同的掩码视图。具体来说,对于同一脑电信号的两个掩码视图,模型会生成两个表征向量,然后使用InfoNCE损失函数来最大化这两个向量之间的相似度。动量更新的完整信号表征作为锚点,用于保证语义一致性。conv-linear-probing策略使用卷积层来处理频谱信息,然后使用线性层来处理空间信息,从而实现参数高效的迁移学习。
🖼️ 关键图片
📊 实验亮点
DARE-EEG在多个脑电图基准测试中取得了最先进的性能。例如,在运动想象数据集上,DARE-EEG的准确率比现有方法提高了5%以上。此外,DARE-EEG还具有良好的跨数据集可移植性,在不同数据集上进行微调后,仍然能够保持较高的性能。DARE-EEG在保持较低参数复杂度的同时,实现了优越的性能。
🎯 应用场景
DARE-EEG作为脑电图的基础模型,可以广泛应用于各种脑机接口应用,如运动想象、情绪识别、睡眠分期等。其强大的泛化能力和鲁棒性,使其能够更好地适应不同的脑电数据和实验环境。该研究有助于推动脑机接口技术的发展,为神经疾病的诊断和治疗提供新的工具。
📄 摘要(原文)
Foundation models pre-trained through masked reconstruction on large-scale EEG data have emerged as a promising paradigm for learning generalizable neural representations across diverse brain-computer interface applications. However, a critical yet overlooked challenge is that EEG encoders must learn representations invariant to incomplete observations-when different masked views of the same signal have minimal overlap, existing methods fail to constrain them to a consistent latent subspace, leading to degraded transferability. To address this, we propose DARE-EEG, a self-supervised foundation model that explicitly enforces the mask-invariance property through dual-aligned representation learning during pre-training. Specifically, we introduce mask alignment that constrains representations from multiple masked views of the same EEG sample via contrastive learning, complementing anchor alignment that aligns masked representations to momentum-updated complete features for semantic stability. Additionally, we propose conv-linear-probing, a parameter-efficient strategy that adapts pre-trained representations to heterogeneous electrode configurations and sampling rates through decoupled spectro-spatial projections. Extensive experiments across diverse EEG benchmarks demonstrate that DARE-EEG consistently achieves state-of-the-art in accuracy performance while maintaining relatively low parameter complexity and superior cross-dataset portability compared to existing methods. Furthermore, DARE-EEG contributes to effectively discovering and utilizing the rich potential representations in EEG.