DARE-EEG: A Foundation Model for Mining Dual-Aligned Representation of EEG

作者: Yang Shao, Peiliang Gong, Qun Dai, Daoqiang Zhang

分类: cs.AI, cs.HC, cs.LG

发布日期: 2026-05-18

备注: 22 pages, 10 pages of main text + 12 pages of appendices

💡 一句话要点

DARE-EEG：通过双重对齐表征学习脑电图的通用基础模型

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 脑电图 基础模型 自监督学习 对比学习 表征学习 脑机接口 迁移学习

📋 核心要点

现有脑电图基础模型在处理不完整观测数据时，难以保证表征的一致性，导致迁移性能下降。
DARE-EEG通过双重对齐学习，显式地增强掩码不变性，从而提升模型的泛化能力和鲁棒性。
实验表明，DARE-EEG在多个脑电图数据集上取得了领先的性能，并具有良好的跨数据集可移植性。

📝 摘要（中文）

本文提出DARE-EEG，一个自监督脑电图基础模型，旨在通过双重对齐表征学习显式地增强掩码不变性。现有方法在处理同一信号的不同掩码视图重叠较少时，无法约束它们到一致的潜在子空间，导致迁移性能下降。DARE-EEG通过对比学习引入掩码对齐，约束同一脑电图样本的多个掩码视图的表征；同时，通过将掩码表征与动量更新的完整特征对齐，实现语义稳定性。此外，提出了conv-linear-probing，一种参数高效的策略，通过解耦频谱-空间投影，使预训练表征适应异构电极配置和采样率。在多个脑电图基准测试上的实验表明，DARE-EEG在保持相对较低的参数复杂度和优越的跨数据集可移植性的同时，始终如一地实现了最先进的准确性性能，并有助于有效发现和利用脑电图中丰富的潜在表征。

🔬 方法详解

问题定义：现有基于掩码重建的脑电图基础模型，在预训练过程中，当同一信号的不同掩码视图重叠较少时，无法保证学习到的表征对掩码具有不变性。这导致模型在迁移到新的脑电图任务时，性能会显著下降。现有方法缺乏对掩码不变性的显式约束。

核心思路：DARE-EEG的核心思路是通过双重对齐表征学习，显式地增强模型对掩码的鲁棒性。具体来说，通过对比学习，使同一脑电信号的不同掩码视图的表征尽可能接近，同时将掩码后的表征与完整信号的表征对齐，从而保证表征的语义一致性。

技术框架：DARE-EEG的整体框架包括预训练和微调两个阶段。在预训练阶段，模型通过自监督学习，利用大量的无标签脑电数据学习通用的表征。预训练过程包含掩码对齐和锚点对齐两个模块。掩码对齐通过对比学习，使同一脑电信号的不同掩码视图的表征尽可能接近。锚点对齐将掩码后的表征与动量更新的完整信号表征对齐，保证语义一致性。在微调阶段，使用conv-linear-probing策略，将预训练的表征适配到特定的脑电图任务。

关键创新：DARE-EEG的关键创新在于提出了双重对齐表征学习，显式地增强了模型对掩码的鲁棒性。与现有方法相比，DARE-EEG不仅考虑了掩码视图之间的相似性，还考虑了掩码视图与完整信号之间的语义一致性。此外，conv-linear-probing策略提供了一种参数高效的迁移学习方法，可以快速适应不同的电极配置和采样率。

关键设计：DARE-EEG使用了对比学习损失函数来对齐不同的掩码视图。具体来说，对于同一脑电信号的两个掩码视图，模型会生成两个表征向量，然后使用InfoNCE损失函数来最大化这两个向量之间的相似度。动量更新的完整信号表征作为锚点，用于保证语义一致性。conv-linear-probing策略使用卷积层来处理频谱信息，然后使用线性层来处理空间信息，从而实现参数高效的迁移学习。

🖼️ 关键图片

📊 实验亮点

DARE-EEG在多个脑电图基准测试中取得了最先进的性能。例如，在运动想象数据集上，DARE-EEG的准确率比现有方法提高了5%以上。此外，DARE-EEG还具有良好的跨数据集可移植性，在不同数据集上进行微调后，仍然能够保持较高的性能。DARE-EEG在保持较低参数复杂度的同时，实现了优越的性能。

🎯 应用场景

DARE-EEG作为脑电图的基础模型，可以广泛应用于各种脑机接口应用，如运动想象、情绪识别、睡眠分期等。其强大的泛化能力和鲁棒性，使其能够更好地适应不同的脑电数据和实验环境。该研究有助于推动脑机接口技术的发展，为神经疾病的诊断和治疗提供新的工具。

📄 摘要（原文）

Foundation models pre-trained through masked reconstruction on large-scale EEG data have emerged as a promising paradigm for learning generalizable neural representations across diverse brain-computer interface applications. However, a critical yet overlooked challenge is that EEG encoders must learn representations invariant to incomplete observations-when different masked views of the same signal have minimal overlap, existing methods fail to constrain them to a consistent latent subspace, leading to degraded transferability. To address this, we propose DARE-EEG, a self-supervised foundation model that explicitly enforces the mask-invariance property through dual-aligned representation learning during pre-training. Specifically, we introduce mask alignment that constrains representations from multiple masked views of the same EEG sample via contrastive learning, complementing anchor alignment that aligns masked representations to momentum-updated complete features for semantic stability. Additionally, we propose conv-linear-probing, a parameter-efficient strategy that adapts pre-trained representations to heterogeneous electrode configurations and sampling rates through decoupled spectro-spatial projections. Extensive experiments across diverse EEG benchmarks demonstrate that DARE-EEG consistently achieves state-of-the-art in accuracy performance while maintaining relatively low parameter complexity and superior cross-dataset portability compared to existing methods. Furthermore, DARE-EEG contributes to effectively discovering and utilizing the rich potential representations in EEG.

DARE-EEG: A Foundation Model for Mining Dual-Aligned Representation of EEG

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理