The Identity Trap in EEG Foundation Models: A Diagnostic Audit
作者: Jun-You Lin, Ying Choon Wu, Tzyy-Ping Jung
分类: cs.LG, q-bio.NC
发布日期: 2026-06-04
备注: 28 pages, 6 figures, 8 tables. Code available at https://github.com/Jimmy110101013/fmscope
💡 一句话要点
提出FMScope以解决EEG基础模型中的身份陷阱问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: EEG基础模型 身份陷阱 生物标志物 FMScope 神经科学 临床应用 模型解码 学习捷径
📋 核心要点
- 现有EEG基础模型在临床静息态EEG上表现出高准确率,但其准确性可能源于身份特征而非生物标志物。
- 提出FMScope协议,通过五种诊断方法在表示层面上识别身份陷阱,旨在提高模型的生物标志物解码能力。
- 实验结果显示,去除身份相关特征可使标签解码性能提升6至27个百分点,验证了身份陷阱的普遍性和可移除性。
📝 摘要(中文)
本研究旨在诊断EEG基础模型中的身份陷阱现象,探讨高准确率是否源于真实的临床生物标志物或与受试者身份相关的特征。我们提出FMScope,一个冻结表示协议,包含五种诊断方法,并应用于三种预训练模型和四个数据集。研究结果表明,身份陷阱普遍存在,且通过去除身份相关特征可显著提高标签解码性能,揭示了EEG模型中的学习捷径现象。
🔬 方法详解
问题定义:本研究解决EEG基础模型中身份陷阱的问题,即高准确率可能源于受试者身份特征而非真实的生物标志物。现有方法未能有效区分这两者,导致结果的歧义性。
核心思路:论文提出FMScope协议,旨在通过冻结表示层面进行诊断,识别和去除与身份相关的特征,从而提高模型对生物标志物的解码能力。
技术框架:FMScope包含五个主要模块:方差分解、受试者轴擦除、非周期1/f剥离、层级标签探测和受试者内方向一致性。该框架通过对预训练模型进行分析,评估身份特征对标签解码的影响。
关键创新:最重要的创新在于识别和量化身份陷阱的存在,并提出去除身份相关特征的具体方法,显著提高模型的解码性能。这一方法与传统的模型评估方法本质上不同,强调了生理特征的影响。
关键设计:在实验中,采用了多种数据集和预训练模型,特别关注于去除身份特征后的性能提升,具体参数设置和损失函数设计未在摘要中详细说明,需参考原文获取更多细节。
🖼️ 关键图片
📊 实验亮点
实验结果显示,身份陷阱在12对模型中普遍存在,去除身份相关特征后,标签解码性能提升6至27个百分点。特别是在细胞层面,去除身份特征后,解码性能提升幅度达到12个百分点,验证了FMScope的有效性。
🎯 应用场景
该研究的潜在应用领域包括临床EEG分析、神经科学研究以及脑机接口技术。通过提高EEG模型的解码能力,能够更准确地识别和分析脑电活动,为临床诊断和治疗提供更可靠的工具,未来可能推动个性化医疗的发展。
📄 摘要(原文)
Objective. EEG foundation models (FMs) report strong accuracy on clinical resting-state EEG. However, high accuracy under subject-disjoint cross-validation remains ambiguous: it can reflect a genuine clinical biomarker, or subject-identity features that correlate with the label. We name this the Identity Trap and ask whether it can be diagnosed at the representation level before fine-tuning. Approach. We propose FMScope, a frozen-representation protocol packaging five diagnostics: variance decomposition, subject-axis erasure, aperiodic 1/f ablation, layer-wise label probing, and within-subject direction consistency. We apply it to three pretrained FMs (LaBraM, CBraMod, REVE) across four datasets in a 2x2 layout: subject relation of label x presence of a consensus cross-subject EEG marker. Main results. (i) The Identity Trap is universal: frozen subject-variance is 13-89x a random null in 12/12 pairs, rising in all 12 under fine-tuning (+10 to +63 pp). This dominance is a removable linear axis: erasing it improves label decoding where the label varies within subject (+6 to +12 pp in primary cells; +4 to +27 pp across external cohorts). (ii) Aperiodic 1/f is one subject carrier: removing it drops the subject probe by 9-19 pp on LaBraM and CBraMod. REVE saturates subject identity without measurable aperiodic dependence. (iii) Fine-tuning amplifies label-variance only in cells with a literature-established cross-subject marker. Significance. The Identity Trap is a physically-grounded instance of shortcut learning: the preferred cue has a measurable physiological component, and subject-disjoint splitting alone cannot rule it out. FMScope separates gains reflecting a biological marker from those reflecting subject identity.