Brain4FMs: A Benchmark of Foundation Models for Electrical Brain Signal

📄 arXiv: 2602.11558v1 📥 PDF

作者: Fanqi Shen, Enhong Yang, Jiahe Li, Junru Hong, Xiaoran Pan, Zhizhang Yuan, Meng Li, Yang Yang

分类: cs.LG

发布日期: 2026-02-12


💡 一句话要点

Brain4FMs:脑电信号基础模型评估基准,促进可扩展和可迁移学习。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 脑电信号 基础模型 自监督学习 评估基准 迁移学习

📋 核心要点

  1. 现有脑电信号基础模型缺乏统一的评估标准,阻碍了模型间的有效比较和性能提升。
  2. Brain4FMs通过构建开放评估平台,整合多种模型和数据集,实现标准化评估和分析。
  3. 该平台旨在指导更准确和可迁移的脑电信号基础模型开发,促进临床和神经技术应用。

📝 摘要(中文)

脑电信号基础模型(BFMs)通过实现神经信号的可扩展和可迁移学习,正在变革神经科学,从而推进临床诊断和前沿神经科学探索。它们的发展得益于大规模临床记录,特别是脑电图(EEG)和颅内脑电图,这些记录提供了丰富的大脑动态时空表示。然而,尽管它们迅速普及,但该领域缺乏对现有方法论的统一理解和标准化的评估框架。为了填补这一空白,我们沿着两个轴绘制了基准设计空间:(i)从模型角度,我们在自监督学习(SSL)分类下组织BFMs;(ii)从数据集角度,我们总结了常见的下游任务,并整理了临床和以人为中心的神经技术应用中具有代表性的公共数据集。在此基础上,我们推出了Brain4FMs,一个具有即插即用界面的开放评估平台,集成了15个代表性BFMs和18个公共数据集。它能够对预训练数据、SSL策略和架构如何影响泛化和下游性能进行标准化比较和分析,从而指导更准确和可迁移的BFMs。

🔬 方法详解

问题定义:现有脑电信号基础模型(BFMs)的研究缺乏统一的评估标准和方法论,难以有效比较不同模型之间的性能差异,阻碍了模型泛化能力和迁移能力的提升。现有方法在预训练数据选择、自监督学习策略以及模型架构设计方面存在多样性,但缺乏系统性的分析和指导。

核心思路:Brain4FMs的核心思路是构建一个开放的、标准化的评估平台,整合现有的BFMs和公共数据集,通过统一的评估流程,分析不同预训练数据、自监督学习策略和模型架构对下游任务性能的影响。该平台旨在为BFMs的研究提供客观的评估依据,指导更优模型的开发。

技术框架:Brain4FMs平台主要包含以下几个模块:1)模型集成模块:收集并整合了15个具有代表性的BFMs;2)数据集管理模块:整理了18个公共脑电信号数据集,涵盖临床和神经技术应用;3)评估流程模块:设计了标准化的评估流程,包括数据预处理、模型训练、性能评估等环节;4)结果分析模块:提供性能指标计算和可视化工具,用于分析不同因素对模型性能的影响。

关键创新:Brain4FMs的关键创新在于构建了一个开放的、标准化的脑电信号基础模型评估平台。该平台通过统一的评估流程,能够客观比较不同模型的性能,并分析预训练数据、自监督学习策略和模型架构对模型性能的影响。这有助于研究人员更好地理解BFMs的优势和局限性,并指导更优模型的开发。

关键设计:Brain4FMs平台采用了即插即用的接口设计,方便用户集成新的模型和数据集。评估流程中,采用了常用的脑电信号预处理方法,并提供了多种性能指标,如分类准确率、回归均方误差等。平台还提供了可视化工具,方便用户分析实验结果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

Brain4FMs平台集成了15个代表性BFMs和18个公共数据集,通过标准化评估流程,分析了预训练数据、自监督学习策略和模型架构对下游任务性能的影响。实验结果表明,不同的预训练策略和模型架构对不同下游任务的性能有显著影响,为BFMs的优化提供了重要指导。

🎯 应用场景

该研究成果可广泛应用于脑机接口、神经疾病诊断、认知状态监测等领域。通过Brain4FMs平台,研究人员可以更高效地开发和评估脑电信号基础模型,从而提升相关应用的性能和可靠性。未来,该平台有望成为脑电信号处理领域的重要基础设施,促进相关技术的创新和发展。

📄 摘要(原文)

Brain Foundation Models (BFMs) are transforming neuroscience by enabling scalable and transferable learning from neural signals, advancing both clinical diagnostics and cutting-edge neuroscience exploration. Their emergence is powered by large-scale clinical recordings, particularly electroencephalography (EEG) and intracranial EEG, which provide rich temporal and spatial representations of brain dynamics. However, despite their rapid proliferation, the field lacks a unified understanding of existing methodologies and a standardized evaluation framework. To fill this gap, we map the benchmark design space along two axes: (i) from the model perspective, we organize BFMs under a self-supervised learning (SSL) taxonomy; and (ii) from the dataset perspective, we summarize common downstream tasks and curate representative public datasets across clinical and human-centric neurotechnology applications. Building on this consolidation, we introduce Brain4FMs, an open evaluation platform with plug-and-play interfaces that integrates 15 representative BFMs and 18 public datasets. It enables standardized comparisons and analysis of how pretraining data, SSL strategies, and architectures affect generalization and downstream performance, guiding more accurate and transferable BFMs. The code is available at https://anonymous.4open.science/r/Brain4FMs-85B8.