SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

作者: Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton

分类: cs.LG

发布日期: 2026-03-10

备注: Code is available at https://github.com/fregu856/SignalMC-MED

💡 一句话要点

SignalMC-MED：用于评估生物信号基础模型的心电与光电容积脉搏波多模态基准

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 生物信号 基础模型 心电图 光电容积脉搏波 多模态融合 临床预测 基准数据集

📋 核心要点

现有生物信号基础模型缺乏在长时程多模态数据上的系统评估，阻碍了其临床应用。
SignalMC-MED基准提供同步ECG和PPG数据，包含多种临床预测任务，用于评估生物信号基础模型。
实验表明，领域特定模型优于通用模型，多模态融合提升性能，且长时程信号更有效。

📝 摘要（中文）

本文提出了SignalMC-MED，一个用于评估生物信号基础模型（FMs）在同步单导联心电图（ECG）和光电容积脉搏波（PPG）数据上的性能的基准。该基准基于MC-MED数据集，包含22256次就诊，每次就诊都有10分钟的重叠ECG和PPG信号。SignalMC-MED包含20个临床相关任务，涵盖人口统计学预测、急诊科处置、实验室数值回归以及既往ICD-10诊断的检测。通过该基准，作者对代表性的时间序列和生物信号FMs在仅ECG、仅PPG和ECG+PPG设置下进行了系统评估。结果表明，领域特定的生物信号FMs始终优于通用时间序列模型，并且多模态ECG+PPG融合比单模态输入产生更强的性能提升。此外，使用完整的10分钟信号始终优于较短的片段，并且较大的模型变体并没有可靠地优于较小的模型。手工设计的ECG领域特征提供了一个强大的基线，并且在与学习到的FM表示相结合时提供了互补价值。这些结果将SignalMC-MED确立为一个标准化的基准，并为评估和部署生物信号FMs提供了实践指导。

🔬 方法详解

问题定义：现有生物信号基础模型在长时程多模态数据上的评估不足，缺乏标准化的评估基准，难以有效比较不同模型的性能，阻碍了其在临床实践中的应用。现有方法难以充分利用多模态生物信号的互补信息，且对信号长度的依赖性尚不明确。

核心思路：本文的核心思路是构建一个标准化的、包含长时程同步ECG和PPG信号的基准数据集SignalMC-MED，并设计一系列临床相关的预测任务，用于系统地评估不同生物信号基础模型的性能。通过比较不同模型在单模态和多模态输入下的表现，以及不同信号长度的影响，为生物信号基础模型的选择和优化提供指导。

技术框架：SignalMC-MED基准的整体框架包括数据收集与预处理、任务定义与划分、模型选择与训练、以及性能评估与比较等几个主要阶段。首先，从MC-MED数据集中提取同步的单导联ECG和PPG信号，并进行预处理。然后，定义了20个临床相关的预测任务，包括人口统计学预测、急诊科处置、实验室数值回归以及既往ICD-10诊断的检测。接着，选择代表性的时间序列和生物信号基础模型，并在SignalMC-MED基准上进行训练和评估。最后，比较不同模型在不同任务上的性能，并分析多模态融合和信号长度的影响。

关键创新：该论文的关键创新在于构建了一个标准化的、包含长时程同步ECG和PPG信号的多模态生物信号基准数据集SignalMC-MED。该基准不仅提供了丰富的数据资源，还定义了一系列临床相关的预测任务，为生物信号基础模型的评估和比较提供了一个统一的平台。此外，该研究还系统地评估了不同模型在单模态和多模态输入下的表现，以及不同信号长度的影响，为生物信号基础模型的选择和优化提供了重要的实践指导。

关键设计：SignalMC-MED基准的关键设计包括：1) 选取MC-MED数据集中同步的单导联ECG和PPG信号，保证了数据的质量和一致性；2) 定义了20个临床相关的预测任务，涵盖了不同的临床应用场景；3) 选择了代表性的时间序列和生物信号基础模型，包括Transformer、ResNet等；4) 采用了常用的评估指标，如AUC、F1-score等，用于比较不同模型的性能；5) 实验中探索了不同信号长度（例如，使用完整的10分钟信号与使用较短的片段进行比较）对模型性能的影响。

📊 实验亮点

实验结果表明，领域特定的生物信号FMs始终优于通用时间序列模型，多模态ECG+PPG融合比单模态输入产生更强的性能提升。使用完整的10分钟信号始终优于较短的片段。手工设计的ECG领域特征与学习到的FM表示相结合时提供了互补价值。这些发现为生物信号基础模型的选择和优化提供了重要的实践指导。

🎯 应用场景

该研究成果可应用于开发更精准、更可靠的生物信号监测系统，辅助医生进行疾病诊断、风险评估和治疗方案制定。例如，可用于远程患者监护、智能可穿戴设备、以及临床决策支持系统等领域，提升医疗效率和患者预后。未来，该基准可促进生物信号基础模型的发展，推动人工智能在医疗健康领域的广泛应用。

📄 摘要（原文）

Recent biosignal foundation models (FMs) have demonstrated promising performance across diverse clinical prediction tasks, yet systematic evaluation on long-duration multimodal data remains limited. We introduce SignalMC-MED, a benchmark for evaluating biosignal FMs on synchronized single-lead electrocardiogram (ECG) and photoplethysmogram (PPG) data. Derived from the MC-MED dataset, SignalMC-MED comprises 22,256 visits with 10-minute overlapping ECG and PPG signals, and includes 20 clinically relevant tasks spanning prediction of demographics, emergency department disposition, laboratory value regression, and detection of prior ICD-10 diagnoses. Using this benchmark, we perform a systematic evaluation of representative time-series and biosignal FMs across ECG-only, PPG-only, and ECG + PPG settings. We find that domain-specific biosignal FMs consistently outperform general time-series models, and that multimodal ECG + PPG fusion yields robust improvements over unimodal inputs. Moreover, using the full 10-minute signal consistently outperforms shorter segments, and larger model variants do not reliably outperform smaller ones. Hand-crafted ECG domain features provide a strong baseline and offer complementary value when combined with learned FM representations. Together, these results establish SignalMC-MED as a standardized benchmark and provide practical guidance for evaluating and deploying biosignal FMs.

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理