SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG
作者: Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton
分类: cs.LG
发布日期: 2026-03-10
备注: Code is available at https://github.com/fregu856/SignalMC-MED
💡 一句话要点
SignalMC-MED:用于评估生物信号基础模型的心电与光电容积脉搏波多模态基准
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生物信号 基础模型 心电图 光电容积脉搏波 多模态融合 临床预测 基准数据集
📋 核心要点
- 现有生物信号基础模型缺乏在长时程多模态数据上的系统评估,阻碍了其临床应用。
- SignalMC-MED基准提供同步ECG和PPG数据,包含多种临床预测任务,用于评估生物信号基础模型。
- 实验表明,领域特定模型优于通用模型,多模态融合提升性能,且长时程信号更有效。
📝 摘要(中文)
本文提出了SignalMC-MED,一个用于评估生物信号基础模型(FMs)在同步单导联心电图(ECG)和光电容积脉搏波(PPG)数据上的性能的基准。该基准基于MC-MED数据集,包含22256次就诊,每次就诊都有10分钟的重叠ECG和PPG信号。SignalMC-MED包含20个临床相关任务,涵盖人口统计学预测、急诊科处置、实验室数值回归以及既往ICD-10诊断的检测。通过该基准,作者对代表性的时间序列和生物信号FMs在仅ECG、仅PPG和ECG+PPG设置下进行了系统评估。结果表明,领域特定的生物信号FMs始终优于通用时间序列模型,并且多模态ECG+PPG融合比单模态输入产生更强的性能提升。此外,使用完整的10分钟信号始终优于较短的片段,并且较大的模型变体并没有可靠地优于较小的模型。手工设计的ECG领域特征提供了一个强大的基线,并且在与学习到的FM表示相结合时提供了互补价值。这些结果将SignalMC-MED确立为一个标准化的基准,并为评估和部署生物信号FMs提供了实践指导。
🔬 方法详解
问题定义:现有生物信号基础模型在长时程多模态数据上的评估不足,缺乏标准化的评估基准,难以有效比较不同模型的性能,阻碍了其在临床实践中的应用。现有方法难以充分利用多模态生物信号的互补信息,且对信号长度的依赖性尚不明确。
核心思路:本文的核心思路是构建一个标准化的、包含长时程同步ECG和PPG信号的基准数据集SignalMC-MED,并设计一系列临床相关的预测任务,用于系统地评估不同生物信号基础模型的性能。通过比较不同模型在单模态和多模态输入下的表现,以及不同信号长度的影响,为生物信号基础模型的选择和优化提供指导。
技术框架:SignalMC-MED基准的整体框架包括数据收集与预处理、任务定义与划分、模型选择与训练、以及性能评估与比较等几个主要阶段。首先,从MC-MED数据集中提取同步的单导联ECG和PPG信号,并进行预处理。然后,定义了20个临床相关的预测任务,包括人口统计学预测、急诊科处置、实验室数值回归以及既往ICD-10诊断的检测。接着,选择代表性的时间序列和生物信号基础模型,并在SignalMC-MED基准上进行训练和评估。最后,比较不同模型在不同任务上的性能,并分析多模态融合和信号长度的影响。
关键创新:该论文的关键创新在于构建了一个标准化的、包含长时程同步ECG和PPG信号的多模态生物信号基准数据集SignalMC-MED。该基准不仅提供了丰富的数据资源,还定义了一系列临床相关的预测任务,为生物信号基础模型的评估和比较提供了一个统一的平台。此外,该研究还系统地评估了不同模型在单模态和多模态输入下的表现,以及不同信号长度的影响,为生物信号基础模型的选择和优化提供了重要的实践指导。
关键设计:SignalMC-MED基准的关键设计包括:1) 选取MC-MED数据集中同步的单导联ECG和PPG信号,保证了数据的质量和一致性;2) 定义了20个临床相关的预测任务,涵盖了不同的临床应用场景;3) 选择了代表性的时间序列和生物信号基础模型,包括Transformer、ResNet等;4) 采用了常用的评估指标,如AUC、F1-score等,用于比较不同模型的性能;5) 实验中探索了不同信号长度(例如,使用完整的10分钟信号与使用较短的片段进行比较)对模型性能的影响。
📊 实验亮点
实验结果表明,领域特定的生物信号FMs始终优于通用时间序列模型,多模态ECG+PPG融合比单模态输入产生更强的性能提升。使用完整的10分钟信号始终优于较短的片段。手工设计的ECG领域特征与学习到的FM表示相结合时提供了互补价值。这些发现为生物信号基础模型的选择和优化提供了重要的实践指导。
🎯 应用场景
该研究成果可应用于开发更精准、更可靠的生物信号监测系统,辅助医生进行疾病诊断、风险评估和治疗方案制定。例如,可用于远程患者监护、智能可穿戴设备、以及临床决策支持系统等领域,提升医疗效率和患者预后。未来,该基准可促进生物信号基础模型的发展,推动人工智能在医疗健康领域的广泛应用。
📄 摘要(原文)
Recent biosignal foundation models (FMs) have demonstrated promising performance across diverse clinical prediction tasks, yet systematic evaluation on long-duration multimodal data remains limited. We introduce SignalMC-MED, a benchmark for evaluating biosignal FMs on synchronized single-lead electrocardiogram (ECG) and photoplethysmogram (PPG) data. Derived from the MC-MED dataset, SignalMC-MED comprises 22,256 visits with 10-minute overlapping ECG and PPG signals, and includes 20 clinically relevant tasks spanning prediction of demographics, emergency department disposition, laboratory value regression, and detection of prior ICD-10 diagnoses. Using this benchmark, we perform a systematic evaluation of representative time-series and biosignal FMs across ECG-only, PPG-only, and ECG + PPG settings. We find that domain-specific biosignal FMs consistently outperform general time-series models, and that multimodal ECG + PPG fusion yields robust improvements over unimodal inputs. Moreover, using the full 10-minute signal consistently outperforms shorter segments, and larger model variants do not reliably outperform smaller ones. Hand-crafted ECG domain features provide a strong baseline and offer complementary value when combined with learned FM representations. Together, these results establish SignalMC-MED as a standardized benchmark and provide practical guidance for evaluating and deploying biosignal FMs.