TolerantECG: A Foundation Model for Imperfect Electrocardiogram

📄 arXiv: 2507.09887v4 📥 PDF

作者: Huynh Dang Nguyen, Trong-Thang Pham, Ngan Le, Van Nguyen

分类: cs.LG, cs.AI, eess.SP

发布日期: 2025-07-14 (更新: 2025-10-06)

备注: Accepted at ACM MM 2025

DOI: 10.1145/3746027.3755287


💡 一句话要点

TolerantECG:一种对噪声和导联缺失具有鲁棒性的心电图(ECG)基础模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 心电图 基础模型 对比学习 自监督学习 噪声鲁棒性 导联缺失 心脏疾病诊断

📋 核心要点

  1. 现有ECG诊断方法易受噪声干扰,且对导联缺失敏感,导致诊断准确性下降。
  2. TolerantECG通过对比学习和自监督学习,学习鲁棒的ECG信号表示,并结合知识检索的文本报告。
  3. 实验表明,TolerantECG在噪声和导联缺失情况下,在PTB-XL和MIT-BIH数据集上均表现出色。

📝 摘要(中文)

心电图(ECG)是诊断心脏疾病的重要且有效的工具。然而,噪声或标准12导联记录中一个或多个导联的缺失会影响其有效性,导致诊断错误或不确定性。为了应对这些挑战,我们提出了TolerantECG,这是一个对噪声具有鲁棒性,并且能够使用标准12导联ECG的任意子集的心电信号基础模型。TolerantECG训练结合了对比学习和自监督学习框架,以联合学习ECG信号表示及其相应的基于知识检索的文本报告描述以及损坏或导联缺失的信号。全面的基准测试结果表明,在PTB-XL数据集中,TolerantECG在各种ECG信号条件和类别级别中始终排名第一或第二,并在MIT-BIH心律失常数据库上实现了最高的性能。

🔬 方法详解

问题定义:心电图(ECG)在临床诊断中至关重要,但实际应用中常受到噪声污染或部分导联缺失的影响,导致诊断准确率下降。现有方法难以有效处理这些问题,鲁棒性不足。

核心思路:TolerantECG的核心在于构建一个能够容忍噪声和导联缺失的ECG信号表示。通过对比学习,模型学习区分正常和异常ECG信号;通过自监督学习,模型学习从损坏或不完整的ECG信号中恢复信息。同时,结合知识检索的文本报告,增强模型对ECG信号的理解。

技术框架:TolerantECG的训练框架包含三个主要组成部分:ECG信号编码器、文本报告编码器和信号损坏/导联缺失模块。ECG信号编码器将ECG信号映射到潜在空间,文本报告编码器将文本报告映射到同一潜在空间。信号损坏/导联缺失模块模拟实际应用中可能遇到的噪声和导联缺失情况。模型通过对比学习和自监督学习,联合优化这三个模块。

关键创新:TolerantECG的关键创新在于其联合学习框架,它同时考虑了ECG信号的鲁棒表示学习、文本报告的知识融合以及对信号损坏和导联缺失的容忍性。与现有方法相比,TolerantECG能够更好地处理实际应用中遇到的各种挑战。

关键设计:在对比学习中,使用InfoNCE损失函数来最大化正样本对之间的相似性,并最小化负样本对之间的相似性。在自监督学习中,使用均方误差(MSE)损失函数来衡量模型重构损坏或缺失信号的能力。网络结构方面,ECG信号编码器和文本报告编码器均采用Transformer结构,以捕捉信号和文本中的长程依赖关系。具体的参数设置(如Transformer的层数、头数等)未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

TolerantECG在PTB-XL数据集上,针对各种ECG信号条件和类别级别,性能始终保持在前两名。在更具挑战性的MIT-BIH心律失常数据库上,TolerantECG取得了最佳性能,验证了其在实际应用中的有效性和鲁棒性。具体的性能提升幅度未知。

🎯 应用场景

TolerantECG可应用于远程医疗、移动健康监测等场景,即使在信号质量较差或导联不完整的情况下,也能提供可靠的心脏健康评估。该模型还有助于减少对专业医疗设备的依赖,降低医疗成本,并为心脏疾病的早期诊断和预防提供有力支持。未来,可进一步扩展到其他生理信号,构建更通用的医疗健康基础模型。

📄 摘要(原文)

The electrocardiogram (ECG) is an essential and effective tool for diagnosing heart diseases. However, its effectiveness can be compromised by noise or unavailability of one or more leads of the standard 12-lead recordings, resulting in diagnostic errors or uncertainty. To address these challenges, we propose TolerantECG, a foundation model for ECG signals that is robust to noise and capable of functioning with arbitrary subsets of the standard 12-lead ECG. TolerantECG training combines contrastive and self-supervised learning frameworks to jointly learn ECG signal representations alongside their corresponding knowledge-retrieval-based text report descriptions and corrupted or lead-missing signals. Comprehensive benchmarking results demonstrate that TolerantECG consistently ranks as the best or second-best performer across various ECG signal conditions and class levels in the PTB-XL dataset, and achieves the highest performance on the MIT-BIH Arrhythmia Database.