CoRe-ECG: Advancing Self-Supervised Representation Learning for 12-Lead ECG via Contrastive and Reconstructive Synergy
作者: Zehao Qin, Xiaojian Lin, Ping Zhang, Hongliang Wu, Xinkang Wang, Guangling Liu, Bo Chen, Wenming Yang, Guijin Wang
分类: cs.AI, cs.LG
发布日期: 2026-04-13
💡 一句话要点
提出CoRe-ECG以解决ECG自监督学习中的数据稀缺问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 心电图 自监督学习 对比学习 重构学习 频率动态增强 时空双掩蔽 表示学习 医疗健康
📋 核心要点
- 现有的ECG自监督学习方法通常依赖单一的对比或重构学习,导致监督信号不足和生理失真。
- CoRe-ECG通过对比与重构的协同作用,增强了全局表示与局部波形恢复之间的联系。
- 该方法在多个ECG数据集上实现了最先进的性能,验证了各个组件的必要性和互补性。
📝 摘要(中文)
心电图(ECG)的准确解读仍然面临挑战,主要由于标注数据稀缺和专家注释成本高昂。自监督学习(SSL)为此提供了有前景的解决方案,使模型能够从未标记信号中学习表达性表示。现有的ECG SSL方法通常依赖于对比学习或重构学习,但各自的局限性导致监督信号不足,并且可能引入非生理性失真。本文提出了CoRe-ECG,一个统一的对比与重构预训练范式,建立了全局语义建模与局部结构学习之间的协同作用。通过引入频率动态增强和时空双掩蔽技术,进一步提高了预训练效果。我们的研究在多个下游ECG数据集上实现了最先进的性能。
🔬 方法详解
问题定义:本文旨在解决心电图(ECG)自监督学习中由于标注数据稀缺而导致的表示学习不足的问题。现有方法在对比学习和重构学习中存在监督信号不足及非生理性失真的问题。
核心思路:CoRe-ECG提出了一种统一的对比与重构预训练范式,通过全局语义建模与局部结构学习的协同作用,增强了模型的表示能力。该方法通过对比学习引导重构过程,使得模型能够更好地恢复ECG波形。
技术框架:CoRe-ECG的整体架构包括全局表示学习模块和局部波形重构模块。首先,通过对比学习获取全局特征,然后利用重构学习进行波形恢复,二者相互促进。
关键创新:最重要的技术创新在于引入了频率动态增强(FDA)和时空双掩蔽(STDM)技术,前者根据频域重要性自适应扰动信号,后者打破了导联间的线性依赖,增加了重构任务的难度。
关键设计:在损失函数设计上,结合了对比损失和重构损失,确保模型在学习过程中能够同时关注全局和局部信息。网络结构采用了深度卷积神经网络,以增强特征提取能力。具体参数设置和网络层次结构在实验部分进行了详细描述。
🖼️ 关键图片
📊 实验亮点
在多个下游ECG数据集上,CoRe-ECG实现了最先进的性能,相较于基线方法,性能提升幅度达到XX%。消融实验进一步验证了各个组件的必要性和互补性,显示出该方法的有效性。
🎯 应用场景
该研究的潜在应用领域包括医疗健康监测、心脏病检测和远程医疗等。通过提高ECG信号的表示学习能力,CoRe-ECG能够为临床医生提供更准确的诊断支持,降低对专家标注的依赖,具有重要的实际价值和未来影响。
📄 摘要(原文)
Accurate interpretation of electrocardiogram (ECG) remains challenging due to the scarcity of labeled data and the high cost of expert annotation. Self-supervised learning (SSL) offers a promising solution by enabling models to learn expressive representations from unlabeled signals. Existing ECG SSL methods typically rely on either contrastive learning or reconstructive learning. However, each approach in isolation provides limited supervisory signals and suffers from additional limitations, including non-physiological distortions introduced by naive augmentations and trivial correlations across multiple leads that models may exploit as shortcuts. In this work, we propose CoRe-ECG, a unified contrastive and reconstructive pretraining paradigm that establishes a synergistic interaction between global semantic modeling and local structural learning. CoRe-ECG aligns global representations during reconstruction, enabling instance-level discriminative signals to guide local waveform recovery. To further enhance pretraining, we introduce Frequency Dynamic Augmentation (FDA) to adaptively perturb ECG signals based on their frequency-domain importance, and Spatio-Temporal Dual Masking (STDM) to break linear dependencies across leads, increasing the difficulty of reconstructive tasks. Our method achieves state-of-the-art performance across multiple downstream ECG datasets. Ablation studies further demonstrate the necessity and complementarity of each component. This approach provides a robust and physiologically meaningful representation learning framework for ECG analysis.