Beyond Patient Invariance: Learning Cardiac Dynamics via Action-Conditioned JEPAs
作者: Jose Geraldo Fernandes, Luiz Facury, Pedro Robles Dutenhefner, Wagner Meira
分类: cs.LG
发布日期: 2026-04-24
🔗 代码/项目: GITHUB
💡 一句话要点
提出基于动作条件JEPAs的心脏动力学学习方法,提升心电图分析性能
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 心电图分析 自监督学习 世界模型 动作条件 疾病动态建模
📋 核心要点
- 现有自监督学习方法在心电图分析中侧重于不变性,忽略了病理变化的动态特性,限制了诊断性能。
- 论文提出动作条件世界模型,将病理视为作用于患者潜在状态的转换向量,学习疾病进展的动态。
- 实验表明,该方法在低资源情况下优于监督学习,AUROC提升超过0.05,验证了生物动力学建模的有效性。
📝 摘要(中文)
医疗保健领域的自监督学习主要依赖于基于不变性的目标,即最大化同一患者不同视图之间的相似性。虽然这种方法对静态解剖结构有效,但它与临床诊断存在根本上的偏差,因为它在数学上迫使模型抑制其旨在检测的瞬时病理变化。我们提出了一种向动作条件世界模型的转变,该模型学习模拟疾病进展的动态,或事件条件。通过将LeJEPA框架应用于生理时间序列,我们将病理定义为作用于患者潜在状态的转换向量,而不是静态标签。通过预测给定疾病发作的未来心脏电生理状态,我们的模型明确地将稳定的解剖特征与动态病理力量分离。在MIMIC-IV-ECG数据集上的评估表明,我们的方法在关键的分诊任务上优于完全监督的基线。至关重要的是,我们展示了卓越的样本效率:在低资源情况下,我们的世界模型优于监督学习超过0.05 AUROC。这些结果表明,建模生物动力学提供了比静态分类更密集的监督信号。
🔬 方法详解
问题定义:现有基于不变性的自监督学习方法在心电图分析中存在局限性。它们倾向于学习静态的解剖结构特征,而忽略了疾病发展过程中的动态变化。这种忽略导致模型难以捕捉瞬时病理变化,从而影响了临床诊断的准确性。现有方法将病理视为静态标签,无法有效建模疾病的演变过程。
核心思路:论文的核心思路是将病理视为一种“动作”,它作用于患者的潜在状态,导致患者的心电生理状态发生改变。通过学习这些“动作”与状态变化之间的关系,模型可以更好地理解疾病的动态过程,从而更准确地预测未来的心电生理状态。这种方法将静态的病理标签转化为动态的病理过程建模。
技术框架:该方法基于LeJEPA框架,并将其扩展到生理时间序列数据。整体框架包含以下几个主要模块:1) 编码器:将心电图时间序列编码为潜在状态向量。2) 动作编码器:将疾病发作等事件编码为动作向量。3) 世界模型:基于当前潜在状态和动作向量,预测未来的潜在状态。4) 解码器:将预测的潜在状态解码为未来的心电图时间序列。模型通过最小化预测的心电图与真实心电图之间的差异进行训练。
关键创新:该方法最重要的创新点在于将病理视为一种“动作”,并使用动作条件世界模型来学习疾病的动态过程。与传统的基于不变性的方法相比,该方法能够更好地捕捉瞬时病理变化,并预测未来的心电生理状态。此外,该方法还通过解耦稳定的解剖特征和动态的病理力量,提高了模型的鲁棒性和泛化能力。
关键设计:在具体实现上,论文采用了Transformer架构作为编码器和解码器。损失函数主要包括重构损失和对比学习损失。重构损失用于确保模型能够准确地预测未来的心电图时间序列,对比学习损失用于鼓励模型学习到具有区分性的潜在状态表示。动作向量可以通过手动设计或通过学习得到。在实验中,论文使用了MIMIC-IV-ECG数据集,并对模型进行了充分的评估。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在MIMIC-IV-ECG数据集上的关键分诊任务中优于完全监督的基线。尤其是在低资源情况下,该方法的优势更加明显,AUROC提升超过0.05。这些结果表明,建模生物动力学能够提供比静态分类更密集的监督信号,从而提高模型的性能和鲁棒性。
🎯 应用场景
该研究成果可应用于心电图自动分析、疾病早期预警、个性化治疗方案制定等领域。通过模拟疾病进展的动态,该模型能够更准确地预测患者未来的健康状况,为临床医生提供更有价值的决策支持。此外,该方法还可以用于药物研发,评估药物对疾病进展的影响。
📄 摘要(原文)
Self-supervised learning in healthcare has largely relied on invariance-based objectives, which maximize similarity between different views of the same patient. While effective for static anatomy, this paradigm is fundamentally misaligned with clinical diagnosis, as it mathematically compels the model to suppress the transient pathological changes it is intended to detect. We propose a shift towards Action-Conditioned World Models that learn to simulate the dynamics of disease progression, or Event-Conditioned. Adapting the LeJEPA framework to physiological time-series, we define pathology not as a static label, but as a transition vector acting on a patient's latent state. By predicting the future electrophysiological state of the heart given a disease onset, our model explicitly disentangles stable anatomical features from dynamic pathological forces. Evaluated on the MIMIC-IV-ECG dataset, our approach outperforms fully supervised baselines on the critical triage task. Crucially, we demonstrate superior sample efficiency: in low-resource regimes, our world model outperforms supervised learning by over 0.05 AUROC. These results suggest that modeling biological dynamics provides a dense supervision signal that is far more robust than static classification. Source code is available at https://github.com/cljosegfer/lesaude-dynamics