Multimodal Cardiovascular Risk Profiling Using Self-Supervised Learning of Polysomnography

📄 arXiv: 2507.09009v1 📥 PDF

作者: Zhengxiao He, Huayu Li, Geng Yuan, William D. S. Killgore, Stuart F. Quan, Chen X. Chen, Ao Li

分类: cs.LG, cs.AI

发布日期: 2025-07-11

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于睡眠多导图自监督学习的多模态心血管风险预测方法

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 心血管风险预测 多导睡眠图 自监督学习 多模态融合 深度学习 脑电图 心电图

📋 核心要点

  1. 现有心血管风险评估方法依赖传统风险因素,未能充分利用多导睡眠图(PSG)蕴含的丰富信息。
  2. 利用自监督学习从多模态PSG信号中提取个体化的心血管风险特征,无需人工标注。
  3. 实验表明,该方法能有效预测心血管疾病风险,并与Framingham风险评分互补,提升预测性能。

📝 摘要(中文)

本文提出了一种自监督深度学习模型,用于从多模态信号(脑电图(EEG)、心电图(ECG)和呼吸信号)中提取有意义的模式。该模型在4398名参与者的数据上进行训练。通过对比有和没有心血管疾病(CVD)结果的个体嵌入,得到投影分数。在包含1093名参与者的独立队列中进行了外部验证。投影分数揭示了跨模态的独特且具有临床意义的模式。ECG衍生的特征可以预测普遍存在和新发的心脏疾病,特别是CVD死亡率。EEG衍生的特征可以预测新发高血压和CVD死亡率。呼吸信号增加了互补的预测价值。将这些投影分数与Framingham风险评分相结合,始终提高了预测性能,在不同的结果中实现了0.607到0.965的曲线下面积值。研究结果在外部测试队列中得到了稳健的复制和验证。结论表明,该框架可以直接从PSG数据生成个体化的CVD风险评分,并有可能整合到临床实践中,从而加强风险评估并支持个性化护理。

🔬 方法详解

问题定义:现有心血管风险评估方法主要依赖于传统的临床风险因素,例如年龄、血压、胆固醇水平等。这些方法忽略了多导睡眠图(PSG)中蕴含的丰富生理信息,例如脑电活动、心电活动和呼吸模式。如何有效利用PSG数据,提升心血管风险预测的准确性和个性化程度,是一个重要的挑战。

核心思路:本文的核心思路是利用自监督学习,从多模态的PSG信号中提取个体化的心血管风险特征。通过对比有和没有心血管疾病结果的个体嵌入,学习到与疾病相关的潜在模式。这种方法无需人工标注数据,可以充分利用大规模的PSG数据进行训练。

技术框架:该方法主要包含以下几个阶段:1) 数据预处理:对EEG、ECG和呼吸信号进行预处理,例如滤波、降噪等。2) 自监督学习:使用自监督学习模型,例如对比学习或掩码自编码器,从多模态信号中学习嵌入表示。3) 投影分数计算:通过对比有和没有心血管疾病结果的个体嵌入,计算投影分数,作为个体化的风险特征。4) 风险预测:将投影分数与传统的风险因素相结合,使用机器学习模型进行风险预测。

关键创新:该方法最重要的技术创新点在于利用自监督学习从多模态PSG信号中提取个体化的心血管风险特征。与传统的基于人工特征工程的方法相比,自监督学习可以自动学习到与疾病相关的潜在模式,无需人工干预。此外,该方法将多模态信号进行融合,可以更全面地反映个体的生理状态。

关键设计:在自监督学习阶段,可以使用对比学习或掩码自编码器等方法。对比学习的目标是使相似的样本在嵌入空间中更接近,不相似的样本更远离。掩码自编码器的目标是根据部分被掩盖的信号重建原始信号。在风险预测阶段,可以使用逻辑回归、支持向量机或神经网络等模型。损失函数可以选择交叉熵损失或均方误差损失。

📊 实验亮点

实验结果表明,该方法提取的投影分数能够有效预测心血管疾病风险,包括普遍存在和新发的心脏疾病、高血压和CVD死亡率。将投影分数与Framingham风险评分相结合,预测性能得到显著提升,AUC值在0.607到0.965之间。在独立的外部测试队列中,研究结果得到了稳健的验证。

🎯 应用场景

该研究成果可应用于心血管疾病的早期风险筛查、个性化风险评估和精准干预。通过分析患者的睡眠多导图数据,可以识别出潜在的高风险人群,并制定个性化的预防和治疗方案。该技术还有望应用于远程医疗和可穿戴设备,实现便捷的心血管健康监测。

📄 摘要(原文)

Methods: We developed a self-supervised deep learning model that extracts meaningful patterns from multi-modal signals (Electroencephalography (EEG), Electrocardiography (ECG), and respiratory signals). The model was trained on data from 4,398 participants. Projection scores were derived by contrasting embeddings from individuals with and without CVD outcomes. External validation was conducted in an independent cohort with 1,093 participants. The source code is available on https://github.com/miraclehetech/sleep-ssl. Results: The projection scores revealed distinct and clinically meaningful patterns across modalities. ECG-derived features were predictive of both prevalent and incident cardiac conditions, particularly CVD mortality. EEG-derived features were predictive of incident hypertension and CVD mortality. Respiratory signals added complementary predictive value. Combining these projection scores with the Framingham Risk Score consistently improved predictive performance, achieving area under the curve values ranging from 0.607 to 0.965 across different outcomes. Findings were robustly replicated and validated in the external testing cohort. Conclusion: Our findings demonstrate that the proposed framework can generate individualized CVD risk scores directly from PSG data. The resulting projection scores have the potential to be integrated into clinical practice, enhancing risk assessment and supporting personalized care.