Improving Early Prediction of Type 2 Diabetes Mellitus with ECG-DiaNet: A Multimodal Neural Network Leveraging Electrocardiogram and Clinical Risk Factors

📄 arXiv: 2504.05338v1 📥 PDF

作者: Farida Mohsen, Zubair Shah

分类: cs.LG, cs.AI

发布日期: 2025-04-05


💡 一句话要点

提出ECG-DiaNet以提升2型糖尿病早期预测准确性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 2型糖尿病 心电图 多模态学习 深度学习 临床风险因素 早期预测 非侵入性 公共卫生

📋 核心要点

  1. 现有的T2DM预测方法往往依赖单一数据源,导致预测准确性不足,难以满足临床需求。
  2. 本研究提出ECG-DiaNet,通过结合心电图和临床风险因素,提升T2DM的早期预测能力,体现了多模态学习的优势。
  3. 实验结果表明,ECG-DiaNet在AUROC上达到0.845,显著优于传统模型,且在高风险个体中表现出更高的阳性预测值。

📝 摘要(中文)

2型糖尿病(T2DM)仍然是全球健康挑战,迫切需要早期和准确的风险预测。本研究提出了ECG-DiaNet,这是一种多模态深度学习模型,结合了心电图(ECG)特征和临床风险因素(CRFs),以增强T2DM发病预测。使用来自卡塔尔生物银行的数据,我们在开发队列(n=2043)上训练和验证模型,并在一个五年随访的纵向测试集(n=395)上评估性能。ECG-DiaNet在AUROC(0.845 vs 0.8217)上优于单模态ECG和CRF模型,且具有统计学意义(DeLong p<0.001)。风险分层显示ECG-DiaNet在高风险个体中实现了更高的阳性预测值(PPV)。该模型依赖于非侵入性且广泛可用的ECG信号,支持其在临床和社区健康环境中的可行性。

🔬 方法详解

问题定义:本研究旨在解决2型糖尿病早期预测的准确性不足问题,现有方法多依赖单一数据源,无法充分捕捉疾病的多因素特征。

核心思路:ECG-DiaNet通过融合心电图和临床风险因素,利用多模态深度学习技术,增强了对T2DM发病风险的预测能力,体现了心脏电生理与系统风险特征的结合。

技术框架:模型包括数据预处理、特征提取、模型训练和评估四个主要阶段。首先,从心电图和临床数据中提取特征,然后通过深度学习模型进行训练,最后在测试集上进行性能评估。

关键创新:ECG-DiaNet的主要创新在于其多模态融合策略,能够同时利用心电图和临床风险因素,显著提高了预测性能,与传统单模态模型相比具有本质区别。

关键设计:模型采用了特定的损失函数以优化预测结果,并设计了适合多模态输入的网络结构,确保了不同数据源的有效融合。

📊 实验亮点

实验结果显示,ECG-DiaNet在AUROC上达到0.845,显著高于CRF单模态模型的0.8217,且具有统计学意义(DeLong p<0.001)。此外,模型在高风险个体中的阳性预测值(PPV)表现优异,进一步验证了其有效性。

🎯 应用场景

该研究的潜在应用领域包括临床医疗和公共卫生,尤其是在糖尿病高风险人群的早期筛查与干预中。ECG-DiaNet的非侵入性特性使其在社区健康环境中具有广泛的应用前景,能够为个体化预防策略提供支持。

📄 摘要(原文)

Type 2 Diabetes Mellitus (T2DM) remains a global health challenge, underscoring the need for early and accurate risk prediction. This study presents ECG-DiaNet, a multimodal deep learning model that integrates electrocardiogram (ECG) features with clinical risk factors (CRFs) to enhance T2DM onset prediction. Using data from Qatar Biobank (QBB), we trained and validated models on a development cohort (n=2043) and evaluated performance on a longitudinal test set (n=395) with five-year follow-up. ECG-DiaNet outperformed unimodal ECG-only and CRF-only models, achieving a higher AUROC (0.845 vs 0.8217) than the CRF-only model, with statistical significance (DeLong p<0.001). Reclassification metrics further confirmed improvements: Net Reclassification Improvement (NRI=0.0153) and Integrated Discrimination Improvement (IDI=0.0482). Risk stratification into low-, medium-, and high-risk groups showed ECG-DiaNet achieved superior positive predictive value (PPV) in high-risk individuals. The model's reliance on non-invasive and widely available ECG signals supports its feasibility in clinical and community health settings. By combining cardiac electrophysiology and systemic risk profiles, ECG-DiaNet addresses the multifactorial nature of T2DM and supports precision prevention. These findings highlight the value of multimodal AI in advancing early detection and prevention strategies for T2DM, particularly in underrepresented Middle Eastern populations.