Prediction of mortality and resource utilization in critical care: a deep learning approach using multimodal electronic health records with natural language processing techniques
作者: Yucheng Ruan, Xiang Lan, Daniel J. Tan, Hairil Rizal Abdullah, Mengling Feng
分类: cs.CL
发布日期: 2025-08-28
💡 一句话要点
提出一种基于多模态EHR和NLP的深度学习框架,用于预测重症监护中的死亡率和资源利用。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 深度学习 电子健康记录 自然语言处理 重症监护 死亡率预测 资源利用 多模态融合
📋 核心要点
- 现有方法在利用电子健康记录(EHR)预测重症监护中的死亡率和资源利用方面存在不足,尤其忽略了自由文本信息。
- 该论文提出了一种深度学习框架,结合自然语言处理技术,整合多模态EHR数据,从而更全面地预测临床结果。
- 实验结果表明,该模型在死亡率预测、住院时间预测和手术时长估计方面均优于现有方法,且对数据损坏具有较强的鲁棒性。
📝 摘要(中文)
本研究旨在介绍并评估一种深度学习框架,该框架利用自然语言处理技术整合多模态电子健康记录(EHR),以预测重症监护环境中的死亡率和资源利用情况。现有方法主要关注结构化EHR,忽略了自由文本笔记中的宝贵临床见解,且未充分利用结构化数据中的文本信息。研究人员使用两个真实世界的EHR数据集开发并评估了该模型,并在三个临床任务上与领先的现有方法进行了比较。消融研究考察了框架中的三个关键组件:医学提示、自由文本和预训练句子编码器。此外,还评估了模型对结构化EHR中数据损坏的鲁棒性。实验结果表明,该模型在死亡率预测(BACC/AUROC提升1.6%/0.8%)、住院时间预测(RMSE/MAE提升0.5%/2.2%)和手术时长估计(RMSE/MAE提升10.9%/11.0%)方面均优于现有方法。该模型在不同数据损坏率下,在三个任务中始终表现出卓越的性能。研究结果表明,所提出的框架是一种有效且准确的深度学习方法,可用于预测重症监护中的死亡率和资源利用,并突出了使用带有Transformer编码器的prompt learning分析多模态EHR的成功之处。重要的是,该模型对结构化数据中的数据损坏表现出很强的鲁棒性,尤其是在高损坏率下。
🔬 方法详解
问题定义:论文旨在解决重症监护病房(ICU)中,利用电子健康记录(EHR)预测患者死亡率和资源利用率的问题。现有方法主要依赖结构化EHR数据,忽略了非结构化的自由文本信息(如医生笔记),导致预测精度受限。此外,现有方法未能充分利用结构化数据中蕴含的文本信息,例如诊断代码的文本描述等。
核心思路:论文的核心思路是构建一个能够整合多模态EHR数据的深度学习框架,该框架不仅能处理结构化数据,还能有效利用自由文本信息,并通过prompt learning的方式,将结构化数据中的文本信息融入模型。通过融合不同模态的信息,模型能够更全面地理解患者的病情,从而提高预测的准确性。
技术框架:该框架包含以下主要模块:1) 数据预处理:对结构化和非结构化EHR数据进行清洗和转换。2) 文本编码:使用预训练的句子编码器(如Transformer)将自由文本和结构化数据中的文本信息编码为向量表示。3) Prompt Learning模块:利用医学prompt,引导模型学习结构化数据中的文本信息。4) 多模态融合:将不同模态的向量表示进行融合,形成患者的综合表示。5) 预测模块:使用融合后的表示预测死亡率、住院时间和手术时长等目标变量。
关键创新:该论文的关键创新在于:1) 多模态EHR融合:首次将结构化和非结构化EHR数据进行深度融合,充分利用了自由文本信息。2) Prompt Learning的应用:利用医学prompt引导模型学习结构化数据中的文本信息,提高了模型的学习效率和预测精度。3) 数据损坏鲁棒性:模型在结构化数据存在较高比例损坏的情况下,仍能保持较好的预测性能,体现了其在实际应用中的价值。
关键设计:在文本编码方面,使用了预训练的Transformer模型,例如BERT或ClinicalBERT,以获得高质量的文本表示。Prompt Learning模块的设计需要精心选择合适的医学prompt,以引导模型关注关键信息。损失函数方面,针对不同的预测任务,采用了不同的损失函数,例如二元交叉熵损失用于死亡率预测,均方误差损失用于住院时间和手术时长预测。此外,还采用了dropout等正则化技术,以防止过拟合。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该模型在两个真实世界的EHR数据集上,针对三个临床任务均取得了显著的性能提升。具体而言,在死亡率预测方面,BACC和AUROC分别提升了1.6%和0.8%;在住院时间预测方面,RMSE和MAE分别提升了0.5%和2.2%;在手术时长估计方面,RMSE和MAE分别提升了10.9%和11.0%。此外,该模型在结构化数据存在较高比例损坏的情况下,仍能保持较好的预测性能,体现了其在实际应用中的鲁棒性。
🎯 应用场景
该研究成果可应用于重症监护病房的临床决策支持系统,帮助医生更准确地评估患者的风险,优化资源分配,并改善患者的治疗效果。通过预测死亡率和资源利用情况,医院可以更好地管理床位,降低运营成本,并提高整体医疗服务质量。该模型还可扩展到其他临床领域,例如急诊科和普通病房。
📄 摘要(原文)
Background Predicting mortality and resource utilization from electronic health records (EHRs) is challenging yet crucial for optimizing patient outcomes and managing costs in intensive care unit (ICU). Existing approaches predominantly focus on structured EHRs, often ignoring the valuable clinical insights in free-text notes. Additionally, the potential of textual information within structured data is not fully leveraged. This study aimed to introduce and assess a deep learning framework using natural language processing techniques that integrates multimodal EHRs to predict mortality and resource utilization in critical care settings. Methods Utilizing two real-world EHR datasets, we developed and evaluated our model on three clinical tasks with leading existing methods. We also performed an ablation study on three key components in our framework: medical prompts, free-texts, and pre-trained sentence encoder. Furthermore, we assessed the model's robustness against the corruption in structured EHRs. Results Our experiments on two real-world datasets across three clinical tasks showed that our proposed model improved performance metrics by 1.6\%/0.8\% on BACC/AUROC for mortality prediction, 0.5%/2.2% on RMSE/MAE for LOS prediction, 10.9%/11.0% on RMSE/MAE for surgical duration estimation compared to the best existing methods. It consistently demonstrated superior performance compared to other baselines across three tasks at different corruption rates. Conclusions The proposed framework is an effective and accurate deep learning approach for predicting mortality and resource utilization in critical care. The study also highlights the success of using prompt learning with a transformer encoder in analyzing multimodal EHRs. Importantly, the model showed strong resilience to data corruption within structured data, especially at high corruption levels.