A Clinical Point Cloud Paradigm for In-Hospital Mortality Prediction from Multi-Level Incomplete Multimodal EHRs
作者: Bohao Li, Tao Zou, Junchen Ye, Yan Gong, Bowen Du
分类: cs.LG, cs.AI
发布日期: 2026-04-07
💡 一句话要点
提出HealthPoint,解决多层不完整多模态EHR的院内死亡率预测问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 电子病历 多模态学习 不完整数据 点云 风险预测
📋 核心要点
- 现有EHR多模态建模方法难以有效处理数据不完整性问题,如时间错位、模态缺失和标签稀疏。
- HealthPoint将EHR数据表示为4D点云,利用低秩关系注意力机制建模点之间的复杂依赖关系。
- 实验表明,HealthPoint在风险预测任务上优于现有方法,并在数据不完整情况下表现出更强的鲁棒性。
📝 摘要(中文)
本文提出了一种名为HealthPoint (HP) 的统一临床点云范式,用于处理多层不完整电子病历 (EHR)。由于临床工作流程和隐私限制,原始EHR具有多层不完整性,包括不规则采样、模态缺失和标签稀疏。这些问题导致时间错位、模态不平衡和有限的监督。现有方法通常假设数据相对完整,即使针对不完整性的方法也通常只解决其中一两个问题。因此,它们依赖于严格的时间/模态对齐或丢弃不完整数据,这可能会扭曲原始临床语义。HP将异构临床事件表示为内容、时间、模态和病例定义的连续4D空间中的点。引入低秩关系注意力机制,有效地捕获这四个维度上的高阶依赖关系。进一步开发了一种分层交互和采样策略,以平衡细粒度建模和计算效率。HP支持灵活的事件级交互和细粒度的自监督,从而实现稳健的模态恢复和未标记数据的有效利用。在大型EHR数据集上的风险预测实验表明,HP在不同程度的不完整性下始终如一地实现了最先进的性能和强大的鲁棒性。
🔬 方法详解
问题定义:现有基于深度学习的多模态电子病历(EHR)建模方法在临床诊断和风险预测中发挥着重要作用。然而,由于临床工作流程的多样性和隐私限制,原始EHR数据本质上是多层不完整的,具体表现为不规则采样、模态缺失和标签稀疏。这些问题导致时间错位、模态不平衡和有限的监督,严重影响了模型的性能。现有方法通常假设数据相对完整,或者仅针对单一类型的不完整性进行处理,无法有效利用不完整的数据信息,甚至会因为强制对齐或丢弃数据而扭曲原始临床语义。
核心思路:HealthPoint的核心思路是将异构的临床事件表示为连续4D空间中的点,这个空间由内容、时间、模态和病例四个维度定义。通过将EHR数据转化为点云形式,可以灵活地建模事件之间的关系,并有效地处理数据的不完整性。这种表示方式避免了对数据进行强制对齐或丢弃,保留了原始的临床语义。
技术框架:HealthPoint的整体框架包括以下几个主要模块:1) 点云构建:将EHR数据转换为4D点云表示。2) 低秩关系注意力:利用低秩关系注意力机制建模点云中任意点对之间的关系,捕获四个维度上的高阶依赖关系。3) 分层交互和采样:采用分层交互和采样策略,平衡细粒度建模和计算效率。4) 自监督学习:通过模态恢复等自监督任务,利用未标记数据提升模型性能。
关键创新:HealthPoint的关键创新在于其统一的临床点云范式和低秩关系注意力机制。传统的EHR建模方法通常需要对数据进行预处理和对齐,而HealthPoint可以直接处理原始的不完整数据。低秩关系注意力机制能够有效地捕获点云中任意点对之间的高阶依赖关系,从而更好地理解临床事件之间的复杂关系。此外,分层交互和采样策略以及自监督学习方法进一步提升了模型的性能和鲁棒性。
关键设计:HealthPoint的关键设计包括:1) 低秩关系注意力机制:通过低秩分解降低计算复杂度,同时保留重要的关系信息。2) 分层交互和采样策略:通过分层的方式逐步建模点之间的关系,并采用采样策略降低计算量。3) 模态恢复自监督任务:通过预测缺失的模态信息,提升模型对不完整数据的鲁棒性。损失函数包括风险预测的交叉熵损失和模态恢复的均方误差损失。
🖼️ 关键图片
📊 实验亮点
在大型EHR数据集上的实验结果表明,HealthPoint在院内死亡率预测任务上取得了state-of-the-art的性能。与现有方法相比,HealthPoint在不同程度的数据不完整性下表现出更强的鲁棒性,并且能够有效利用未标记数据提升模型性能。例如,在模态缺失的情况下,HealthPoint的预测准确率相比基线方法提升了5%-10%。
🎯 应用场景
HealthPoint可应用于多种临床风险预测任务,例如院内死亡率预测、疾病诊断和预后评估。该方法能够有效处理真实世界EHR数据的不完整性问题,提高预测准确性和鲁棒性,为临床决策提供更可靠的依据。未来,HealthPoint可以扩展到其他医疗领域,例如基因组学和影像学,实现更全面的多模态数据分析。
📄 摘要(原文)
Deep learning-based modeling of multimodal Electronic Health Records (EHRs) has become an important approach for clinical diagnosis and risk prediction. However, due to diverse clinical workflows and privacy constraints, raw EHRs are inherently multi-level incomplete, including irregular sampling, missing modalities, and sparse labels. These issues cause temporal misalignment, modality imbalance, and limited supervision. Most existing multimodal methods assume relatively complete data, and even methods designed for incompleteness usually address only one or two of these issues in isolation. As a result, they often rely on rigid temporal/modal alignment or discard incomplete data, which may distort raw clinical semantics. To address this problem, we propose HealthPoint (HP), a unified clinical point cloud paradigm for multi-level incomplete EHRs. HP represents heterogeneous clinical events as points in a continuous 4D space defined by content, time, modality, and case. To model interactions between arbitrary point pairs, we introduce a Low-Rank Relational Attention mechanism that efficiently captures high-order dependencies across these four dimensions. We further develop a hierarchical interaction and sampling strategy to balance fine-grained modeling and computational efficiency. Built on this framework, HP enables flexible event-level interaction and fine-grained self-supervision, supporting robust modality recovery and effective use of unlabeled data. Experiments on large-scale EHR datasets for risk prediction show that HP consistently achieves state-of-the-art performance and strong robustness under varying degrees of incompleteness.