Learning Treatment Policies From Multimodal Electronic Health Records
作者: Henri Arno, Thomas Demeester
分类: cs.LG, cs.AI, stat.ML
发布日期: 2025-07-28 (更新: 2025-12-23)
备注: Preprint. Under review
💡 一句话要点
提出一种基于专家标注的多模态EHR治疗策略学习方法,提升治疗效果估计。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 因果策略学习 多模态EHR 治疗效果估计 专家标注 临床决策支持
📋 核心要点
- 现有因果策略学习方法在多模态EHR数据中因果假设难以满足,导致治疗效果估计不准确。
- 利用专家标注监督治疗效果估计,同时仅使用多模态表示进行推理,提升策略学习的泛化性。
- 在多种数据集上验证了该方法的有效性,为因果机器学习在临床数据中的应用提供了新思路。
📝 摘要(中文)
本文研究如何从包含表格数据和临床文本的多模态电子健康记录(EHRs)中学习有效的治疗策略。这些策略可以帮助医生做出更好的治疗决策,并更有效地分配医疗资源。因果策略学习方法优先考虑预期治疗效果最大的患者。然而,现有的估计器假设表格协变量满足严格的因果假设,这在多模态设置中通常不成立。因此,实践中通常使用基线风险的预测模型来指导此类决策,因为它们自然地扩展到多模态数据。但是,这种基于风险的策略并非旨在识别哪些患者从治疗中获益最多。我们提出了一种因果策略学习的扩展方法,该方法在训练期间使用专家提供的注释来监督治疗效果估计,而在推理期间仅使用多模态表示作为输入。我们表明,所提出的方法在合成、半合成和真实EHR数据集上实现了强大的经验性能,从而为将因果机器学习应用于真实的临床数据提供了实用的见解。
🔬 方法详解
问题定义:论文旨在解决从多模态电子健康记录(EHRs)中学习有效治疗策略的问题。现有方法,特别是因果策略学习方法,依赖于强因果假设,这些假设在多模态数据中通常不成立。此外,常用的基于风险的策略无法有效识别哪些患者能从治疗中获益最多。因此,如何利用多模态EHR数据,在弱因果假设下,准确估计个体治疗效果,是本文要解决的核心问题。
核心思路:论文的核心思路是利用专家提供的标注信息来监督治疗效果的估计过程。通过引入专家知识,可以弥补因果假设不足带来的偏差,并使模型能够学习到更准确的治疗效果表示。在推理阶段,模型仅依赖多模态输入,保证了实际应用中的可行性。
技术框架:该方法包含训练和推理两个阶段。在训练阶段,模型接收多模态EHR数据和专家标注的治疗效果作为输入,通过监督学习的方式训练治疗效果估计器。在推理阶段,模型仅接收多模态EHR数据作为输入,输出个体化的治疗策略。整体框架可以看作是一个因果策略学习框架的扩展,核心在于引入了专家标注作为监督信号。
关键创新:该方法的关键创新在于利用专家标注来指导治疗效果估计,从而在多模态EHR数据中实现更准确的因果策略学习。与传统方法相比,该方法不需要强因果假设,并且能够更好地利用多模态数据中的信息。此外,该方法在推理阶段仅依赖多模态输入,保证了实际应用中的可行性。
关键设计:具体的技术细节包括:如何将专家标注融入到损失函数中,如何设计多模态数据的表示学习方法,以及如何选择合适的模型结构来估计治疗效果。论文可能使用了特定的损失函数来衡量预测的治疗效果与专家标注之间的差异。多模态数据的表示学习可能采用了深度学习模型,例如Transformer或图神经网络,来融合表格数据和临床文本信息。治疗效果估计器可能采用了因果推断中常用的模型,例如双重鲁棒估计器或因果森林。
🖼️ 关键图片
📊 实验亮点
论文在合成、半合成和真实EHR数据集上进行了实验验证,结果表明该方法能够显著提升治疗效果估计的准确性。具体性能数据未知,但摘要强调了“强大的经验性能”,表明该方法在多个数据集上均优于现有方法,为因果机器学习在临床数据中的应用提供了有力的支持。
🎯 应用场景
该研究成果可应用于临床决策支持系统,帮助医生制定更个性化、更有效的治疗方案。通过分析患者的EHR数据,系统可以预测不同治疗方案的预期效果,从而辅助医生选择最佳方案。此外,该方法还可以用于医疗资源优化配置,将有限的资源分配给最有可能从中获益的患者,提高整体医疗效率。
📄 摘要(原文)
We study how to learn effective treatment policies from multimodal electronic health records (EHRs) that consist of tabular data and clinical text. These policies can help physicians make better treatment decisions and allocate healthcare resources more efficiently. Causal policy learning methods prioritize patients with the largest expected treatment benefit. Yet, existing estimators assume tabular covariates that satisfy strong causal assumptions, which are typically violated in the multimodal setting. As a result, predictive models of baseline risk are commonly used in practice to guide such decisions, as they extend naturally to multimodal data. However, such risk-based policies are not designed to identify which patients benefit most from treatment. We propose an extension of causal policy learning that uses expert-provided annotations during training to supervise treatment effect estimation, while using only multimodal representations as input during inference. We show that the proposed method achieves strong empirical performance across synthetic, semi-synthetic, and real-world EHR datasets, thereby offering practical insights into applying causal machine learning to realistic clinical data.