EHR-RAG: Bridging Long-Horizon Structured Electronic Health Records and Large Language Models via Enhanced Retrieval-Augmented Generation

作者: Lang Cao, Qingyu Chen, Yue Guo

分类: cs.AI

发布日期: 2026-01-29

💡 一句话要点

EHR-RAG：通过增强检索增强生成，弥合长程结构化电子病历与大型语言模型之间的差距

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 电子病历 检索增强生成 大型语言模型 临床预测 时间序列数据

📋 核心要点

现有方法在处理长程EHR数据时，由于LLM上下文长度限制，常采用截断或简单检索，丢失了重要的临床事件和时间信息。
EHR-RAG通过事件和时间感知的混合检索、自适应迭代检索以及双路径证据检索和推理，更有效地利用长程EHR数据。
实验结果表明，EHR-RAG在多个长程EHR预测任务上显著优于现有基于LLM的基线方法，平均Macro-F1提升10.76%。

📝 摘要（中文）

电子病历(EHRs)提供了丰富的纵向临床证据，对于医疗决策至关重要，这促使人们使用检索增强生成(RAG)来支持大型语言模型(LLM)的预测。然而，长程EHRs通常超出LLM的上下文限制，并且现有方法通常依赖于截断或简单的检索策略，这会丢弃临床相关的事件和时间依赖性。为了解决这些挑战，我们提出了EHR-RAG，这是一个检索增强框架，专为准确解释长程结构化EHR数据而设计。EHR-RAG引入了三个针对纵向临床预测任务量身定制的组件：事件和时间感知混合EHR检索，以保留临床结构和时间动态；自适应迭代检索，以逐步细化查询，从而扩大广泛的证据覆盖范围；双路径证据检索和推理，以联合检索和推理事实和反事实证据。在四个长程EHR预测任务上的实验表明，EHR-RAG始终优于最强的基于LLM的基线，平均Macro-F1提高了10.76%。总的来说，我们的工作突出了检索增强LLM在实践中推进结构化EHR数据临床预测的潜力。

🔬 方法详解

问题定义：论文旨在解决长程电子病历（EHR）数据在应用于大型语言模型（LLM）进行临床预测时面临的挑战。现有方法，如直接截断EHR数据或使用简单的检索策略，无法充分利用EHR中蕴含的丰富的时间信息和临床事件间的依赖关系，导致预测性能下降。

核心思路：EHR-RAG的核心思路是通过增强检索增强生成（RAG）框架，设计专门针对长程EHR数据的检索和推理机制，从而更有效地利用EHR数据中的时间信息和临床结构。该方法旨在克服LLM上下文长度限制，并保留重要的临床事件和时间依赖性。

技术框架：EHR-RAG框架包含三个主要组件：1) 事件和时间感知混合EHR检索：结合多种检索策略，考虑临床事件的类型和时间信息，以保留临床结构和时间动态。2) 自适应迭代检索：通过逐步细化查询，扩大证据覆盖范围，确保检索到更全面的相关信息。3) 双路径证据检索和推理：同时检索和推理事实证据和反事实证据，以提高预测的准确性和鲁棒性。

关键创新：EHR-RAG的关键创新在于其针对长程EHR数据的定制化检索和推理策略。与传统的RAG方法相比，EHR-RAG更加关注EHR数据的时间特性和临床结构，通过事件和时间感知的检索以及双路径证据推理，显著提高了预测性能。

关键设计：事件和时间感知混合EHR检索可能涉及使用不同的嵌入模型来表示不同类型的临床事件，并结合时间衰减函数来调整事件的重要性。自适应迭代检索可能使用强化学习来优化查询细化的策略。双路径证据检索和推理可能涉及构建反事实EHR数据，并使用对比学习来训练模型。

🖼️ 关键图片

📊 实验亮点

实验结果表明，EHR-RAG在四个长程EHR预测任务上均优于现有的基于LLM的基线方法。具体而言，EHR-RAG实现了平均Macro-F1提升10.76%，证明了其在处理长程结构化EHR数据方面的有效性。这些结果表明，通过定制化的检索和推理策略，可以显著提高LLM在临床预测任务中的性能。

🎯 应用场景

EHR-RAG具有广泛的应用前景，可用于各种临床预测任务，例如疾病诊断、预后预测和治疗方案推荐。通过更有效地利用长程EHR数据，EHR-RAG可以帮助医生做出更准确、更明智的决策，从而改善患者的治疗效果。该研究还有助于推动LLM在医疗领域的应用，并为其他类似的时间序列数据分析任务提供借鉴。

📄 摘要（原文）

Electronic Health Records (EHRs) provide rich longitudinal clinical evidence that is central to medical decision-making, motivating the use of retrieval-augmented generation (RAG) to ground large language model (LLM) predictions. However, long-horizon EHRs often exceed LLM context limits, and existing approaches commonly rely on truncation or vanilla retrieval strategies that discard clinically relevant events and temporal dependencies. To address these challenges, we propose EHR-RAG, a retrieval-augmented framework designed for accurate interpretation of long-horizon structured EHR data. EHR-RAG introduces three components tailored to longitudinal clinical prediction tasks: Event- and Time-Aware Hybrid EHR Retrieval to preserve clinical structure and temporal dynamics, Adaptive Iterative Retrieval to progressively refine queries in order to expand broad evidence coverage, and Dual-Path Evidence Retrieval and Reasoning to jointly retrieves and reasons over both factual and counterfactual evidence. Experiments across four long-horizon EHR prediction tasks show that EHR-RAG consistently outperforms the strongest LLM-based baselines, achieving an average Macro-F1 improvement of 10.76%. Overall, our work highlights the potential of retrieval-augmented LLMs to advance clinical prediction on structured EHR data in practice.

EHR-RAG: Bridging Long-Horizon Structured Electronic Health Records and Large Language Models via Enhanced Retrieval-Augmented Generation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理