Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models

📄 arXiv: 2603.09638v1 📥 PDF

作者: Luc Builtjes, Alessa Hering

分类: cs.CL

发布日期: 2026-03-10

备注: 6 pages, 2 figures


💡 一句话要点

提出开放源代码模型以提取放射学报告中的肿瘤信息

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 放射学报告 肿瘤信息提取 大型语言模型 开源系统 数据隐私 临床文本分析 RECIST标准

📋 核心要点

  1. 现有的放射学报告由于其非结构化格式,导致自动化分析面临挑战,难以提取关键信息。
  2. 本文提出了一种基于开源大型语言模型的纵向信息提取管道,能够有效处理放射学报告中的肿瘤信息。
  3. 实验结果表明,该方法在提取目标、非目标和新病灶信息方面表现出高达94.9%的准确率,显示出显著的性能提升。

📝 摘要(中文)

放射学报告记录了肿瘤负担、治疗反应和疾病进展等重要的纵向信息,但其非结构化叙述格式使得自动化分析变得复杂。尽管大型语言模型(LLMs)在临床文本处理方面取得了进展,但大多数先进系统仍为专有,限制了其在隐私敏感的医疗环境中的适用性。本文提出了一种完全开源、可本地部署的纵向信息提取管道,使用llm_extractinator框架实现。该系统应用qwen2.5-72b模型,根据RECIST标准提取和链接目标、非目标和新病灶数据。对50对荷兰CT胸腹部报告的评估显示,目标病灶的属性级准确率为93.7%,非目标病灶为94.9%,新病灶为94.0%。该方法证明了开源LLMs在多时间点肿瘤学任务中能够实现临床意义的性能,同时确保数据隐私和可重复性。

🔬 方法详解

问题定义:本文旨在解决放射学报告中肿瘤信息提取的自动化问题,现有方法多为专有系统,难以在隐私敏感的医疗环境中应用。

核心思路:通过开发一个完全开源的管道,利用大型语言模型进行放射学报告的纵向信息提取,确保数据隐私和可重复性。

技术框架:该系统基于llm_extractinator框架,使用qwen2.5-72b模型,主要模块包括数据预处理、信息提取和结果链接,遵循RECIST标准进行评估。

关键创新:本研究的创新点在于使用开源LLMs实现高效的多时间点肿瘤信息提取,突破了专有系统的限制,提升了可用性和可访问性。

关键设计:在模型训练中,采用了特定的损失函数和参数设置,以优化目标、非目标和新病灶的提取性能,确保高准确率。该系统的设计考虑了数据隐私和本地部署的需求。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果显示,该方法在50对荷兰CT胸腹部报告的评估中,目标病灶的属性级准确率达到93.7%,非目标病灶为94.9%,新病灶为94.0%。这些结果表明,开源LLMs在多时间点肿瘤信息提取任务中具有临床意义的性能提升。

🎯 应用场景

该研究的潜在应用领域包括医疗数据分析、肿瘤监测和临床决策支持。通过提供一个开源的解决方案,能够帮助医疗机构在保护患者隐私的前提下,实现高效的临床文本分析,提升肿瘤管理的效率和准确性。

📄 摘要(原文)

Radiology reports capture crucial longitudinal information on tumor burden, treatment response, and disease progression, yet their unstructured narrative format complicates automated analysis. While large language models (LLMs) have advanced clinical text processing, most state-of-the-art systems remain proprietary, limiting their applicability in privacy-sensitive healthcare environments. We present a fully open-source, locally deployable pipeline for longitudinal information extraction from radiology reports, implemented using the \texttt{llm_extractinator} framework. The system applies the \texttt{qwen2.5-72b} model to extract and link target, non-target, and new lesion data across time points in accordance with RECIST criteria. Evaluation on 50 Dutch CT Thorax/Abdomen report pairs yielded high extraction performance, with attribute-level accuracies of 93.7\% for target lesions, 94.9\% for non-target lesions, and 94.0\% for new lesions. The approach demonstrates that open-source LLMs can achieve clinically meaningful performance in multi-timepoint oncology tasks while ensuring data privacy and reproducibility. These results highlight the potential of locally deployable LLMs for scalable extraction of structured longitudinal data from routine clinical text.