Taming the Real-world Complexities in CPT E/M Coding with Large Language Models

📄 arXiv: 2510.25007v1 📥 PDF

作者: Islam Nassar, Yang Lin, Yuan Jin, Rongxin Zhu, Chang Wei Tan, Zenan Zhai, Nitika Mathur, Thanh Tien Vu, Xu Zhong, Long Duong, Yuan-Fang Li

分类: cs.AI, cs.LG

发布日期: 2025-10-28

备注: EMNLP 2025 Industry Track


💡 一句话要点

ProFees:利用大语言模型解决CPT E/M编码的现实复杂性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: CPT E/M编码 大语言模型 医疗自动化 自然语言处理 医学文本理解

📋 核心要点

  1. 现有CPT E/M编码自动化方法难以应对现实世界的复杂性,导致准确率不足,增加了医生负担。
  2. 论文提出ProFees框架,利用大语言模型理解和处理医疗文本中的复杂信息,从而提升编码准确性。
  3. 实验表明,ProFees在真实数据集上显著优于商业系统和单提示基线,验证了其有效性。

📝 摘要(中文)

本研究关注于利用现行程序术语(CPT)分类下的评估与管理(E/M)编码,该编码记录了医生向患者提供的医疗服务。E/M编码主要用于计费,因此提供准确的CPT E/M编码符合医生的最佳利益。虽然重要,但这属于辅助性任务,增加了医生的文档负担。自动化该编码任务将有助于减轻医生的文档负担,提高计费效率,并最终改善患者护理。然而,许多现实世界的复杂性使得E/M编码自动化成为一项具有挑战性的任务。在本文中,我们详细阐述了一些关键的复杂性,并提出了ProFees,我们基于LLM的框架来解决这些复杂性,然后进行系统的评估。在一个专家策划的真实世界数据集上,ProFees在编码准确性方面比商业CPT E/M编码系统提高了36%以上,并且比我们最强的单提示基线提高了近5%,证明了其在解决现实世界复杂性方面的有效性。

🔬 方法详解

问题定义:论文旨在解决CPT E/M编码自动化中的现实世界复杂性问题。现有的自动化系统,包括商业系统,在处理复杂的医疗文本时,编码准确率较低,无法有效减轻医生的文档负担。这些复杂性可能包括医学术语的歧义性、患者病情的复杂性以及编码规则的细微差别。

核心思路:论文的核心思路是利用大语言模型(LLM)强大的自然语言理解和生成能力,来更好地理解和处理医疗文本中的复杂信息,从而提高CPT E/M编码的准确性。LLM能够学习和捕捉医学知识、编码规则以及临床背景,从而做出更准确的编码决策。

技术框架:ProFees框架的具体架构细节论文中未详细描述,但可以推断其包含以下主要模块:1) 医疗文本输入模块:负责接收和预处理医生的诊疗记录等文本数据。2) LLM编码模块:利用预训练的LLM,结合特定的提示工程(prompt engineering)或微调(fine-tuning)策略,对医疗文本进行编码。3) 编码结果输出模块:将LLM生成的CPT E/M编码结果输出,供医生或计费系统使用。

关键创新:论文的关键创新在于将大语言模型应用于CPT E/M编码自动化,并设计了ProFees框架来解决现实世界中的复杂性。与传统的基于规则或机器学习的编码系统相比,ProFees能够更好地理解和处理复杂的医疗文本,从而提高编码准确性。此外,论文还强调了对真实世界数据集的系统评估,这对于验证ProFees的实际效果至关重要。

关键设计:论文中未提供关于参数设置、损失函数、网络结构等技术细节的具体信息。但可以推测,ProFees可能采用了以下关键设计:1) 针对医疗文本的特定提示工程,以引导LLM生成更准确的编码结果。2) 基于真实世界数据集的微调,以使LLM更好地适应特定的编码任务。3) 可能使用了某种形式的知识融合,将医学知识库或编码规则融入到LLM中。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ProFees在专家策划的真实世界数据集上进行了评估,结果表明,其编码准确性比商业CPT E/M编码系统提高了36%以上,并且比论文中最强的单提示基线提高了近5%。这些结果表明,ProFees在解决现实世界复杂性方面具有显著的优势,并为CPT E/M编码自动化提供了新的解决方案。

🎯 应用场景

该研究成果可应用于医疗计费自动化、临床文档辅助、医疗质量控制等领域。通过提高CPT E/M编码的准确性和效率,可以减轻医生的文档负担,减少计费错误,提高医疗机构的运营效率,并最终改善患者的医疗服务体验。未来,该技术有望与电子病历系统集成,实现更智能化的医疗服务。

📄 摘要(原文)

Evaluation and Management (E/M) coding, under the Current Procedural Terminology (CPT) taxonomy, documents medical services provided to patients by physicians. Used primarily for billing purposes, it is in physicians' best interest to provide accurate CPT E/M codes. %While important, it is an auxiliary task that adds to physicians' documentation burden. Automating this coding task will help alleviate physicians' documentation burden, improve billing efficiency, and ultimately enable better patient care. However, a number of real-world complexities have made E/M encoding automation a challenging task. In this paper, we elaborate some of the key complexities and present ProFees, our LLM-based framework that tackles them, followed by a systematic evaluation. On an expert-curated real-world dataset, ProFees achieves an increase in coding accuracy of more than 36\% over a commercial CPT E/M coding system and almost 5\% over our strongest single-prompt baseline, demonstrating its effectiveness in addressing the real-world complexities.