Efficient Fine-Tuning of Large Language Models for Automated Medical Documentation

作者: Hui Yi Leong, Yi Fan Gao, Ji Shuai, Yang Zhang, Uktu Pamuksuz

分类: cs.CL, cs.AI

发布日期: 2024-09-14 (更新: 2025-09-24)

备注: 4 pages, 3 Figures, 3 Tables. The final version will be published in the proceedings of the IEEE conference

DOI: 10.13140/RG.2.2.26884.74881

💡 一句话要点

MediGen：高效微调LLaMA3-8B，自动化生成医疗文档，减轻医生负担

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 医疗文档生成 LLaMA3-8B 微调 自然语言处理 电子健康记录 医疗效率

📋 核心要点

医生花费大量时间在行政任务上，特别是电子健康记录，这减少了患者护理时间并导致职业倦怠。
MediGen通过微调LLaMA3-8B等大型语言模型，从医疗对话中自动生成医疗报告，从而减轻医生的行政负担。
实验结果表明，微调后的LLaMA3-8B模型在医疗报告生成方面表现出色，ROUGE得分达到58%，BERTScore-F1达到72%。

📝 摘要（中文）

本研究旨在解决医生在电子健康记录（EHRs）和案头工作上花费过多时间的问题，这些行政负担不仅减少了患者护理时间，还导致医生职业倦怠和医疗效率低下。为此，本研究提出了MediGen，一个经过微调的大型语言模型（LLM），旨在自动生成医疗对话的医疗报告。MediGen利用最先进的微调方法，对开源预训练模型LLaMA3-8B进行微调，在转录和总结临床互动方面实现了高精度。微调后的LLaMA3-8B模型表现出良好的效果，ROUGE得分达到58%，BERTScore-F1达到72%，表明其在生成准确且具有临床相关性的医疗报告方面非常有效。这些发现表明，MediGen有潜力显著减少医生的行政工作量，从而提高医疗效率和医生的福祉。

🔬 方法详解

问题定义：论文旨在解决医生在医疗文档记录方面耗时过多的问题。现有方法通常依赖于手动记录或效率较低的语音转录，导致医生工作负担过重，影响患者护理质量。因此，需要一种能够自动、准确地从医疗对话中生成医疗报告的系统。

核心思路：论文的核心思路是利用大型语言模型（LLM）强大的文本生成能力，通过微调预训练的LLM，使其适应医疗领域的特定任务。具体来说，通过在医疗对话和对应报告的数据集上进行微调，使LLM能够学习到从对话到报告的映射关系，从而实现自动生成医疗报告的目的。

技术框架：MediGen的技术框架主要包含以下几个阶段：1) 数据收集与预处理：收集医疗对话及其对应的医疗报告，并进行清洗、格式化等预处理操作。2) 模型选择：选择合适的预训练LLM作为基础模型，本研究选择了LLaMA3-8B。3) 模型微调：使用预处理后的医疗对话-报告数据集，对LLaMA3-8B进行微调，使其适应医疗报告生成任务。4) 报告生成与评估：使用微调后的模型，根据输入的医疗对话生成医疗报告，并使用ROUGE和BERTScore等指标评估生成报告的质量。

关键创新：本研究的关键创新在于将LLaMA3-8B等先进的开源LLM应用于医疗报告自动生成任务，并验证了其有效性。与传统的基于规则或统计模型的医疗报告生成方法相比，基于LLM的方法能够更好地理解医疗对话的语义信息，生成更准确、更流畅的医疗报告。

关键设计：论文的关键设计包括：1) 选择LLaMA3-8B作为基础模型，因为它具有强大的文本生成能力和相对较小的模型规模，适合在有限的计算资源上进行微调。2) 使用ROUGE和BERTScore等指标对生成的医疗报告进行评估，这些指标能够全面衡量生成报告的准确性、流畅性和语义相似度。3) 采用标准的微调方法，没有特别定制的损失函数或网络结构。

📊 实验亮点

实验结果表明，经过微调的LLaMA3-8B模型在医疗报告生成任务上取得了显著的成果。ROUGE得分达到58%，BERTScore-F1达到72%。这些指标表明，MediGen能够生成准确且具有临床相关性的医疗报告，验证了基于LLM的医疗报告自动生成方法的可行性和有效性。

🎯 应用场景

MediGen可应用于多种医疗场景，例如辅助医生快速生成病历、出院总结、会诊记录等。通过减少医生在文档记录方面的时间投入，提高医疗效率，改善患者就医体验。未来，该技术还可扩展到其他医疗领域，例如医学教育、远程医疗等，具有广阔的应用前景。

📄 摘要（原文）

Scientific research indicates that for every hour spent in direct patient care, physicians spend nearly two additional hours on administrative tasks, particularly on electronic health records (EHRs) and desk work. This excessive administrative burden not only reduces the time available for patient care but also contributes to physician burnout and inefficiencies in healthcare delivery. To address these challenges, this study introduces MediGen, a fine-tuned large language model (LLM) designed to automate the generation of medical reports from medical dialogues. By leveraging state-of-the-art methodologies for fine-tuning open-source pretrained models, including LLaMA3-8B, MediGen achieves high accuracy in transcribing and summarizing clinical interactions. The fine-tuned LLaMA3-8B model demonstrated promising results, achieving a ROUGE score of 58% and a BERTScore-F1 of 72%, indicating its effectiveness in generating accurate and clinically relevant medical reports. These findings suggest that MediGen has the potential to significantly reduce the administrative workload on physicians, improving both healthcare efficiency and physician well-being.

Efficient Fine-Tuning of Large Language Models for Automated Medical Documentation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理