MedCT: A Clinical Terminology Graph for Generative AI Applications in Healthcare

📄 arXiv: 2501.06465v3 📥 PDF

作者: Ye Chen, Dongdong Huang, Haoyun Xu, Cong Fu, Lin Sheng, Qingli Zhou, Yuqiang Shen, Kai Wang

分类: cs.CL, cs.AI

发布日期: 2025-01-11 (更新: 2025-04-10)

备注: Accepted into ICCS 2025 and published in Springer's LNCS Series


💡 一句话要点

提出MedCT:首个面向中文医疗的临床术语知识图谱,赋能生成式AI医疗应用。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 临床术语 知识图谱 中文医疗 自然语言处理 大型语言模型 实体链接 电子病历

📋 核心要点

  1. 现有临床术语体系对中文支持不足,限制了中文医疗数据的标准化和AI应用。
  2. 构建MedCT临床术语知识图谱,结合MedBERT和MedLink模型,实现中文临床数据的有效表示和链接。
  3. 实验表明,MedCT在语义匹配和实体链接任务中达到SOTA,并成功应用于EHR生成和医学文档搜索。

📝 摘要(中文)

本文介绍了首个面向中文医疗社区的临床术语体系MedCT,以及配套的临床基础模型MedBERT和实体链接模型MedLink。MedCT系统实现了中文临床数据的标准化和可编程表示,从而促进新药研发、治疗路径优化,并改善中国患者的治疗效果。此外,MedCT知识图谱提供了一种原则性机制,可最大限度地减少大型语言模型(LLM)的幻觉问题,从而在基于LLM的临床应用中实现显著的准确性和安全性。借助LLM的生成性和表达能力,我们能够在三个月内快速构建生产质量的术语系统并部署到实际临床领域,而像SNOMED CT这样的经典术语体系已经经历了二十多年的发展。实验表明,MedCT系统在语义匹配和实体链接任务中实现了最先进(SOTA)的性能,不仅适用于中文,也适用于英文。我们还通过将MedCT和LLM应用于一系列代表性的临床任务(包括电子病历(EHR)自动生成和用于诊断决策的医学文档搜索)进行了纵向现场实验。研究表明,MedCT在临床工作流程和患者治疗效果方面具有多种价值,尤其是在新型临床LLM应用中。我们以足够的工程细节介绍了我们的方法,以便其他非英语社会可以轻松地复制临床术语的实现。我们公开了我们的术语、模型和算法,以及用于开发的真实临床数据集。

🔬 方法详解

问题定义:现有临床术语体系,如SNOMED CT,主要面向英文,对中文医疗数据的支持不足,导致中文医疗数据的标准化、共享和利用面临挑战。这限制了人工智能,特别是大型语言模型(LLM)在中文医疗领域的应用,例如电子病历自动生成、辅助诊断等,并且LLM容易产生幻觉,影响医疗决策的准确性。

核心思路:论文的核心思路是构建一个专门面向中文医疗领域的临床术语知识图谱MedCT,并结合预训练语言模型MedBERT和实体链接模型MedLink,实现中文临床数据的标准化表示和语义理解。通过知识图谱的约束,减少LLM的幻觉,提高其在医疗应用中的准确性和安全性。这种设计旨在弥合现有术语体系在中文支持上的不足,并为中文医疗AI应用提供坚实的基础。

技术框架:MedCT系统包含三个主要组成部分:MedCT知识图谱、MedBERT预训练语言模型和MedLink实体链接模型。首先,人工构建MedCT知识图谱,包含疾病、症状、药物等临床概念及其相互关系。然后,使用大规模中文医疗文本数据预训练MedBERT模型,使其具备理解和生成中文医疗文本的能力。最后,训练MedLink模型,用于将非结构化的医疗文本中的实体链接到MedCT知识图谱中的对应概念。整个流程旨在实现中文临床数据的标准化表示和语义理解,为后续的AI应用提供支持。

关键创新:该论文的关键创新在于构建了首个面向中文医疗领域的临床术语知识图谱MedCT。与现有方法相比,MedCT专门针对中文医疗数据设计,能够更好地表示中文临床概念及其关系。此外,结合MedBERT和MedLink模型,实现了端到端的中文医疗数据处理流程,提高了AI模型在中文医疗领域的应用效果。通过知识图谱约束,有效减少了LLM的幻觉问题,提高了医疗决策的准确性。

关键设计:MedCT知识图谱的构建采用了人工标注和专家审核相结合的方式,保证了术语的准确性和完整性。MedBERT模型采用了Transformer架构,并使用大规模中文医疗文本数据进行预训练,使其具备强大的语义理解能力。MedLink模型采用了基于深度学习的实体链接方法,能够准确地将非结构化文本中的实体链接到MedCT知识图谱中的对应概念。损失函数方面,采用了交叉熵损失函数和对比学习损失函数,以提高模型的准确性和泛化能力。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

MedCT系统在语义匹配和实体链接任务中取得了SOTA性能,不仅适用于中文,也适用于英文。在电子病历自动生成和医学文档搜索等实际临床应用中,MedCT显著提高了效率和准确性。纵向现场实验表明,MedCT在临床工作流程和患者治疗效果方面具有多种价值。该研究还开源了MedCT术语、模型、算法和真实临床数据集,为中文医疗AI研究提供了宝贵的资源。

🎯 应用场景

MedCT系统可广泛应用于电子病历自动生成、医学文档搜索、辅助诊断、药物研发等领域。通过提供标准化的中文临床数据表示,MedCT能够促进医疗数据的共享和利用,提高医疗效率和质量。此外,MedCT还可以作为LLM在医疗领域应用的基础,减少LLM的幻觉问题,提高医疗决策的准确性和安全性。未来,MedCT有望成为中文医疗AI应用的重要基础设施。

📄 摘要(原文)

We introduce the world's first clinical terminology for the Chinese healthcare community, namely MedCT, accompanied by a clinical foundation model MedBERT and an entity linking model MedLink. The MedCT system enables standardized and programmable representation of Chinese clinical data, successively stimulating the development of new medicines, treatment pathways, and better patient outcomes for the populous Chinese community. Moreover, the MedCT knowledge graph provides a principled mechanism to minimize the hallucination problem of large language models (LLMs), therefore achieving significant levels of accuracy and safety in LLM-based clinical applications. By leveraging the LLMs' emergent capabilities of generativeness and expressiveness, we were able to rapidly built a production-quality terminology system and deployed to real-world clinical field within three months, while classical terminologies like SNOMED CT have gone through more than twenty years development. Our experiments show that the MedCT system achieves state-of-the-art (SOTA) performance in semantic matching and entity linking tasks, not only for Chinese but also for English. We also conducted a longitudinal field experiment by applying MedCT and LLMs in a representative spectrum of clinical tasks, including electronic health record (EHR) auto-generation and medical document search for diagnostic decision making. Our study shows a multitude of values of MedCT for clinical workflows and patient outcomes, especially in the new genre of clinical LLM applications. We present our approach in sufficient engineering detail, such that implementing a clinical terminology for other non-English societies should be readily reproducible. We openly release our terminology, models and algorithms, along with real-world clinical datasets for the development.