A Role-specific Guided Large Language Model for Ophthalmic Consultation Based on Stylistic Differentiation

📄 arXiv: 2407.18483v4 📥 PDF

作者: Laiyi Fu, Binbin Fan, Hongkai Du, Yanxiang Feng, Chunhua Li, Huping Song

分类: cs.CL, cs.AI

发布日期: 2024-07-26 (更新: 2024-07-31)

🔗 代码/项目: GITHUB


💡 一句话要点

EyeDoctor:基于角色引导的大语言模型用于眼科咨询,提升问答精度。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 眼科咨询 大型语言模型 角色感知 知识库 医疗问答

📋 核心要点

  1. 现有大语言模型在眼科咨询应用中,忽略了医患角色差异,导致问答精度不足。
  2. EyeDoctor通过角色感知引导和增强知识库,提升模型在眼科咨询场景下的问答准确性。
  3. 实验表明,EyeDoctor在多轮对话数据集上,Rouge-1和F1指标分别提升了7.25%和10.16%。

📝 摘要(中文)

眼科咨询对于诊断、治疗和预防眼部疾病至关重要。然而,不断增长的咨询需求超过了眼科医生的可用性。通过利用大型预训练语言模型,我们可以为特定场景设计有效的对话,从而辅助咨询。传统的问答任务微调策略由于模型规模的增大而变得不切实际,并且常常忽略了咨询过程中患者-医生角色功能。本文提出了EyeDoctor,一个眼科医疗问答大语言模型,它通过医生-患者角色感知引导和外部疾病信息增强的知识库来提高准确性。实验结果表明,EyeDoctor在眼科咨询中实现了更高的问答精度。值得注意的是,在多轮数据集上,EyeDoctor的Rouge-1得分提高了7.25%,F1得分提高了10.16%(与第二好的模型ChatGPT相比),突出了医生-患者角色区分和动态知识库扩展对于智能医疗咨询的重要性。EyeDoctor还提供免费的在线服务,源代码可在https://github.com/sperfu/EyeDoc 获取。

🔬 方法详解

问题定义:现有的大型语言模型在应用于眼科咨询时,通常采用通用的问答微调策略,忽略了医患角色在对话中的重要作用。这种忽略导致模型无法准确理解患者的问题意图,也无法生成符合医生专业身份的回答,从而降低了问答的准确性和可靠性。此外,通用模型缺乏专业的眼科知识,难以应对复杂的眼科问题。

核心思路:EyeDoctor的核心思路是引入医生-患者角色感知机制,并结合外部知识库来增强模型在眼科咨询场景下的表现。通过区分医患角色,模型可以更好地理解对话的上下文,并生成更符合角色身份的回答。同时,外部知识库的引入可以为模型提供更全面的眼科知识,从而提高问答的准确性。

技术框架:EyeDoctor的技术框架主要包括三个部分:一是大型预训练语言模型作为基础模型;二是角色感知模块,用于区分医患角色;三是外部知识库,用于提供眼科知识。在训练过程中,模型首先通过角色感知模块识别对话中的医患角色,然后根据角色信息和外部知识库生成回答。整个流程旨在模拟真实的眼科咨询过程,提高模型的实用性。

关键创新:EyeDoctor的关键创新在于医生-患者角色区分引导和动态知识库扩展。传统的问答模型通常忽略了对话参与者的角色信息,而EyeDoctor通过角色感知模块显式地建模了医患角色,从而提高了模型的理解能力。动态知识库扩展则保证了模型能够及时获取最新的眼科知识,从而提高问答的准确性。与现有方法相比,EyeDoctor更注重模拟真实的眼科咨询场景,从而提高了模型的实用性。

关键设计:EyeDoctor的关键设计包括角色感知模块的实现方式和知识库的构建方法。角色感知模块可以通过在输入文本中添加角色标签来实现,例如在患者的问题前添加“[Patient]”,在医生的回答前添加“[Doctor]”。知识库的构建可以采用多种方式,例如从医学文献中提取知识,或者利用现有的医学知识图谱。此外,损失函数的设计也需要考虑角色信息,例如可以对医生回答的准确性给予更高的权重。

📊 实验亮点

EyeDoctor在多轮眼科咨询数据集上取得了显著的性能提升。与ChatGPT相比,EyeDoctor的Rouge-1得分提高了7.25%,F1得分提高了10.16%。这些结果表明,医生-患者角色区分和动态知识库扩展对于智能医疗咨询至关重要。此外,EyeDoctor还提供免费的在线服务,方便用户体验。

🎯 应用场景

EyeDoctor可应用于在线眼科咨询平台,缓解眼科医生资源不足的现状,为患者提供初步的眼科健康咨询服务。它还可以作为眼科医生的辅助工具,帮助医生快速检索相关知识,提高诊断效率。未来,EyeDoctor有望扩展到其他医疗领域,为更多患者提供便捷的医疗咨询服务。

📄 摘要(原文)

Ophthalmology consultations are crucial for diagnosing, treating, and preventing eye diseases. However, the growing demand for consultations exceeds the availability of ophthalmologists. By leveraging large pre-trained language models, we can design effective dialogues for specific scenarios, aiding in consultations. Traditional fine-tuning strategies for question-answering tasks are impractical due to increasing model size and often ignoring patient-doctor role function during consultations. In this paper, we propose EyeDoctor, an ophthalmic medical questioning large language model that enhances accuracy through doctor-patient role perception guided and an augmented knowledge base with external disease information. Experimental results show EyeDoctor achieves higher question-answering precision in ophthalmology consultations. Notably, EyeDoctor demonstrated a 7.25% improvement in Rouge-1 scores and a 10.16% improvement in F1 scores on multi-round datasets compared to second best model ChatGPT, highlighting the importance of doctor-patient role differentiation and dynamic knowledge base expansion for intelligent medical consultations. EyeDoc also serves as a free available web based service and souce code is available at https://github.com/sperfu/EyeDoc.