DongYuan: An LLM-Based Framework for Integrative Chinese and Western Medicine Spleen-Stomach Disorders Diagnosis
作者: Hua Li, Yingying Li, Xiaobin Feng, Xinyi Fu, Lifeng Dong, Qingfeng Yang, Yanzhe Chen, Xiaoju Feng, Zhidong Cao, Jianbin Guo, Yanru Du
分类: cs.CL
发布日期: 2026-03-30
备注: 13 pages, 6 figures
💡 一句话要点
DongYuan:一个基于LLM的中西医结合脾胃病诊断框架
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 中西医结合 脾胃病诊断 大型语言模型 监督微调 直接偏好优化 医疗人工智能 数据集构建
📋 核心要点
- 现有方法缺乏高质量的中西医结合脾胃病数据,限制了LLM在该领域的应用。
- DongYuan框架通过构建数据集、训练核心诊断LLM和导航模型,实现中西医结合的诊断。
- 实验表明,DongYuan框架中的SSDF-Core在脾胃病诊断基准测试中显著优于现有模型。
📝 摘要(中文)
脾胃疾病的临床负担巨大。大型语言模型(LLMs)为医疗应用提供了新的潜力,但在中西医结合(ICWM)的背景下,它们面临三个主要挑战:缺乏高质量的数据,缺乏能够有效整合中医辨证论治和西医疾病诊断推理逻辑的模型,以及缺乏标准化的评估基准。为了解决这些相互关联的挑战,我们提出了DongYuan,一个ICWM脾胃诊断框架。具体来说,我们整理了三个ICWM数据集(SSDF-Syndrome、SSDF-Dialogue和SSDF-PD),以填补高质量脾胃疾病数据的空白。然后,我们开发了SSDF-Core,一个核心诊断LLM,它通过监督微调(SFT)和直接偏好优化(DPO)的两阶段训练方案获得了强大的ICWM推理能力,并辅以SSDF-Navigator,一个可插拔的咨询导航模型,旨在优化临床询问策略。此外,我们还建立了SSDF-Bench,一个专注于ICWM脾胃疾病诊断的综合评估基准。实验结果表明,SSDF-Core在SSDF-Bench上显著优于12个主流基线。DongYuan为未来智能ICWM诊断系统的开发奠定了坚实的方法论基础,并提供了实用的技术参考。
🔬 方法详解
问题定义:论文旨在解决中西医结合(ICWM)脾胃病诊断中,大型语言模型(LLM)面临的数据匮乏、推理逻辑融合困难以及缺乏标准化评估基准的问题。现有方法无法有效整合中医辨证论治和西医疾病诊断的推理逻辑,导致诊断准确率不高。
核心思路:论文的核心思路是构建一个完整的ICWM脾胃病诊断框架,包括高质量数据集、核心诊断LLM和咨询导航模型。通过两阶段训练方案,使LLM具备强大的ICWM推理能力,并利用导航模型优化临床询问策略,从而提高诊断准确率。
技术框架:DongYuan框架包含三个主要组成部分:1) ICWM数据集(SSDF-Syndrome、SSDF-Dialogue和SSDF-PD),用于提供高质量的训练数据;2) 核心诊断LLM(SSDF-Core),通过监督微调(SFT)和直接偏好优化(DPO)进行训练,具备ICWM推理能力;3) 咨询导航模型(SSDF-Navigator),用于优化临床询问策略。整体流程是,首先利用数据集训练SSDF-Core和SSDF-Navigator,然后利用SSDF-Navigator引导临床询问,最后由SSDF-Core进行诊断。
关键创新:该论文的关键创新在于:1) 构建了高质量的ICWM脾胃病数据集,填补了数据空白;2) 提出了SSDF-Core,一个能够有效整合中医辨证论治和西医疾病诊断推理逻辑的LLM;3) 设计了SSDF-Navigator,用于优化临床询问策略,提高诊断效率。
关键设计:SSDF-Core的训练采用两阶段方案:首先使用监督微调(SFT)使模型学习ICWM知识,然后使用直接偏好优化(DPO)进一步提升模型的推理能力。SSDF-Navigator的具体实现细节(如网络结构、损失函数等)在论文中未详细描述,属于未知信息。
🖼️ 关键图片
📊 实验亮点
实验结果表明,DongYuan框架中的SSDF-Core在SSDF-Bench上显著优于12个主流基线模型。具体性能数据和提升幅度在摘要中未明确给出,属于未知信息。但结论表明,该框架在ICWM脾胃病诊断方面具有显著优势。
🎯 应用场景
该研究成果可应用于智能中医诊断系统、辅助医生进行脾胃病诊断、提供个性化治疗方案等方面。通过整合中医和西医的优势,有望提高脾胃病诊断的准确性和效率,改善患者的治疗效果,并为中西医结合的智能化发展提供技术支持。
📄 摘要(原文)
The clinical burden of spleen-stomach disorders is substantial. While large language models (LLMs) offer new potential for medical applications, they face three major challenges in the context of integrative Chinese and Western medicine (ICWM): a lack of high-quality data, the absence of models capable of effectively integrating the reasoning logic of traditional Chinese medicine (TCM) syndrome differentiation with that of Western medical (WM) disease diagnosis, and the shortage of a standardized evaluation benchmark. To address these interrelated challenges, we propose DongYuan, an ICWM spleen-stomach diagnostic framework. Specifically, three ICWM datasets (SSDF-Syndrome, SSDF-Dialogue, and SSDF-PD) were curated to fill the gap in high-quality data for spleen-stomach disorders. We then developed SSDF-Core, a core diagnostic LLM that acquires robust ICWM reasoning capabilities through a two-stage training regimen of supervised fine-tuning. tuning (SFT) and direct preference optimization (DPO), and complemented it with SSDF-Navigator, a pluggable consultation navigation model designed to optimize clinical inquiry strategies. Additionally, we established SSDF-Bench, a comprehensive evaluation benchmark focused on ICWM diagnosis of spleen-stomach disorders. Experimental results demonstrate that SSDF-Core significantly outperforms 12 mainstream baselines on SSDF-Bench. DongYuan lays a solid methodological foundation and provides practical technical references for the future development of intelligent ICWM diagnostic systems.