TCM-DiffRAG: Personalized Syndrome Differentiation Reasoning Method for Traditional Chinese Medicine based on Knowledge Graph and Chain of Thought

📄 arXiv: 2602.22828 📥 PDF

作者: Jianmin Li, Ying Chang, Su-Kit Tang, Yujia Liu, Yanwen Wang, Shuyuan Lin, Binkai Ou

分类: cs.CL, cs.AI

发布日期: 2026-02-28


💡 一句话要点

TCM-DiffRAG:基于知识图谱和思维链的中医个性化辨证论治方法

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 中医 知识图谱 检索增强生成 思维链 个性化诊断 大型语言模型 辨证论治

📋 核心要点

  1. 传统RAG方法难以应对中医临床诊断中复杂的推理过程和个体差异。
  2. TCM-DiffRAG框架融合知识图谱和思维链,提升LLM在中医领域的推理能力。
  3. 实验表明,TCM-DiffRAG显著优于原生LLM、SFT模型和其他RAG方法。

📝 摘要(中文)

本研究针对传统中医(TCM)临床诊断和治疗中复杂的推理过程和显著的个体差异,提出了TCM-DiffRAG框架,旨在改进传统检索增强生成(RAG)方法在TCM领域的应用局限性。TCM-DiffRAG集成了知识图谱(KG)和思维链(CoT),并在三个不同的TCM测试数据集上进行了评估。实验结果表明,TCM-DiffRAG显著优于原生大型语言模型(LLMs)。例如,qwen-plus模型的分数从0.927、0.361和0.038分别提升至0.952、0.788和0.356。对于非中文LLMs,改进更为显著。此外,TCM-DiffRAG也优于直接监督微调(SFT)的LLMs和其他基准RAG方法。结论表明,结合结构化TCM知识图谱和基于思维链的推理,能够显著提高个性化诊断任务的性能。通用和个性化知识图谱的联合使用,能够有效对齐通用知识和临床推理。这些结果突出了推理感知RAG框架在推动LLM在中医领域应用的潜力。

🔬 方法详解

问题定义:传统RAG方法在处理中医辨证论治问题时,由于中医知识的复杂性和个体差异性,难以生成准确、专业的回复。现有的RAG方法无法有效利用中医领域的结构化知识,并且缺乏针对个体化症状的推理能力。

核心思路:TCM-DiffRAG的核心思路是将中医知识图谱与思维链推理相结合,利用知识图谱提供结构化的中医知识,并通过思维链模拟中医的诊断推理过程。通过这种方式,模型可以更好地理解中医知识,并根据个体化症状进行推理,从而提高诊断的准确性和专业性。

技术框架:TCM-DiffRAG框架主要包含以下几个模块:1) 知识图谱构建模块:构建包含中医概念、症状、方剂等信息的知识图谱。2) 检索模块:根据用户输入的症状,从知识图谱中检索相关的知识片段。3) 思维链生成模块:利用检索到的知识片段,生成一系列推理步骤,模拟中医的诊断过程。4) 生成模块:根据思维链的推理结果,生成最终的诊断结论和治疗建议。

关键创新:TCM-DiffRAG的关键创新在于将知识图谱和思维链推理相结合,从而实现了对中医知识的结构化利用和对个体化症状的推理。与传统的RAG方法相比,TCM-DiffRAG能够更好地理解中医知识,并根据个体化症状进行推理,从而提高诊断的准确性和专业性。

关键设计:TCM-DiffRAG的关键设计包括:1) 知识图谱的构建:采用专家知识和文献挖掘相结合的方法,构建高质量的中医知识图谱。2) 检索策略:设计高效的检索策略,从知识图谱中检索相关的知识片段。3) 思维链生成:利用预训练语言模型生成思维链,并采用强化学习方法进行优化。4) 损失函数:采用交叉熵损失函数和知识图谱约束损失函数,提高模型的训练效果。

📊 实验亮点

实验结果表明,TCM-DiffRAG在三个TCM测试数据集上均取得了显著的性能提升。例如,qwen-plus模型的分数从0.927、0.361和0.038分别提升至0.952、0.788和0.356。对于非中文LLMs,改进更为显著。此外,TCM-DiffRAG也优于直接监督微调(SFT)的LLMs和其他基准RAG方法,证明了该方法的有效性。

🎯 应用场景

TCM-DiffRAG可应用于中医智能辅助诊断、个性化治疗方案推荐、中医知识科普等领域。该研究有助于提升中医诊疗的效率和准确性,促进中医知识的传承和发展,并为患者提供更优质的医疗服务。未来,该技术有望应用于远程医疗、健康管理等场景,实现中医医疗服务的智能化和普及化。

📄 摘要(原文)

Background: Retrieval augmented generation (RAG) technology can empower large language models (LLMs) to generate more accurate, professional, and timely responses without fine tuning. However, due to the complex reasoning processes and substantial individual differences involved in traditional Chinese medicine (TCM) clinical diagnosis and treatment, traditional RAG methods often exhibit poor performance in this domain. Objective: To address the limitations of conventional RAG approaches in TCM applications, this study aims to develop an improved RAG framework tailored to the characteristics of TCM reasoning. Methods: We developed TCM-DiffRAG, an innovative RAG framework that integrates knowledge graphs (KG) with chains of thought (CoT). TCM-DiffRAG was evaluated on three distinctive TCM test datasets. Results: The experimental results demonstrated that TCM-DiffRAG achieved significant performance improvements over native LLMs. For example, the qwen-plus model achieved scores of 0.927, 0.361, and 0.038, which were significantly enhanced to 0.952, 0.788, and 0.356 with TCM-DiffRAG. The improvements were even more pronounced for non-Chinese LLMs. Additionally, TCM-DiffRAG outperformed directly supervised fine-tuned (SFT) LLMs and other benchmark RAG methods. Conclusions: TCM-DiffRAG shows that integrating structured TCM knowledge graphs with Chain of Thought based reasoning substantially improves performance in individualized diagnostic tasks. The joint use of universal and personalized knowledge graphs enables effective alignment between general knowledge and clinical reasoning. These results highlight the potential of reasoning-aware RAG frameworks for advancing LLM applications in traditional Chinese medicine.