TCM-DiffRAG: Personalized Syndrome Differentiation Reasoning Method for Traditional Chinese Medicine based on Knowledge Graph and Chain of Thought
作者: Jianmin Li, Ying Chang, Su-Kit Tang, Yujia Liu, Yanwen Wang, Shuyuan Lin, Binkai Ou
分类: cs.CL, cs.AI
发布日期: 2026-02-26
💡 一句话要点
TCM-DiffRAG:融合知识图谱与思维链的中医个性化辨证论治方法
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 中医 知识图谱 思维链 检索增强生成 个性化诊断 大型语言模型 RAG 中医辨证论治
📋 核心要点
- 传统RAG方法难以应对中医临床诊断中复杂的推理过程和显著的个体差异。
- TCM-DiffRAG框架融合知识图谱与思维链,针对中医推理特点进行优化,提升RAG性能。
- 实验表明,TCM-DiffRAG显著优于原生LLM、SFT模型和其他RAG方法,尤其在非中文LLM上提升明显。
📝 摘要(中文)
本文提出了一种名为TCM-DiffRAG的创新型RAG框架,旨在解决传统RAG方法在中医临床诊疗中表现不佳的问题。该框架融合了知识图谱(KG)和思维链(CoT),以适应中医推理的复杂性和个体差异性。通过在三个不同的中医测试数据集上进行评估,实验结果表明,TCM-DiffRAG显著优于原生LLM。例如,qwen-plus模型的分数从0.927、0.361和0.038分别提升到0.952、0.788和0.356。对于非中文LLM,改进更为显著。此外,TCM-DiffRAG还优于直接监督微调(SFT)的LLM和其他基准RAG方法。研究表明,结合结构化中医知识图谱和基于思维链的推理,能够显著提高个性化诊断任务的性能,通用和个性化知识图谱的联合使用能够有效对齐通用知识和临床推理。
🔬 方法详解
问题定义:传统RAG方法在中医临床诊断与治疗领域表现不佳,主要原因是中医辨证论治过程复杂,涉及大量的专业知识和个体化差异,导致传统RAG方法难以准确检索和生成符合特定患者情况的诊断建议。现有方法无法有效利用中医知识图谱进行推理,也缺乏对个体化病情的针对性处理。
核心思路:TCM-DiffRAG的核心思路是将中医知识图谱与思维链(Chain of Thought, CoT)推理相结合,利用知识图谱提供结构化的中医知识,并通过CoT模拟中医专家的推理过程,从而提高RAG模型在中医领域的准确性和个性化水平。通过结合通用知识图谱和个性化知识图谱,实现通用知识与个体化临床推理的有效对齐。
技术框架:TCM-DiffRAG框架主要包含以下几个模块:1) 知识图谱构建模块:构建包含通用中医知识和患者个性化信息的知识图谱。2) 信息检索模块:根据用户输入的症状和体征,从知识图谱中检索相关的知识片段。3) 思维链生成模块:利用检索到的知识片段,通过CoT生成推理链,模拟中医专家的诊断过程。4) 答案生成模块:根据推理链生成最终的诊断建议和治疗方案。整个流程首先利用知识图谱增强检索,然后利用CoT进行推理,最后生成答案。
关键创新:TCM-DiffRAG的关键创新在于将知识图谱和思维链推理有机结合,并应用于中医领域。与传统的RAG方法相比,TCM-DiffRAG能够更好地利用中医知识图谱进行推理,并能够根据患者的个体化信息生成更准确的诊断建议。此外,该方法还引入了个性化知识图谱,从而更好地处理个体化差异。
关键设计:在知识图谱构建方面,论文可能使用了本体构建方法和知识抽取技术,以从大量的医学文献和临床数据中提取中医知识。在思维链生成方面,可能使用了prompt engineering技术,设计合适的prompt来引导LLM生成符合中医逻辑的推理链。具体的参数设置、损失函数和网络结构等技术细节在论文中可能没有详细描述,属于未知信息。
📊 实验亮点
实验结果表明,TCM-DiffRAG在三个中医测试数据集上均取得了显著的性能提升。例如,使用qwen-plus模型时,TCM-DiffRAG将分数从0.927、0.361和0.038分别提升到0.952、0.788和0.356。对于非中文LLM,提升更为明显。此外,TCM-DiffRAG还优于直接监督微调(SFT)的LLM和其他基准RAG方法。
🎯 应用场景
TCM-DiffRAG可应用于中医智能辅助诊断、个性化治疗方案推荐、中医知识科普等领域。通过结合知识图谱和思维链推理,该方法能够为医生提供更准确、更全面的诊断建议,提高诊疗效率和准确性。未来,该研究有望推动中医智能化发展,促进中医的传承和创新。
📄 摘要(原文)
Background: Retrieval augmented generation (RAG) technology can empower large language models (LLMs) to generate more accurate, professional, and timely responses without fine tuning. However, due to the complex reasoning processes and substantial individual differences involved in traditional Chinese medicine (TCM) clinical diagnosis and treatment, traditional RAG methods often exhibit poor performance in this domain. Objective: To address the limitations of conventional RAG approaches in TCM applications, this study aims to develop an improved RAG framework tailored to the characteristics of TCM reasoning. Methods: We developed TCM-DiffRAG, an innovative RAG framework that integrates knowledge graphs (KG) with chains of thought (CoT). TCM-DiffRAG was evaluated on three distinctive TCM test datasets. Results: The experimental results demonstrated that TCM-DiffRAG achieved significant performance improvements over native LLMs. For example, the qwen-plus model achieved scores of 0.927, 0.361, and 0.038, which were significantly enhanced to 0.952, 0.788, and 0.356 with TCM-DiffRAG. The improvements were even more pronounced for non-Chinese LLMs. Additionally, TCM-DiffRAG outperformed directly supervised fine-tuned (SFT) LLMs and other benchmark RAG methods. Conclusions: TCM-DiffRAG shows that integrating structured TCM knowledge graphs with Chain of Thought based reasoning substantially improves performance in individualized diagnostic tasks. The joint use of universal and personalized knowledge graphs enables effective alignment between general knowledge and clinical reasoning. These results highlight the potential of reasoning-aware RAG frameworks for advancing LLM applications in traditional Chinese medicine.