Research on the Proximity Relationships of Psychosomatic Disease Knowledge Graph Modules Extracted by Large Language Models

📄 arXiv: 2412.18419v1 📥 PDF

作者: Zihan Zhou, Ziyi Zeng, Wenhao Jiang, Yihui Zhu, Jiaxin Mao, Yonggui Yuan, Min Xia, Shubin Zhao, Mengyu Yao, Yunqian Chen

分类: cs.AI

发布日期: 2024-12-24


💡 一句话要点

利用大语言模型提取的心身疾病知识图谱模块邻近关系研究,为诊疗提供新视角。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 心身疾病 知识图谱 大型语言模型 命名实体识别 网络距离 LoRA调优

📋 核心要点

  1. 心身疾病日益普遍,但缺乏有效的知识系统和分析方法辅助诊疗。
  2. 利用BERT和LoRA调优的LLM构建心身疾病知识图谱,分析模块间网络距离。
  3. 发现疾病间、症状间距离与临床表现、共现概率相关,为诊疗提供参考。

📝 摘要(中文)

随着社会变革加速,心身疾病发病率显著增加,成为全球健康领域的重要挑战。本文旨在构建创新性的知识体系和分析方法,辅助心身疾病的诊断和治疗。研究建立了本体模型和实体类型,使用BERT模型和LoRA调优的LLM进行命名实体识别,构建了包含9668个三元组的知识图谱。通过分析疾病、症状和药物模块之间的网络距离,发现疾病间更近的网络距离可以预测其临床表现、治疗方法和心理机制的相似性,症状间更近的距离表明它们更可能共现。通过比较邻近度d和邻近度z分数,发现主要诊断关系中的症状-疾病对具有更强的关联性和更高的参考价值。研究结果揭示了疾病之间的潜在联系、共发症状以及治疗策略的相似性,为心身疾病的诊断和治疗提供了新的视角,并为未来的精神健康研究和实践提供了有价值的信息。

🔬 方法详解

问题定义:现有心身疾病的诊断和治疗缺乏系统性的知识支撑,难以有效应对日益增长的患者需求。传统方法依赖于专家经验,难以发现疾病、症状和治疗方法之间的潜在关联,导致诊断效率低下和治疗方案的局限性。因此,需要构建一个能够整合和分析心身疾病相关知识的系统,从而为临床决策提供更全面的依据。

核心思路:本文的核心思路是利用大型语言模型(LLM)从医学文献中提取心身疾病相关的实体和关系,构建知识图谱,并通过分析知识图谱中不同模块(疾病、症状、药物)之间的网络距离,揭示疾病之间的潜在联系、共发症状以及治疗策略的相似性。这种方法能够将分散的医学知识整合起来,并通过量化的方式分析它们之间的关联,从而为临床医生提供更客观、更全面的决策支持。

技术框架:该研究的技术框架主要包括以下几个阶段:1) 本体模型构建和实体类型定义;2) 使用BERT模型和LoRA调优的LLM进行命名实体识别;3) 基于识别结果构建知识图谱,包含疾病、症状、药物等实体以及它们之间的关系;4) 分析知识图谱中疾病、症状和药物模块之间的网络距离;5) 比较邻近度d和邻近度z分数,评估症状-疾病对的关联强度。

关键创新:该研究的关键创新在于将大型语言模型应用于心身疾病知识图谱的构建,并利用网络距离分析方法揭示疾病、症状和治疗方法之间的潜在关联。与传统方法相比,该方法能够更高效地从海量医学文献中提取知识,并利用量化的方式分析知识之间的关联,从而为临床决策提供更客观、更全面的依据。此外,LoRA调优的使用降低了LLM的训练成本,使其更易于应用于实际场景。

关键设计:在命名实体识别阶段,研究人员使用了BERT模型和LoRA调优的LLM。LoRA (Low-Rank Adaptation) 是一种参数高效的微调方法,它通过学习低秩矩阵来更新预训练模型的权重,从而降低了训练成本。在知识图谱构建阶段,研究人员定义了多种实体类型和关系类型,并根据医学文献中的信息构建了包含9668个三元组的知识图谱。在网络距离分析阶段,研究人员使用了多种距离度量方法,例如最短路径距离和余弦相似度,来评估不同模块之间的关联强度。

📊 实验亮点

研究构建了包含9668个三元组的心身疾病知识图谱,并通过分析网络距离发现疾病间、症状间距离与临床表现、共现概率相关。比较邻近度d和z分数,发现主要诊断关系中的症状-疾病对具有更强的关联性。这些发现为心身疾病的诊断和治疗提供了新的视角。

🎯 应用场景

该研究成果可应用于心身疾病的辅助诊断、治疗方案推荐和个性化健康管理。通过知识图谱,医生可以更全面地了解患者的病情,发现潜在的疾病关联和共发症状,从而制定更有效的治疗方案。此外,该研究还可以为精神健康研究提供新的视角和数据支持,促进心身疾病领域的学术发展。

📄 摘要(原文)

As social changes accelerate, the incidence of psychosomatic disorders has significantly increased, becoming a major challenge in global health issues. This necessitates an innovative knowledge system and analytical methods to aid in diagnosis and treatment. Here, we establish the ontology model and entity types, using the BERT model and LoRA-tuned LLM for named entity recognition, constructing the knowledge graph with 9668 triples. Next, by analyzing the network distances between disease, symptom, and drug modules, it was found that closer network distances among diseases can predict greater similarities in their clinical manifestations, treatment approaches, and psychological mechanisms, and closer distances between symptoms indicate that they are more likely to co-occur. Lastly, by comparing the proximity d and proximity z score, it was shown that symptom-disease pairs in primary diagnostic relationships have a stronger association and are of higher referential value than those in diagnostic relationships. The research results revealed the potential connections between diseases, co-occurring symptoms, and similarities in treatment strategies, providing new perspectives for the diagnosis and treatment of psychosomatic disorders and valuable information for future mental health research and practice.