Knowledge-Guided Large Language Model for Automatic Pediatric Dental Record Understanding and Safe Antibiotic Recommendation

📄 arXiv: 2512.09127v1 📥 PDF

作者: Zihan Han, Junyan Ge, Caifeng Li

分类: cs.CL, cs.AI

发布日期: 2025-12-09


💡 一句话要点

提出知识引导的大型语言模型以解决儿童牙科记录理解和安全抗生素推荐问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 儿童牙科 知识图谱 大型语言模型 抗生素推荐 临床决策支持 安全验证 检索增强生成 命名实体识别

📋 核心要点

  1. 现有的基于规则的临床决策支持系统在处理儿童牙科记录时面临非结构化数据和安全约束的挑战。
  2. 本研究提出KG-LLM,通过结合知识图谱和多阶段验证机制,提升儿童牙科记录的理解和抗生素推荐的安全性。
  3. 在32000个去标识化的儿童牙科就诊记录上,KG-LLM在记录理解和药物剂量准确性上均显著优于基线模型。

📝 摘要(中文)

儿童牙科临床记录的准确解读和安全抗生素开处方仍然是牙科信息学中的持续挑战。传统的基于规则的临床决策支持系统在处理非结构化的牙科叙述、缺失的放射学描述和复杂的安全约束方面存在困难。为了解决这些问题,本研究提出了一种知识引导的大型语言模型(KG-LLM),该模型集成了儿童牙科知识图谱、检索增强生成(RAG)和多阶段安全验证管道,以实现基于证据的抗生素推荐。实验结果表明,该方法在记录理解、药物剂量准确性和减少不安全抗生素建议方面均表现出显著的效果。

🔬 方法详解

问题定义:本论文旨在解决儿童牙科临床记录的准确解读和安全抗生素开处方的问题。现有方法在处理非结构化数据和复杂安全约束时表现不佳,导致临床决策的可靠性降低。

核心思路:论文提出的KG-LLM通过集成儿童牙科知识图谱、检索增强生成(RAG)和多阶段安全验证机制,旨在提升记录理解的准确性和抗生素推荐的安全性。这样的设计使得模型能够在复杂的临床环境中提供基于证据的决策支持。

技术框架:KG-LLM的整体架构包括多个模块:首先,临床命名实体识别(NER)和关系提取(RE)模块从牙科记录中提取结构化实体和关系;其次,从知识图谱中检索相关的指南和药物安全规则;最后,通过双层验证机制确保推荐的安全性。

关键创新:KG-LLM的主要创新在于其知识图谱的集成和多阶段的安全验证机制,这与传统的基于规则的方法形成了鲜明对比,显著提升了模型的解释性和可靠性。

关键设计:在模型设计中,采用了特定的损失函数来优化实体识别和关系提取的准确性,同时在安全验证中结合了确定性规则检查和学习分类器,以检测过敏、禁忌症和剂量错误。通过这些设计,KG-LLM在临床应用中表现出更高的可靠性。

📊 实验亮点

在32000个去标识化的儿童牙科就诊记录上,KG-LLM在记录理解性能上取得了F1值0.914,相较于基线模型Llama-2的0.867有显著提升。同时,药物剂量准确性Top-1达到了0.782,较基线的0.716也有明显改善。此外,该系统还成功减少了50%的不安全抗生素建议,验证了其有效性和安全性。

🎯 应用场景

该研究的潜在应用领域包括儿童牙科临床实践、医疗决策支持系统以及牙科教育。通过提升儿童牙科记录的理解能力和抗生素推荐的安全性,KG-LLM能够帮助牙科医生做出更为准确的临床决策,降低医疗风险,最终提高患者的安全性和治疗效果。

📄 摘要(原文)

Accurate interpretation of pediatric dental clinical records and safe antibiotic prescribing remain persistent challenges in dental informatics. Traditional rule-based clinical decision support systems struggle with unstructured dental narratives, incomplete radiographic descriptions, and complex safety constraints. To address these limitations, this study proposes a Knowledge-Guided Large Language Model (KG-LLM) that integrates a pediatric dental knowledge graph, retrieval-augmented generation (RAG), and a multi-stage safety validation pipeline for evidence-grounded antibiotic recommendation. The framework first employs a clinical NER/RE module to extract structured entities and relations from dental notes and radiology reports. Relevant guidelines, drug-safety rules, and analogous historical cases are subsequently retrieved from the knowledge graph and supplied to the LLM for diagnostic summarization and dose-drug-duration prediction. Safety assurance is achieved through a dual-layer validation mechanism combining deterministic rule checking with a learned classifier for detecting allergies, contraindications, and dosing errors. Experiments on 32,000 de-identified pediatric dental visit records demonstrate the effectiveness of the proposed approach. Compared with a domain-adapted Llama-2 clinical baseline, KG-LLM improves record-understanding performance (F1: 0.914 vs. 0.867), drug-dose-duration accuracy (Top-1: 0.782 vs. 0.716), and reduces unsafe antibiotic suggestions by 50%. Additional evaluation across summary quality, recommendation accuracy, and global safety scores further confirms the robustness of the system. Ablation analyses indicate that the knowledge graph, RAG, and safety modules each contribute substantially to clinical reliability and interpretability.