XGRAG: A Graph-Native Framework for Explaining KG-based Retrieval-Augmented Generation

📄 arXiv: 2604.24623v1 📥 PDF

作者: Zhuoling Li, Ha Linh Hong Tran Nguyen, Valeria Bladinieres, Maxim Romanovsky

分类: cs.AI, cs.IR, cs.LG

发布日期: 2026-04-27


💡 一句话要点

提出XGRAG框架,通过图扰动解释知识图谱增强的检索增强生成

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 检索增强生成 知识图谱 可解释性 图神经网络 图扰动

📋 核心要点

  1. 现有RAG的可解释性方法主要针对文本检索,无法有效解释GraphRAG中知识图谱结构对生成结果的影响。
  2. XGRAG通过图扰动策略量化知识图谱中各个组件对模型答案的贡献,从而提供因果关系明确的解释。
  3. 实验表明,XGRAG在解释质量上优于现有方法,并且其解释与图的中心性度量具有很强的相关性。

📝 摘要(中文)

基于图的检索增强生成(GraphRAG)通过使用知识图谱(KG)为大型语言模型(LLM)提供结构化、语义连贯的上下文,扩展了传统的RAG,从而产生更可靠的答案。然而,GraphRAG的推理过程仍然是一个黑盒,限制了我们理解特定结构化知识如何影响最终输出的能力。现有的RAG系统可解释性(XAI)方法是为基于文本的检索设计的,仅限于通过知识组件之间的关系结构来解释LLM的响应,这在透明度和可信度方面造成了严重差距。为了解决这个问题,我们引入了XGRAG,这是一个新颖的框架,它通过采用基于图的扰动策略,为GraphRAG系统生成因果关系明确的解释,以量化单个图组件对模型答案的贡献。我们进行了广泛的实验,将XGRAG与标准RAG的XAI基线RAG-Ex进行比较,并评估了其在各种问题类型、叙事结构和LLM上的鲁棒性。结果表明,在NarrativeQA、FairyTaleQA和TriviaQA上,XGRAG的解释质量比基线RAG-Ex提高了14.81%,这是通过F1分数来衡量生成的解释与原始答案之间的一致性。此外,XGRAG解释与图中心性度量表现出很强的相关性,验证了其捕获图结构的能力。XGRAG通过透明的、基于图的解释,增强了RAG系统的可解释性,从而为可信赖的AI提供了一种可扩展和通用的方法。

🔬 方法详解

问题定义:论文旨在解决GraphRAG系统缺乏透明性和可解释性的问题。现有的RAG可解释性方法主要针对文本检索,无法有效解释知识图谱的结构化信息如何影响最终的生成结果。这限制了用户对GraphRAG系统输出的信任,并阻碍了对系统内部推理过程的理解。

核心思路:论文的核心思路是通过图扰动来量化知识图谱中各个组件对最终生成结果的贡献。具体来说,通过选择性地移除或修改图中的节点或边,观察LLM生成答案的变化,从而推断出这些组件对答案的重要性。这种方法能够提供因果关系明确的解释,帮助用户理解GraphRAG的推理过程。

技术框架:XGRAG框架主要包含以下几个阶段:1) 知识图谱构建:从给定的上下文信息中构建知识图谱。2) 问题输入与检索:将问题输入到GraphRAG系统,并从知识图谱中检索相关信息。3) 图扰动:采用不同的图扰动策略,例如节点删除、边删除等,生成多个扰动后的知识图谱。4) 答案生成:使用扰动后的知识图谱作为上下文,让LLM生成答案。5) 解释生成:比较原始答案和扰动后生成的答案,量化每个图组件对答案的影响,并生成相应的解释。

关键创新:XGRAG的关键创新在于其基于图扰动的解释方法。与传统的基于文本的RAG解释方法不同,XGRAG能够直接分析知识图谱的结构化信息,并量化各个图组件对最终生成结果的贡献。这种方法能够提供更准确、更细粒度的解释,帮助用户更好地理解GraphRAG的推理过程。

关键设计:XGRAG的关键设计包括:1) 图扰动策略:论文探索了多种图扰动策略,例如随机节点删除、基于中心性的节点删除等。2) 贡献度量:论文定义了多种贡献度量,用于量化每个图组件对答案的影响。例如,可以使用答案的相似度变化来衡量组件的重要性。3) 解释生成:论文使用自然语言生成技术,将量化的贡献度转化为易于理解的解释文本。

📊 实验亮点

实验结果表明,XGRAG在NarrativeQA、FairyTaleQA和TriviaQA数据集上,相比于基线RAG-Ex,解释质量的F1分数提高了14.81%。此外,XGRAG生成的解释与图的中心性度量具有很强的相关性,验证了其能够有效捕获知识图谱的结构信息。

🎯 应用场景

XGRAG可应用于各种需要知识图谱增强的检索增强生成场景,例如问答系统、对话系统、推荐系统等。通过提供透明的解释,XGRAG可以提高用户对这些系统的信任度,并帮助开发者更好地理解和改进系统性能。此外,XGRAG还可以用于知识图谱的质量评估和知识发现。

📄 摘要(原文)

Graph-based Retrieval-Augmented Generation (GraphRAG) extends traditional RAG by using knowledge graphs (KGs) to give large language models (LLMs) a structured, semantically coherent context, yielding more grounded answers. However, GraphRAG reasoning process remains a black-box, limiting our ability to understand how specific pieces of structured knowledge influence the final output. Existing explainability (XAI) methods for RAG systems, designed for text-based retrieval, are limited to interpreting an LLM response through the relational structures among knowledge components, creating a critical gap in transparency and trustworthiness. To address this, we introduce XGRAG, a novel framework that generates causally grounded explanations for GraphRAG systems by employing graph-based perturbation strategies, to quantify the contribution of individual graph components on the model answer. We conduct extensive experiments comparing XGRAG against RAG-Ex, an XAI baseline for standard RAG, and evaluate its robustness across various question types, narrative structures and LLMs. Our results demonstrate a 14.81% improvement in explanation quality over the baseline RAG-Ex across NarrativeQA, FairyTaleQA, and TriviaQA, evaluated by F1-score measuring alignment between generated explanations and original answers. Furthermore, XGRAG explanations exhibit a strong correlation with graph centrality measures, validating its ability to capture graph structure. XGRAG provides a scalable and generalizable approach towards trustworthy AI through transparent, graph-based explanations that enhance the interpretability of RAG systems.