Text-Graph Synergy: A Bidirectional Verification and Completion Framework for RAG

📄 arXiv: 2605.05643v1 📥 PDF

作者: Jiarui Zhong, Hong Cai Chen

分类: cs.AI, cs.IR

发布日期: 2026-05-07

备注: 12 pages, 3 figures


💡 一句话要点

提出TGS-RAG框架,通过文本与知识图谱的双向协同机制解决RAG中的信息孤岛与推理路径丢失问题。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 检索增强生成 知识图谱 多跳推理 信息检索 大语言模型 知识增强

📋 核心要点

  1. 现有RAG方法面临文本检索噪声大、图谱搜索剪枝导致推理路径丢失,以及两者间缺乏深度协同导致的信息孤岛问题。
  2. TGS-RAG引入双向协同机制,通过图到文本的全局投票过滤噪声,并利用文本线索通过孤立实体桥接算法恢复关键推理路径。
  3. 实验表明,该框架在多跳推理任务中显著提升了检索精度与计算效率,有效平衡了非结构化文本与结构化知识的互补优势。

📝 摘要(中文)

检索增强生成(RAG)已成为提升大语言模型事实依据与多跳推理能力的核心范式。传统的基于文本的RAG常检索到逻辑无关的伪证据,而基于图的RAG常因搜索时的剪枝操作导致潜在有效推理路径被丢弃。现有的混合方法多采用简单的证据拼接或单向增强,未能解决非结构化文本与结构化图谱之间推理流不对称导致的“信息孤岛”问题。本文提出了TGS-RAG框架,通过双向协同机制实现增强:一是“图到文本”通道,利用全局投票策略对图节点进行重排序并精炼文本证据,过滤语义噪声;二是“文本到图”通道,利用基于记忆的孤立实体桥接算法,根据文本线索主动恢复被剪枝的有效推理路径,且无需额外数据库开销。在多个多跳推理基准测试中,TGS-RAG显著优于现有SOTA方法,实现了检索精度与计算效率的平衡。

🔬 方法详解

问题定义:论文旨在解决RAG系统中非结构化文本与结构化知识图谱(KG)之间存在的信息孤岛问题。现有痛点在于:纯文本检索易引入逻辑无关的伪证据,而基于KG的检索因搜索时剪枝策略过于激进,常导致关键推理路径被提前丢弃。

核心思路:论文提出TGS-RAG框架,核心在于建立文本与图谱的双向协同(Synergy)。通过双向信息流互补,利用图谱的结构化约束修正文本检索的偏差,同时利用文本的语义丰富性指导图谱的路径恢复,从而实现推理能力的闭环增强。

技术框架:框架包含两个核心通道:一是“图到文本”通道,通过访问图节点进行全局投票,对检索到的文本证据进行重排序与精炼;二是“文本到图”通道,引入“基于记忆的孤立实体桥接(Memory-based Orphan Entity Bridging)”算法,根据文本线索主动“复活”被剪枝的推理路径。

关键创新:最重要的创新在于双向验证与补全机制。不同于简单的特征拼接,该方法通过动态的反馈回路,将图谱的结构化逻辑作为文本检索的“过滤器”,并将文本的语义上下文作为图谱搜索的“导航器”,有效解决了推理流不对称问题。

关键设计:关键技术细节包括全局投票策略(Global Voting Strategy),用于量化图节点对文本证据的支撑度;以及孤立实体桥接算法,该算法利用搜索历史中的记忆信息,无需额外查询数据库即可实现推理路径的重构,显著降低了计算开销。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

TGS-RAG在多个多跳推理基准测试中表现优异,显著超越了现有的混合检索基线。实验数据表明,该方法在保持较低计算开销的同时,大幅提升了检索精度(Precision)与召回率(Recall),有效解决了长链条推理中的路径丢失难题,实现了检索效率与推理质量的帕累托最优。

🎯 应用场景

该研究适用于需要高精度多跳推理的复杂问答系统,如医疗诊断辅助、法律文档分析及企业级知识库管理。通过提升检索证据的逻辑相关性,该框架能显著降低大模型在处理复杂事实性问题时的幻觉,提升决策支持系统的可靠性与可解释性。

📄 摘要(原文)

Retrieval-Augmented Generation (RAG) has become a core paradigm for enhancing factual grounding and multi-hop reasoning in Large Language Models (LLMs). Traditional text-based RAG often retrieves logically irrelevant pseudo-evidence, while graph-based RAG is frequently hindered by search-time pruning, which may discard potentially valid reasoning paths. Existing hybrid approaches primarily adopt simple evidence concatenation or unidirectional enhancement, which fails to address the fundamental "Information Island" problem caused by asymmetric reasoning flows between unstructured text and structured graphs. We propose \textbf{TGS-RAG}, a unified framework for \textbf{T}ext-\textbf{G}raph \textbf{S}ynergistic enhancement. TGS-RAG introduces a bidirectional mechanism: (i) a \textbf{Graph-to-Text} channel that employs a Global Voting strategy from visited graph nodes to re-rank and refine textual evidence, filtering out semantic noise; and (ii) a \textbf{Text-to-Graph} channel that utilizes the \textbf{Memory-based Orphan Entity Bridging} algorithm. This algorithm utilizes textual cues to proactively resurrect valid but previously pruned reasoning paths from the search history without additional database overhead. Experimental results on multiple multi-hop reasoning benchmarks demonstrate that TGS-RAG significantly outperforms state-of-the-art baselines, achieving a superior balance between retrieval precision and computational efficiency.