EfficientGraph-RAG: Structured Retrieval-State Management for Cross-Task Retrieval-Augmented Generation

📄 arXiv: 2605.25379v1 📥 PDF

作者: Miaohe Niu, Lianlei Shan, Zhengtao Yu, Jingbo Zhu, Tong Xiao

分类: cs.CL

发布日期: 2026-05-25

备注: 19 pages, 5 figures, 14 tables


💡 一句话要点

EfficientGraph-RAG:通过结构化检索状态管理提升跨任务RAG效率

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 检索增强生成 RAG 知识图谱 状态管理 多智能体系统

📋 核心要点

  1. 现有RAG系统在复杂检索中面临瓶颈,主要由于证据组织为扁平块,检索过程缺乏结构化,导致效率低下。
  2. EfficientGraph-RAG将RAG过程建模为结构化状态管理,通过显式地管理检索状态来提升检索效率和答案质量。
  3. 实验表明,EfficientGraph-RAG在多个数据集上取得了领先的性能,同时显著降低了大型语言模型的token使用量。

📝 摘要(中文)

检索增强生成(RAG)已成为将大型语言模型与外部知识相结合的标准方法,但许多系统仍然将证据组织为扁平化的块,并通过很大程度上非结构化的搜索进行检索。这种弱结构成为复杂检索的瓶颈:系统必须决定在哪里搜索,如何从粗略的主题移动到实体关系证据,哪些证据已经被验证,以及哪些中间产物可以被重用。我们将这些中间变量定义为检索状态,并将RAG视为结构化状态管理。EfficientGraph-RAG通过三个耦合机制使这种状态显式化:TAM定义了证据上的类型化分层状态空间,MARS通过角色专门化的代理更新和验证状态,SMP在分层感知访问控制下存储可重用的状态。使用一个共享框架配置,EfficientGraph-RAG在三个评估的LongBench检索风格子集的平均答案质量指标上排名第一,在HotpotQA EM上与最强的agentic基线相匹配,同时减少了3.51倍的大型模型token使用量,并在检索组织跨模态方法中提供了低token的DocVQA结果。组件分析显示了角色特定的机制:MARS是主要的答案质量驱动因素,TAM提供了类型化的遍历状态和自适应路由信号,SMP实现了语料库相关的重用,跨查询缓存命中率从3.77%到23.18%。

🔬 方法详解

问题定义:现有RAG系统在处理复杂问题时,由于知识组织方式的扁平化和检索过程的非结构化,导致检索效率低下,难以有效利用外部知识。系统难以决定搜索范围、证据验证方式以及中间结果的复用策略,严重制约了RAG的性能。

核心思路:论文的核心思路是将RAG过程视为一个结构化的状态管理问题。通过显式地定义和管理检索状态,系统可以更好地控制检索过程,提高检索效率和答案质量。这种方法借鉴了状态管理在其他领域的成功经验,并将其应用于RAG任务中。

技术框架:EfficientGraph-RAG包含三个主要模块:TAM (Typed hierarchical state space over evidence)、MARS (Multi-Agent Retrieval and verification System)和SMP (State Management Pool)。TAM定义了证据上的类型化分层状态空间,用于组织和表示知识。MARS通过角色专门化的代理更新和验证状态,负责检索和验证证据。SMP在分层感知访问控制下存储可重用的状态,用于缓存和复用中间结果。整个框架通过这三个模块的协同工作,实现高效的检索增强生成。

关键创新:EfficientGraph-RAG的关键创新在于将RAG过程建模为结构化的状态管理问题,并提出了TAM、MARS和SMP三个模块来显式地管理检索状态。这种方法与传统的扁平化检索方法相比,能够更好地控制检索过程,提高检索效率和答案质量。此外,MARS中角色专门化的代理设计也提高了检索的准确性和效率。

关键设计:TAM定义了类型化的分层状态空间,具体类型和层级划分需要根据具体任务和数据集进行设计。MARS中的代理角色包括检索代理、验证代理等,每个代理负责特定的任务。SMP使用分层感知的访问控制策略,确保状态的安全性。论文中还提到了自适应路由信号,用于指导检索过程,但具体实现细节未知。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

EfficientGraph-RAG在LongBench数据集上取得了领先的答案质量,并在HotpotQA数据集上与最强的agentic基线相匹配,同时降低了3.51倍的token使用量。在DocVQA数据集上,该方法也取得了具有竞争力的结果。组件分析表明,MARS是主要的答案质量驱动因素,TAM提供了类型化的遍历状态和自适应路由信号,SMP实现了语料库相关的重用,跨查询缓存命中率从3.77%到23.18%。

🎯 应用场景

EfficientGraph-RAG可应用于各种需要利用外部知识的问答系统、对话系统和知识密集型任务。例如,可以用于构建更智能的客服机器人,能够准确回答用户提出的复杂问题;也可以用于辅助科研人员进行文献检索和知识发现,提高科研效率。该方法具有很高的实际应用价值和广阔的应用前景。

📄 摘要(原文)

Retrieval-augmented generation (RAG) has become the standard way to ground large language models in external knowledge, but many systems still organize evidence as flat chunks and retrieve it through largely unstructured search. This weak structure becomes a bottleneck for complex retrieval: the system must decide where to search, how to move from coarse topics to entity-relation evidence, which evidence has been verified, and which intermediate artifacts can be reused. We define these intermediate variables as a retrieval state and study RAG as structured state management. EfficientGraph-RAG makes this state explicit through three coupled mechanisms: TAM defines a typed hierarchical state space over evidence, MARS updates and verifies the state through role-specialized agents, and SMP stores reusable state under hierarchy-aware access control. Using one shared framework configuration, EfficientGraph-RAG ranks first on the reported answer-quality metrics averaged over the three evaluated LongBench retrieval-style subsets, matches the strongest agentic baseline on HotpotQA EM while reducing large-model token usage by $3.51\times$, and provides a low-token DocVQA result among retrieval-organizing cross-modal methods. Component analysis shows role-specific mechanisms: MARS is the main answer-quality driver, TAM supplies the typed traversal state and Adaptive Routing signal, and SMP enables corpus-dependent reuse, with cross-query cache hit rates ranging from 3.77% to 23.18%.