DyG-RAG: Dynamic Graph Retrieval-Augmented Generation with Event-Centric Reasoning
作者: Qingyun Sun, Jiaqi Yuan, Shan He, Xiao Guan, Haonan Yuan, Xingcheng Fu, Jianxin Li, Philip S. Yu
分类: cs.IR, cs.CL
发布日期: 2025-07-16
🔗 代码/项目: GITHUB
💡 一句话要点
DyG-RAG:提出事件中心动态图检索增强生成框架,解决时序推理难题。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 图检索增强生成 时序推理 动态图 事件抽取 时间感知 链式思考 知识图谱
📋 核心要点
- 现有图检索增强生成方法难以处理时序推理,无法有效建模现实世界事件的演变和顺序。
- DyG-RAG通过动态事件单元(DEU)显式编码语义内容和时间锚点,构建事件图以捕获时序和因果依赖。
- DyG-RAG在时序QA基准测试中显著提高了时序推理问题的准确性和召回率。
📝 摘要(中文)
图检索增强生成(Graph RAG)已成为利用外部结构化知识增强大型语言模型的有效范例。然而,现有的Graph RAG方法难以处理时序推理,因为它们无法对现实世界事件的演变结构和顺序进行建模。本文提出了DyG-RAG,一种新颖的事件中心动态图检索增强生成框架,旨在捕获和推理非结构化文本中嵌入的时序知识。为了消除传统检索单元中的时序歧义,DyG-RAG提出了动态事件单元(DEU),它显式地编码语义内容和精确的时间锚点,从而实现准确且可解释的时间感知检索。为了捕获事件之间的时序和因果依赖关系,DyG-RAG通过链接共享实体并在时间上接近的DEU来构建事件图,支持高效且有意义的多跳推理。为了确保时间上的一致性生成,DyG-RAG引入了一个事件时间线检索管道,该管道通过时间感知遍历检索事件序列,并提出了一种时间链式思考策略,用于时间相关的答案生成。这种统一的管道使DyG-RAG能够检索连贯的、按时间排序的事件序列,并回答标准RAG系统无法解决的复杂、时间敏感的查询。在时间QA基准上的大量实验表明,DyG-RAG显著提高了三种典型时序推理问题的准确性和召回率,为更忠实和时间感知的生成铺平了道路。
🔬 方法详解
问题定义:现有Graph RAG方法在处理需要时序推理的任务时表现不佳。它们无法有效地捕捉和利用事件发生的时间顺序以及事件之间的因果关系,导致在回答时间敏感型问题时准确性不足。传统检索单元存在时序歧义,难以进行精确的时间感知检索。
核心思路:DyG-RAG的核心思路是将文本中的事件显式地建模为动态事件单元(DEU),并构建事件图来表示事件之间的时序和因果关系。通过时间感知的检索和生成策略,确保模型能够理解和利用事件的时间顺序,从而提高时序推理的准确性。
技术框架:DyG-RAG框架包含以下主要模块:1) 动态事件单元构建:从文本中提取事件,并将其表示为包含语义内容和时间锚点的DEU。2) 事件图构建:基于DEU之间的实体共享和时间邻近性,构建事件图,捕捉事件之间的时序和因果关系。3) 事件时间线检索:通过时间感知的图遍历算法,检索与查询相关的事件序列。4) 时间链式思考生成:利用检索到的事件序列,采用链式思考策略生成时间相关的答案。
关键创新:DyG-RAG的关键创新在于引入了动态事件单元(DEU)的概念,并构建了事件图来显式地建模事件之间的时序关系。与传统的静态图RAG方法相比,DyG-RAG能够更好地捕捉和利用事件的时间信息,从而提高时序推理的准确性。时间链式思考生成策略也保证了生成内容在时间上的一致性。
关键设计:DEU的构建涉及命名实体识别和事件抽取等技术。事件图的构建需要定义实体共享和时间邻近性的阈值。时间感知的图遍历算法需要考虑边的方向和权重,以确保检索到的事件序列在时间上是连贯的。时间链式思考生成策略需要设计合适的prompt,引导模型逐步推理并生成答案。
🖼️ 关键图片
📊 实验亮点
在时间QA基准测试中,DyG-RAG在三种典型时序推理问题上显著提高了准确性和召回率。具体而言,与现有基线方法相比,DyG-RAG在时间敏感型问题上的性能提升尤为明显,证明了其在时序推理方面的优越性。实验结果表明,DyG-RAG能够更准确地理解和利用事件的时间信息,从而生成更可靠的答案。
🎯 应用场景
DyG-RAG可应用于需要时序推理的各种场景,例如:历史事件分析、新闻事件追踪、医疗记录分析、金融风险评估等。通过准确理解事件的时间顺序和因果关系,DyG-RAG可以帮助用户更好地理解复杂事件的演变过程,并做出更明智的决策。未来,该技术有望在智能客服、智能助手等领域发挥重要作用。
📄 摘要(原文)
Graph Retrieval-Augmented Generation has emerged as a powerful paradigm for grounding large language models with external structured knowledge. However, existing Graph RAG methods struggle with temporal reasoning, due to their inability to model the evolving structure and order of real-world events. In this work, we introduce DyG-RAG, a novel event-centric dynamic graph retrieval-augmented generation framework designed to capture and reason over temporal knowledge embedded in unstructured text. To eliminate temporal ambiguity in traditional retrieval units, DyG-RAG proposes Dynamic Event Units (DEUs) that explicitly encode both semantic content and precise temporal anchors, enabling accurate and interpretable time-aware retrieval. To capture temporal and causal dependencies across events, DyG-RAG constructs an event graph by linking DEUs that share entities and occur close in time, supporting efficient and meaningful multi-hop reasoning. To ensure temporally consistent generation, DyG-RAG introduces an event timeline retrieval pipeline that retrieves event sequences via time-aware traversal, and proposes a Time Chain-of-Thought strategy for temporally grounded answer generation. This unified pipeline enables DyG-RAG to retrieve coherent, temporally ordered event sequences and to answer complex, time-sensitive queries that standard RAG systems cannot resolve. Extensive experiments on temporal QA benchmarks demonstrate that DyG-RAG significantly improves the accuracy and recall of three typical types of temporal reasoning questions, paving the way for more faithful and temporal-aware generation. DyG-RAG is available at https://github.com/RingBDStack/DyG-RAG.