SAGE: A Self-Evolving Agentic Graph-Memory Engine for Structure-Aware Associative Memory
作者: Juntong Wang, Haoyue Zhao, guanghui Pan, Xiyuan Wang, Yanbo Wang, Qiyan Deng, Muhan Zhang
分类: cs.AI
发布日期: 2026-05-12
💡 一句话要点
SAGE:一种自进化Agentic图记忆引擎,用于结构化关联记忆
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 图记忆 长时记忆 自进化 语言Agent 知识图谱
📋 核心要点
- 现有RAG和GraphRAG系统将记忆图视为静态检索中间件,限制了Agent从部分线索恢复完整证据链的能力。
- SAGE通过自进化Agentic图记忆引擎,将图记忆建模为动态长时记忆基质,实现记忆的自我改进。
- 实验表明,SAGE在多跳问答和开放域检索等任务中,显著提高了证据恢复、答案可信度和检索效率。
📝 摘要(中文)
长时记忆正成为语言Agent的关键瓶颈。现有的RAG和GraphRAG系统主要将记忆图视为静态检索中间件,这限制了它们从部分线索中恢复完整证据链、利用可重用的图结构角色以及通过下游反馈改进记忆本身的能力。我们引入SAGE,一种自进化Agentic图记忆引擎,它将图记忆建模为动态长时记忆基质。SAGE耦合了两个角色:一个记忆写入器,它从交互历史中增量构建结构化图记忆;以及一个基于图基础模型的记忆读取器,用于执行检索并向记忆写入器提供反馈。我们提供了严格的理论分析来支持该框架。在多跳问答、开放域检索、领域特定评论问答和长时Agent记忆基准测试中,SAGE提高了证据恢复、答案可信度和检索效率:经过两轮自进化后,它在多跳问答中实现了最佳平均排名;在零样本开放域迁移中,它在NQ上达到了82.5/91.6的Recall@2/5。LongMemEval和HaluMem上的进一步结果表明,训练和读写器反馈提高了多个长时记忆和幻觉诊断指标,表明自进化、结构感知的图记忆是鲁棒长时程语言Agent的有希望的基础。
🔬 方法详解
问题定义:论文旨在解决语言Agent长时记忆的瓶颈问题。现有方法,如RAG和GraphRAG,将记忆图视为静态检索中间件,无法充分利用图的结构信息,难以从局部信息恢复完整证据链,并且缺乏从下游反馈中学习和改进记忆的能力。
核心思路:论文的核心思路是将图记忆建模为一个动态的、可自进化的结构。通过引入记忆写入器和记忆读取器两个角色,实现记忆的增量构建和反馈学习。记忆写入器负责从交互历史中构建结构化图记忆,记忆读取器则负责检索信息并提供反馈,从而不断优化记忆的质量。
技术框架:SAGE框架包含两个主要模块:记忆写入器和记忆读取器。记忆写入器负责将交互历史转化为结构化的图记忆,并存储在图数据库中。记忆读取器基于图基础模型,从图记忆中检索相关信息,并为记忆写入器提供反馈信号。整个框架通过多轮迭代,不断优化记忆的结构和内容。
关键创新:SAGE的关键创新在于其自进化机制。通过读写器之间的反馈循环,记忆可以不断地从下游任务中学习,并根据任务需求调整自身的结构和内容。这种自进化能力使得SAGE能够更好地适应不同的任务和环境,并提高Agent的长期性能。此外,使用图基础模型作为记忆读取器,能够更好地利用图的结构信息,提高检索的准确性和效率。
关键设计:记忆写入器采用增量构建的方式,逐步将交互历史转化为图结构。记忆读取器使用图神经网络作为基础模型,学习图节点的表示,并根据查询向量进行检索。读写器之间的反馈信号可以是奖励或惩罚,用于指导记忆写入器调整图的结构和权重。具体的损失函数和网络结构等技术细节在论文中进行了详细描述(未知)。
🖼️ 关键图片
📊 实验亮点
SAGE在多跳问答、开放域检索等任务中取得了显著的性能提升。在多跳问答任务中,经过两轮自进化后,SAGE取得了最佳的平均排名。在零样本开放域迁移任务中,SAGE在NQ数据集上达到了82.5/91.6的Recall@2/5。此外,在LongMemEval和HaluMem等长时记忆和幻觉诊断基准测试中,SAGE也表现出优异的性能。
🎯 应用场景
SAGE可应用于各种需要长期记忆和推理的语言Agent任务,例如智能客服、对话系统、知识图谱问答、以及需要持续学习和适应环境的机器人等。通过构建结构化的知识表示和实现记忆的自进化,SAGE能够提高Agent的鲁棒性和泛化能力,使其更好地完成复杂任务。
📄 摘要(原文)
Long-term memory is becoming a central bottleneck for language agents. Exsting RAG and GraphRAG systems largely treat memory graphs as static retrieval middleware, which limits their ability to recover complete evidence chains from partial cues, exploit reusable graph-structrual roles, and improve the memory itself through downstream feedback. We introduce SAGE, a Self-evolving Agentic Graph-memory Engine that models graph memory as a dynamic long-term memory substrate. SAGE couples two roles: a memory writer that incrementally constucts structured graph memory from interaction histories, and a Graph Foundation Model-based memory reader to perform retrieval and provide feedback to the memory writer. We provide rigorooous theoretical annalyses supporting the framework. Across multi-hop QA, open-domain retireval, domain-specific review QA, and long-term agent-memory benchmarks, SAGE improves evidence recovery, answer grounding, and retrieval efficiency: after two self-evolution rounds, it achieves the best average rank on multi-hop QA; in zero-shot open-domain transfer, it reaches 82.5/91.6 Recall@2/5 on NQ. Further results on LongMemEval and HaluMem show that traning and reader-writer feedback improve multiple long-term memory and hallucination-diagnostic metrics, suggesting that self-evolving, structure-aware graph memory is a promising foundation for robust long-horizon language agents.