MemWeaver: Weaving Hybrid Memories for Traceable Long-Horizon Agentic Reasoning

📄 arXiv: 2601.18204v1 📥 PDF

作者: Juexiang Ye, Xue Li, Xinyu Yang, Chengkai Huang, Lanshun Nie, Lina Yao, Dechen Zhan

分类: cs.CL

发布日期: 2026-01-26


💡 一句话要点

MemWeaver:编织混合记忆,实现可追溯的长程Agent推理

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agent记忆 长程推理 图神经网络 知识图谱 多跳推理

📋 核心要点

  1. 现有Agent记忆方法在长程推理中存在时间冲突、推理脆弱和可追溯性有限等问题。
  2. MemWeaver通过构建时间对齐图记忆、经验记忆和段落记忆,实现结构化知识和证据的联合检索。
  3. 实验表明,MemWeaver在LoCoMo基准上显著提升了多跳和时间推理的准确性,并大幅缩减了上下文长度。

📝 摘要(中文)

基于大型语言模型的Agent在长程交互中需要记忆系统,以支持时间一致性、多跳推理和跨会话的证据溯源重用。现有方法主要依赖于非结构化检索或粗略抽象,这通常导致时间冲突、脆弱的推理和有限的可追溯性。我们提出了MemWeaver,一个统一的记忆框架,将长期Agent经验整合到三个相互连接的组件中:用于结构化关系推理的时间对齐图记忆、从重复观察中抽象出循环交互模式的经验记忆,以及保存原始文本证据的段落记忆。MemWeaver采用双通道检索策略,联合检索结构化知识和支持证据,以构建紧凑但信息密集的推理上下文。在LoCoMo基准上的实验表明,与长上下文基线相比,MemWeaver显著提高了多跳和时间推理的准确性,同时将输入上下文长度减少了95%以上。

🔬 方法详解

问题定义:现有基于LLM的Agent在长程交互中,依赖非结构化检索或粗略抽象进行记忆,导致时间一致性差、多跳推理能力弱,且缺乏证据溯源能力。现有方法难以有效管理和利用Agent的长期经验,从而限制了其在复杂任务中的表现。

核心思路:MemWeaver的核心思路是将Agent的长期经验分解并存储到三个相互连接的记忆组件中:时间对齐图记忆(用于结构化关系推理)、经验记忆(用于抽象循环交互模式)和段落记忆(用于保存原始文本证据)。通过双通道检索策略,联合检索结构化知识和支持证据,构建信息密集的推理上下文。

技术框架:MemWeaver包含三个主要模块:1) 图记忆构建:将Agent的交互历史构建成时间对齐的图结构,节点表示实体,边表示关系。2) 经验记忆提取:从重复的观察中提取常见的交互模式,并将其存储为经验记忆。3) 段落记忆存储:保存原始的文本证据,用于支持推理过程。推理时,采用双通道检索策略,同时从图记忆和段落记忆中检索相关信息,并将其整合到LLM的上下文中。

关键创新:MemWeaver的关键创新在于其混合记忆架构,它结合了结构化知识(图记忆)、抽象经验(经验记忆)和原始证据(段落记忆),从而实现了更有效和可追溯的推理。与现有方法相比,MemWeaver能够更好地处理时间关系、进行多跳推理,并提供证据支持。

关键设计:MemWeaver使用图神经网络(GNN)进行图记忆的推理和更新。经验记忆的提取基于聚类算法,用于识别重复的交互模式。双通道检索策略使用相似度度量来选择相关的图节点和文本段落。具体参数设置和损失函数等技术细节在论文中有详细描述,但此处未提供具体数值。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在LoCoMo基准测试中,MemWeaver在多跳和时间推理任务上显著优于现有方法。与长上下文基线相比,MemWeaver将输入上下文长度减少了95%以上,同时保持或提高了推理准确性。这些结果表明,MemWeaver能够有效地利用长期记忆,并构建紧凑但信息密集的推理上下文。

🎯 应用场景

MemWeaver可应用于需要长期记忆和复杂推理的Agent任务,例如智能客服、游戏AI、机器人导航等。通过提供更准确和可追溯的推理能力,MemWeaver可以提升Agent在复杂环境中的表现,并增强用户对Agent决策的信任度。未来,该技术可以进一步扩展到多模态Agent和更复杂的推理场景。

📄 摘要(原文)

Large language model-based agents operating in long-horizon interactions require memory systems that support temporal consistency, multi-hop reasoning, and evidence-grounded reuse across sessions. Existing approaches largely rely on unstructured retrieval or coarse abstractions, which often lead to temporal conflicts, brittle reasoning, and limited traceability. We propose MemWeaver, a unified memory framework that consolidates long-term agent experiences into three interconnected components: a temporally grounded graph memory for structured relational reasoning, an experience memory that abstracts recurring interaction patterns from repeated observations, and a passage memory that preserves original textual evidence. MemWeaver employs a dual-channel retrieval strategy that jointly retrieves structured knowledge and supporting evidence to construct compact yet information-dense contexts for reasoning. Experiments on the LoCoMo benchmark demonstrate that MemWeaver substantially improves multi-hop and temporal reasoning accuracy while reducing input context length by over 95\% compared to long-context baselines.