MemGen: Weaving Generative Latent Memory for Self-Evolving Agents

📄 arXiv: 2509.24704v2 📥 PDF

作者: Guibin Zhang, Muxin Fu, Shuicheng Yan

分类: cs.CL

发布日期: 2025-09-29 (更新: 2025-10-12)


💡 一句话要点

MemGen:为自进化Agent构建生成式潜在记忆,提升认知能力

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 生成式记忆 自进化Agent 潜在记忆 认知模型 LLM Agent

📋 核心要点

  1. 现有Agent记忆方法,如参数记忆和检索式记忆,无法捕捉人类认知中推理与记忆的流畅交织。
  2. MemGen通过记忆触发器和记忆编织器,构建动态生成式潜在记忆,使Agent具备类人认知能力。
  3. 实验结果表明,MemGen在多个基准测试中显著优于现有记忆系统,并自发进化出多种类人记忆能力。

📝 摘要(中文)

本文提出MemGen,一个动态生成式记忆框架,旨在赋予Agent类似人类的认知能力。与现有范式不同,MemGen不强制调整模型参数或将经验外化为结构化数据库,而是通过一个记忆触发器监控Agent的推理状态,决定是否显式调用记忆。同时,一个记忆编织器将Agent的当前状态作为刺激,构建一个潜在的token序列作为机器原生记忆,以丰富其推理过程。通过这种方式,MemGen使Agent能够在推理过程中回忆和增强潜在记忆,形成记忆和认知紧密交织的循环。在八个基准测试上的大量实验表明,MemGen超越了领先的外部记忆系统,例如ExpeL和AWM,最高提升38.22%,超过GRPO最高达13.44%,并表现出强大的跨领域泛化能力。更重要的是,研究发现,在没有显式监督的情况下,MemGen自发地进化出类似人类的记忆能力,包括计划记忆、程序记忆和工作记忆,这表明其朝着更自然形式的机器认知发展。

🔬 方法详解

问题定义:现有基于LLM的Agent记忆方法主要分为两类:参数记忆通过调整模型参数来存储经验,但容易遗忘旧知识;检索式记忆将经验存储在外部数据库中,推理时进行检索,但无法实现记忆与推理的紧密结合。这两种方法都无法模拟人类认知中记忆和推理的动态交织过程。

核心思路:MemGen的核心思想是构建一种生成式的潜在记忆,它不是显式地存储或检索信息,而是通过生成潜在的token序列来表示记忆。这些token序列可以被注入到Agent的推理过程中,从而影响其行为。这种方法模拟了人类认知中记忆对思维的潜移默化的影响。

技术框架:MemGen包含两个主要模块:记忆触发器(Memory Trigger)和记忆编织器(Memory Weaver)。记忆触发器负责监控Agent的推理状态,判断是否需要调用记忆。如果需要,记忆编织器将Agent的当前状态作为输入,生成一个潜在的token序列,作为记忆注入到Agent的推理过程中。整个过程形成一个记忆和认知紧密交织的循环。

关键创新:MemGen的关键创新在于其生成式的潜在记忆表示方法。与传统的显式记忆表示方法不同,MemGen的记忆是隐式的,它通过影响Agent的推理过程来发挥作用。这种方法更接近人类的认知方式,也更具有灵活性和泛化能力。

关键设计:记忆触发器可以使用一个简单的分类器来判断是否需要调用记忆。记忆编织器可以使用一个Transformer模型来生成潜在的token序列。损失函数可以采用标准的语言模型损失函数,目标是使生成的token序列能够有效地影响Agent的推理过程。具体的参数设置需要根据具体的任务进行调整。

🖼️ 关键图片

img_0

📊 实验亮点

MemGen在八个基准测试中取得了显著的性能提升。例如,在某些任务上,MemGen超越了领先的外部记忆系统ExpeL和AWM,最高提升38.22%,超过GRPO最高达13.44%。更重要的是,研究发现,在没有显式监督的情况下,MemGen自发地进化出类似人类的计划记忆、程序记忆和工作记忆等能力。

🎯 应用场景

MemGen具有广泛的应用前景,例如可以应用于智能对话系统、游戏AI、机器人控制等领域。通过赋予Agent更强大的记忆能力,可以使其在复杂的环境中更好地学习和适应,从而实现更智能的行为。此外,MemGen的研究也有助于我们更深入地理解人类的认知过程,为人工智能的发展提供新的思路。

📄 摘要(原文)

Agent memory shapes how Large Language Model (LLM)-powered agents, akin to the human brain, progressively refine themselves through environment interactions. Existing paradigms remain constrained: parametric memory forcibly adjusts model parameters, and retrieval-based memory externalizes experience into structured databases, yet neither captures the fluid interweaving of reasoning and memory that underlies human cognition. To address this gap, we propose MemGen, a dynamic generative memory framework that equips agents with a human-esque cognitive faculty. It consists of a \textit{memory trigger}, which monitors the agent's reasoning state to decide explicit memory invocation, and a \textit{memory weaver}, which takes the agent's current state as stimulus to construct a latent token sequence as machine-native memory to enrich its reasoning. In this way, MemGen enables agents to recall and augment latent memory throughout reasoning, producing a tightly interwoven cycle of memory and cognition. Extensive experiments across eight benchmarks show that MemGen surpasses leading external memory systems such as ExpeL and AWM by up to $38.22\%$, exceeds GRPO by up to $13.44\%$, and exhibits strong cross-domain generalization ability. More importantly, we find that without explicit supervision, MemGen spontaneously evolves distinct human-like memory faculties, including planning memory, procedural memory, and working memory, suggesting an emergent trajectory toward more naturalistic forms of machine cognition.