MemGen: Weaving Generative Latent Memory for Self-Evolving Agents

作者: Guibin Zhang, Muxin Fu, Shuicheng Yan

分类: cs.CL

发布日期: 2025-09-29 (更新: 2025-10-12)

💡 一句话要点

MemGen：为自进化Agent构建生成式潜在记忆，提升认知能力

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 生成式记忆 自进化Agent 潜在记忆 认知模型 LLM Agent

📋 核心要点

现有Agent记忆方法，如参数记忆和检索式记忆，无法捕捉人类认知中推理与记忆的流畅交织。
MemGen通过记忆触发器和记忆编织器，构建动态生成式潜在记忆，使Agent具备类人认知能力。
实验结果表明，MemGen在多个基准测试中显著优于现有记忆系统，并自发进化出多种类人记忆能力。

📝 摘要（中文）

本文提出MemGen，一个动态生成式记忆框架，旨在赋予Agent类似人类的认知能力。与现有范式不同，MemGen不强制调整模型参数或将经验外化为结构化数据库，而是通过一个记忆触发器监控Agent的推理状态，决定是否显式调用记忆。同时，一个记忆编织器将Agent的当前状态作为刺激，构建一个潜在的token序列作为机器原生记忆，以丰富其推理过程。通过这种方式，MemGen使Agent能够在推理过程中回忆和增强潜在记忆，形成记忆和认知紧密交织的循环。在八个基准测试上的大量实验表明，MemGen超越了领先的外部记忆系统，例如ExpeL和AWM，最高提升38.22%，超过GRPO最高达13.44%，并表现出强大的跨领域泛化能力。更重要的是，研究发现，在没有显式监督的情况下，MemGen自发地进化出类似人类的记忆能力，包括计划记忆、程序记忆和工作记忆，这表明其朝着更自然形式的机器认知发展。

🔬 方法详解

问题定义：现有基于LLM的Agent记忆方法主要分为两类：参数记忆通过调整模型参数来存储经验，但容易遗忘旧知识；检索式记忆将经验存储在外部数据库中，推理时进行检索，但无法实现记忆与推理的紧密结合。这两种方法都无法模拟人类认知中记忆和推理的动态交织过程。

核心思路：MemGen的核心思想是构建一种生成式的潜在记忆，它不是显式地存储或检索信息，而是通过生成潜在的token序列来表示记忆。这些token序列可以被注入到Agent的推理过程中，从而影响其行为。这种方法模拟了人类认知中记忆对思维的潜移默化的影响。

技术框架：MemGen包含两个主要模块：记忆触发器（Memory Trigger）和记忆编织器（Memory Weaver）。记忆触发器负责监控Agent的推理状态，判断是否需要调用记忆。如果需要，记忆编织器将Agent的当前状态作为输入，生成一个潜在的token序列，作为记忆注入到Agent的推理过程中。整个过程形成一个记忆和认知紧密交织的循环。

关键创新：MemGen的关键创新在于其生成式的潜在记忆表示方法。与传统的显式记忆表示方法不同，MemGen的记忆是隐式的，它通过影响Agent的推理过程来发挥作用。这种方法更接近人类的认知方式，也更具有灵活性和泛化能力。

关键设计：记忆触发器可以使用一个简单的分类器来判断是否需要调用记忆。记忆编织器可以使用一个Transformer模型来生成潜在的token序列。损失函数可以采用标准的语言模型损失函数，目标是使生成的token序列能够有效地影响Agent的推理过程。具体的参数设置需要根据具体的任务进行调整。

🖼️ 关键图片

📊 实验亮点

MemGen在八个基准测试中取得了显著的性能提升。例如，在某些任务上，MemGen超越了领先的外部记忆系统ExpeL和AWM，最高提升38.22%，超过GRPO最高达13.44%。更重要的是，研究发现，在没有显式监督的情况下，MemGen自发地进化出类似人类的计划记忆、程序记忆和工作记忆等能力。

🎯 应用场景

MemGen具有广泛的应用前景，例如可以应用于智能对话系统、游戏AI、机器人控制等领域。通过赋予Agent更强大的记忆能力，可以使其在复杂的环境中更好地学习和适应，从而实现更智能的行为。此外，MemGen的研究也有助于我们更深入地理解人类的认知过程，为人工智能的发展提供新的思路。

📄 摘要（原文）

Agent memory shapes how Large Language Model (LLM)-powered agents, akin to the human brain, progressively refine themselves through environment interactions. Existing paradigms remain constrained: parametric memory forcibly adjusts model parameters, and retrieval-based memory externalizes experience into structured databases, yet neither captures the fluid interweaving of reasoning and memory that underlies human cognition. To address this gap, we propose MemGen, a dynamic generative memory framework that equips agents with a human-esque cognitive faculty. It consists of a \textit{memory trigger}, which monitors the agent's reasoning state to decide explicit memory invocation, and a \textit{memory weaver}, which takes the agent's current state as stimulus to construct a latent token sequence as machine-native memory to enrich its reasoning. In this way, MemGen enables agents to recall and augment latent memory throughout reasoning, producing a tightly interwoven cycle of memory and cognition. Extensive experiments across eight benchmarks show that MemGen surpasses leading external memory systems such as ExpeL and AWM by up to $38.22\%$, exceeds GRPO by up to $13.44\%$, and exhibits strong cross-domain generalization ability. More importantly, we find that without explicit supervision, MemGen spontaneously evolves distinct human-like memory faculties, including planning memory, procedural memory, and working memory, suggesting an emergent trajectory toward more naturalistic forms of machine cognition.

MemGen: Weaving Generative Latent Memory for Self-Evolving Agents

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理