Memory in the Age of AI Agents

📄 arXiv: 2512.13564v2 📥 PDF

作者: Yuyang Hu, Shichun Liu, Yanwei Yue, Guibin Zhang, Boyang Liu, Fangyi Zhu, Jiahang Lin, Honglin Guo, Shihan Dou, Zhiheng Xi, Senjie Jin, Jiejun Tan, Yanbin Yin, Jiongnan Liu, Zeyu Zhang, Zhongxiang Sun, Yutao Zhu, Hao Sun, Boci Peng, Zhenrong Cheng, Xuanbo Fan, Jiaxin Guo, Xinlei Yu, Zhenhong Zhou, Zewen Hu, Jiahao Huo, Junhao Wang, Yuwei Niu, Yu Wang, Zhenfei Yin, Xiaobin Hu, Yue Liao, Qiankun Li, Kun Wang, Wangchunshu Zhou, Yixin Liu, Dawei Cheng, Qi Zhang, Tao Gui, Shirui Pan, Yan Zhang, Philip Torr, Zhicheng Dou, Ji-Rong Wen, Xuanjing Huang, Yu-Gang Jiang, Shuicheng Yan

分类: cs.CL, cs.AI

发布日期: 2025-12-15 (更新: 2026-01-13)


💡 一句话要点

对基于大模型Agent的记忆机制进行全面综述,并展望未来发展方向

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agent记忆 大模型 综述 人工智能 记忆机制

📋 核心要点

  1. 现有Agent记忆研究领域分散,缺乏统一的视角和清晰的术语定义,传统长短时记忆分类不足以描述其多样性。
  2. 论文从形式、功能和动态三个维度对Agent记忆进行统一分析,提出了更细粒度的记忆分类,并总结了现有基准和框架。
  3. 论文展望了Agent记忆的未来研究方向,包括记忆自动化、强化学习集成、多模态记忆、多Agent记忆和可信赖性问题。

📝 摘要(中文)

记忆已经成为,并将持续成为,基于大模型Agent的核心能力。随着Agent记忆研究的迅速扩展并引起前所未有的关注,该领域也变得日益分散。现有关于Agent记忆的工作在动机、实现和评估协议方面通常存在显著差异,而定义松散的记忆术语的激增进一步模糊了概念的清晰性。诸如长时/短时记忆等传统分类已被证明不足以捕捉当代Agent记忆系统的多样性。本文旨在提供当前Agent记忆研究的最新概况。我们首先明确界定Agent记忆的范围,并将其与LLM记忆、检索增强生成(RAG)和上下文工程等相关概念区分开来。然后,我们通过形式、功能和动态的统一视角来考察Agent记忆。从形式的角度来看,我们确定了Agent记忆的三种主要实现方式,即token级别、参数化和潜在记忆。从功能的角度来看,我们提出了一种更细粒度的分类法,区分了事实记忆、经验记忆和工作记忆。从动态的角度来看,我们分析了记忆是如何形成、演变和检索的。为了支持实际开发,我们编制了记忆基准和开源框架的综合摘要。除了整合之外,我们还阐明了对新兴研究前沿的展望,包括记忆自动化、强化学习集成、多模态记忆、多Agent记忆和可信赖性问题。我们希望这篇综述不仅可以作为现有工作的参考,还可以作为重新思考记忆的基础,将其作为未来Agent智能设计中的一等公民。

🔬 方法详解

问题定义:现有Agent记忆研究领域缺乏统一的框架和清晰的术语定义,导致研究成果难以整合和比较。传统长时/短时记忆的分类方式无法充分描述当前Agent记忆系统的复杂性和多样性。现有方法在动机、实现和评估协议上存在显著差异,阻碍了领域的发展。

核心思路:论文的核心思路是从形式、功能和动态三个维度对Agent记忆进行解构和分析,建立一个统一的视角来理解和组织现有的研究成果。通过明确Agent记忆的范围,并将其与相关概念区分开来,论文旨在为未来的研究提供一个清晰的概念基础。

技术框架:论文的技术框架主要包括三个部分:1) 形式:将Agent记忆分为token级别、参数化和潜在记忆三种实现方式;2) 功能:提出事实记忆、经验记忆和工作记忆的细粒度分类;3) 动态:分析记忆的形成、演变和检索过程。此外,论文还总结了现有的记忆基准和开源框架,并展望了未来的研究方向。

关键创新:论文的关键创新在于提出了一个三维的Agent记忆分析框架(形式、功能、动态),并基于此对现有研究进行了系统性的梳理和分类。这种框架能够帮助研究者更好地理解Agent记忆的本质,并为未来的研究提供指导。

关键设计:论文并没有提出具体的算法或模型,而是一个概念性的框架。关键设计在于对Agent记忆的细粒度分类和对记忆动态过程的分析。例如,在功能维度上,区分了事实记忆、经验记忆和工作记忆,这有助于研究者针对不同的记忆类型设计更有效的记忆机制。

🖼️ 关键图片

img_0

📊 实验亮点

该论文是一篇综述性文章,没有具体的实验结果。其亮点在于对Agent记忆领域进行了全面的梳理和总结,提出了一个三维的分析框架,并展望了未来的研究方向。通过对现有研究的分类和分析,论文为研究者提供了一个清晰的路线图,有助于推动Agent记忆领域的发展。

🎯 应用场景

该研究成果可应用于各种需要智能Agent进行长期交互和决策的场景,例如智能客服、游戏AI、自动驾驶、机器人等。通过构建更有效的Agent记忆系统,可以提升Agent的智能水平和适应能力,使其能够更好地理解环境、学习经验并做出合理的决策,从而提高工作效率和用户体验。

📄 摘要(原文)

Memory has emerged, and will continue to remain, a core capability of foundation model-based agents. As research on agent memory rapidly expands and attracts unprecedented attention, the field has also become increasingly fragmented. Existing works that fall under the umbrella of agent memory often differ substantially in their motivations, implementations, and evaluation protocols, while the proliferation of loosely defined memory terminologies has further obscured conceptual clarity. Traditional taxonomies such as long/short-term memory have proven insufficient to capture the diversity of contemporary agent memory systems. This work aims to provide an up-to-date landscape of current agent memory research. We begin by clearly delineating the scope of agent memory and distinguishing it from related concepts such as LLM memory, retrieval augmented generation (RAG), and context engineering. We then examine agent memory through the unified lenses of forms, functions, and dynamics. From the perspective of forms, we identify three dominant realizations of agent memory, namely token-level, parametric, and latent memory. From the perspective of functions, we propose a finer-grained taxonomy that distinguishes factual, experiential, and working memory. From the perspective of dynamics, we analyze how memory is formed, evolved, and retrieved over time. To support practical development, we compile a comprehensive summary of memory benchmarks and open-source frameworks. Beyond consolidation, we articulate a forward-looking perspective on emerging research frontiers, including memory automation, reinforcement learning integration, multimodal memory, multi-agent memory, and trustworthiness issues. We hope this survey serves not only as a reference for existing work, but also as a conceptual foundation for rethinking memory as a first-class primitive in the design of future agentic intelligence.