From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms
作者: Jinghao Luo, Yuchen Tian, Chuxue Cao, Ziyang Luo, Hongzhan Lin, Kaixin Li, Chuyi Kong, Ruichao Yang, Jing Ma
分类: cs.AI, cs.CL
发布日期: 2026-05-07
备注: Accepted by ACL 2026 Findings
💡 一句话要点
提出LLM智能体记忆演进框架:从存储、反射到经验的三阶段范式
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大语言模型 智能体记忆 持续学习 认知架构 轨迹抽象 知识表示
📋 核心要点
- 现有研究在操作系统工程与认知科学视角间割裂,缺乏统一的记忆机制演进框架,导致技术开发碎片化。
- 论文提出将记忆演进划分为存储、反射、经验三个阶段,并分析了长程一致性、动态环境及持续学习三大驱动力。
- 通过形式化记忆演进路径,为构建具备主动探索与跨轨迹抽象能力的下一代智能体提供了理论支撑与设计蓝图。
📝 摘要(中文)
基于大语言模型(LLM)的智能体通过集成外部工具与规划能力,重塑了人工智能领域。尽管记忆机制已成为这些系统的架构基石,但当前研究仍处于碎片化状态,在操作系统工程与认知科学之间摇摆不定。这种理论上的割裂阻碍了技术综合的统一视角与连贯的演进认知。为弥合这一鸿沟,本综述提出了一种全新的LLM智能体记忆演进框架,将发展过程形式化为三个阶段:存储(轨迹保存)、反射(轨迹精炼)与经验(轨迹抽象)。在正式定义这三个阶段后,本文分析了驱动这一演进的三大核心动力:长程一致性的需求、动态环境的挑战以及持续学习的终极目标。此外,本文重点探讨了“经验”阶段的两个变革性机制:主动探索与跨轨迹抽象。通过综合这些不同视角,本研究为下一代LLM智能体的开发提供了稳健的设计原则与清晰的路线图。
🔬 方法详解
问题定义:当前LLM智能体记忆研究缺乏统一的理论范式,导致记忆机制的设计往往局限于简单的存储检索或零散的启发式优化,难以应对复杂任务中长程一致性保持、动态环境适应及持续学习的需求。
核心思路:论文提出了一种演进式记忆框架,将智能体记忆从单纯的“数据存储”提升至“认知经验”层面,通过分阶段的轨迹处理,实现从原始数据到高阶知识的转化。
技术框架:框架包含三个核心阶段:1. 存储(Storage):侧重于轨迹的原始保存与检索;2. 反射(Reflection):侧重于对轨迹的评估、修正与精炼;3. 经验(Experience):侧重于跨轨迹的抽象与泛化,形成可迁移的知识结构。
关键创新:引入了“经验”阶段的两个前沿机制:主动探索(Proactive Exploration)与跨轨迹抽象(Cross-trajectory Abstraction),使智能体能够超越单次交互,主动构建并优化其内部知识库。
关键设计:该框架通过形式化定义记忆的生命周期,将记忆机制与智能体的持续学习目标对齐,通过引入抽象层,解决了传统记忆机制在处理海量历史数据时面临的检索效率与语义冗余问题(具体参数设置在文中为定性分析,未知)。
🖼️ 关键图片
📊 实验亮点
本文通过系统性综述,首次将碎片化的记忆研究整合为演进式框架。虽然论文侧重于理论构建而非基准测试,但其提出的“经验”阶段机制在理论上能显著降低长程任务中的冗余信息,提升智能体在多轮交互中的决策一致性,为后续的性能评估提供了明确的评价指标与设计基准。
🎯 应用场景
该研究适用于需要长期记忆与持续学习的复杂智能体系统,如个人数字助理、自动化软件开发代理、复杂游戏NPC及科学发现助手。通过优化记忆机制,这些系统能更有效地在动态环境中积累经验,提升任务执行的鲁棒性与泛化能力,对构建通用人工智能(AGI)具有重要参考价值。
📄 摘要(原文)
Large Language Model (LLM)-based agents have fundamentally reshaped artificial intelligence by integrating external tools and planning capabilities. While memory mechanisms have emerged as the architectural cornerstone of these systems, current research remains fragmented, oscillating between operating system engineering and cognitive science. This theoretical divide prevents a unified view of technological synthesis and a coherent evolutionary perspective. To bridge this gap, this survey proposes a novel evolutionary framework for LLM agent memory mechanisms, formalizing the development process into three stages: Storage (trajectory preservation), Reflection (trajectory refinement), and Experience (trajectory abstraction). We first formally define these three stages before analyzing the three core drivers of this evolution: the necessity for long-range consistency, the challenges in dynamic environments, and the ultimate goal of continual learning. Furthermore, we specifically explore two transformative mechanisms in the frontier Experience stage: proactive exploration and cross-trajectory abstraction. By synthesizing these disparate views, this work offers robust design principles and a clear roadmap for the development of next-generation LLM agents.