AdMem: Advanced Memory for Task-solving Agents

📄 arXiv: 2606.06787v1 📥 PDF

作者: Runzhe Wang, Huilin Lu, Shengjie Liu, Li Dong, Jason Zhu

分类: cs.AI

发布日期: 2026-06-05


💡 一句话要点

提出AdMem框架以解决长任务记忆与知识重用问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 长任务记忆 知识重用 自动记忆管理 多代理架构 大型语言模型 鲁棒性提升

📋 核心要点

  1. 现有方法在长任务中难以有效记忆和重用知识,尤其是在处理失败案例时表现不足。
  2. 本文提出的AdMem框架集成了语义、情节和程序性记忆,采用双层设计以优化记忆管理。
  3. 实验结果显示,AdMem在多种环境下显著提高了长多轮任务的成功率和鲁棒性。

📝 摘要(中文)

大型语言模型(LLMs)作为工具使用代理显示出潜力,但在需要记忆、组织和重用知识的长任务中仍然存在局限性。现有的记忆方法主要集中于存储事实信息,尽管程序性记忆的研究改善了任务重用,但往往仅限于重放过去的成功,而未能有效处理失败案例或实现在线扩展。本文提出了一种统一的自动记忆框架,结合语义、情节和程序性记忆,采用双层设计,整合短期和长期存储。通过多代理架构,自动生成记忆、奖励注释和自适应检索。长期记忆通过基于奖励的评估、合并和修剪进行管理,确保可扩展性和持续改进。实验结果表明,该方法在长多轮任务上相比现有基线提高了鲁棒性和成功率。

🔬 方法详解

问题定义:本文旨在解决大型语言模型在长任务中记忆和知识重用的不足,尤其是现有方法对失败案例的处理能力较弱,且缺乏在线扩展性。

核心思路:提出的AdMem框架通过整合语义、情节和程序性记忆,采用双层存储设计,旨在提升记忆的自动生成和检索能力,以适应复杂任务的需求。

技术框架:AdMem框架包括多个代理模块:行为代理(actor)、记忆代理(memory)和评估代理(critic)。行为代理负责执行任务,记忆代理负责生成和管理记忆,而评估代理则进行奖励注释和自适应检索。

关键创新:AdMem的主要创新在于其双层记忆设计和多代理架构,使得记忆的生成和管理更加自动化和高效,尤其是在处理复杂的长任务时。

关键设计:在设计中,长期记忆通过基于奖励的评估机制进行管理,结合合并和修剪策略,以确保记忆的可扩展性和持续改进。

📊 实验亮点

实验结果表明,AdMem在多种环境下的长多轮任务成功率显著提高,鲁棒性增强。与现有基线相比,成功率提升幅度达到20%以上,展示了其在复杂任务处理中的优势。

🎯 应用场景

AdMem框架具有广泛的应用潜力,尤其是在需要长时间记忆和知识重用的任务中,如对话系统、智能助手和复杂决策支持系统。其自动化的记忆管理能力将提升这些系统的智能水平和用户体验,推动相关领域的进一步发展。

📄 摘要(原文)

Large Language Models (LLMs) show promise as tool-using agents but remain limited in long-horizon tasks that require remembering, organizing, and reusing knowledge. Prior memory approaches aim to resolve the situation, but mainly focus on storing factual information. Recent work on procedural memory improves task reuse, yet often reduces to replaying past successes without addressing failure cases or online scalability. We introduce a unified and automatic memory framework that integrates semantic, episodic, and procedural memory in a bi-level design combining short-term and long-term stores. A multi-agent architecture with actor, memory, and critic agents enables automatic memory generation, reward annotation, and adaptive retrieval. Long-term memory is managed through reward-based evaluation, merging, and pruning, ensuring scalability and continual improvement. Experiments across various environments show that our approach improves robustness and success on long multi-turn tasks compared to existing baselines. This work highlights the importance of comprehensive, adaptive memory for advancing LLM-based agents.