LEGOMem: Modular Procedural Memory for Multi-agent LLM Systems for Workflow Automation

📄 arXiv: 2510.04851v1 📥 PDF

作者: Dongge Han, Camille Couturier, Daniel Madrigal Diaz, Xuchao Zhang, Victor Rühle, Saravan Rajmohan

分类: cs.AI, cs.LG, cs.MA

发布日期: 2025-10-06


💡 一句话要点

LEGOMem:面向工作流自动化的多智能体LLM系统的模块化程序记忆

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 工作流自动化 程序记忆 模块化设计

📋 核心要点

  1. 现有方法在多智能体系统中缺乏有效的程序记忆机制,难以复用历史经验提升工作流自动化性能。
  2. LEGOMem将任务轨迹分解为可重用记忆单元,并灵活分配给协调者和任务智能体,支持规划和执行。
  3. 实验表明,协调者记忆提升任务分解和委派,智能体记忆提高执行精度,小模型团队也能受益。

📝 摘要(中文)

本文提出LEGOMem,一个用于多智能体大型语言模型(LLM)系统在工作流自动化中的模块化程序记忆框架。LEGOMem将过去的任务轨迹分解为可重用的记忆单元,并灵活地将其分配给协调者和任务智能体,以支持规划和执行。为了探索多智能体系统中记忆的设计空间,我们以LEGOMem为视角,对多智能体系统中的程序记忆进行了系统研究,考察了记忆应该放置在哪里,应该如何检索,以及哪些智能体受益最大。在OfficeBench基准上的实验表明,协调者记忆对于有效的任务分解和委派至关重要,而细粒度的智能体记忆提高了执行精度。我们发现,即使是由较小的语言模型组成的团队,也可以从程序记忆中获益匪浅,通过利用先前的执行轨迹进行更准确的规划和工具使用,缩小与更强大的智能体之间的性能差距。这些结果将LEGOMem定位为记忆增强智能体系统的实用框架,以及理解多智能体工作流自动化中记忆设计的科研工具。

🔬 方法详解

问题定义:现有方法在多智能体系统中,难以有效地利用历史任务执行的经验,导致重复性的任务规划和执行效率低下。尤其是在复杂的工作流自动化场景下,如何让智能体记住并复用之前的成功经验,避免重复犯错,是一个亟待解决的问题。现有的方法要么缺乏有效的记忆机制,要么记忆方式过于简单,无法适应复杂多变的任务环境。

核心思路:LEGOMem的核心思路是将过去的任务轨迹分解成模块化的、可重用的记忆单元,类似于乐高积木。这些记忆单元可以灵活地分配给不同的智能体(协调者和任务执行者),从而让它们能够根据自身的角色和任务需求,选择性地利用历史经验。这种模块化的设计使得记忆的检索和复用更加高效,也更易于扩展和维护。

技术框架:LEGOMem的整体架构包含以下几个主要模块:1) 任务轨迹分解器:将历史任务轨迹分解为一系列的记忆单元,每个单元包含任务步骤、输入、输出和执行结果等信息。2) 记忆存储器:用于存储分解后的记忆单元,并提供高效的检索接口。3) 记忆分配器:根据智能体的角色和任务需求,将相关的记忆单元分配给相应的智能体。4) 规划器:利用分配到的记忆单元,生成任务执行计划。5) 执行器:根据执行计划,调用相应的工具或服务来完成任务。

关键创新:LEGOMem最重要的技术创新点在于其模块化的程序记忆设计。与传统的整体式记忆方法相比,LEGOMem能够更灵活地管理和复用历史经验,从而提高多智能体系统的整体性能。此外,LEGOMem还考虑了不同智能体在任务执行过程中的不同角色,并针对性地分配记忆单元,从而更好地利用历史经验。

关键设计:LEGOMem的关键设计包括:1) 记忆单元的粒度:需要根据任务的复杂程度和智能体的能力来选择合适的粒度。2) 记忆检索策略:需要设计高效的检索算法,以便快速找到相关的记忆单元。3) 记忆更新策略:需要定期更新记忆存储器,以反映最新的任务执行情况。4) 记忆分配策略:需要根据智能体的角色和任务需求,合理地分配记忆单元。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在OfficeBench基准测试中,LEGOMem显著提升了多智能体系统的性能。实验结果表明,配备LEGOMem的智能体团队在任务完成率和执行精度方面均优于没有记忆机制的基线系统。特别是,协调者记忆对于任务分解和委派至关重要,而细粒度的智能体记忆能够显著提高执行精度。即使是使用较小语言模型的智能体团队,通过利用LEGOMem,也能缩小与更强大的智能体之间的性能差距。

🎯 应用场景

LEGOMem可应用于各种工作流自动化场景,例如客户服务、IT支持、供应链管理等。通过利用历史任务执行的经验,LEGOMem可以帮助智能体更高效地完成任务,提高工作效率,降低运营成本。未来,LEGOMem还可以与其他技术相结合,例如强化学习、知识图谱等,以进一步提升多智能体系统的智能化水平。

📄 摘要(原文)

We introduce LEGOMem, a modular procedural memory framework for multi-agent large language model (LLM) systems in workflow automation. LEGOMem decomposes past task trajectories into reusable memory units and flexibly allocates them across orchestrators and task agents to support planning and execution. To explore the design space of memory in multi-agent systems, we use LEGOMem as a lens and conduct a systematic study of procedural memory in multi-agent systems, examining where memory should be placed, how it should be retrieved, and which agents benefit most. Experiments on the OfficeBench benchmark show that orchestrator memory is critical for effective task decomposition and delegation, while fine-grained agent memory improves execution accuracy. We find that even teams composed of smaller language models can benefit substantially from procedural memory, narrowing the performance gap with stronger agents by leveraging prior execution traces for more accurate planning and tool use. These results position LEGOMem as both a practical framework for memory-augmented agent systems and a research tool for understanding memory design in multi-agent workflow automation.