Unifying Dynamic Tool Creation and Cross-Task Experience Sharing through Cognitive Memory Architecture

📄 arXiv: 2512.11303v1 📥 PDF

作者: Jiarun Liu, Shiyue Xu, Yang Li, Shangkun Liu, Yongli Yu, Peng Cao

分类: cs.CL

发布日期: 2025-12-12


💡 一句话要点

SMITH:通过认知记忆架构统一动态工具创建与跨任务经验共享

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 认知架构 动态工具创建 经验共享 大型语言模型智能体 分层记忆

📋 核心要点

  1. 现有大语言模型智能体在面对新任务时,受限于工具的预定义和经验的孤立,难以有效适应。
  2. SMITH通过构建分层认知记忆架构,将动态工具创建与跨任务经验共享相结合,提升智能体的适应能力。
  3. 在GAIA基准测试中,SMITH的Pass@1准确率达到81.8%,显著优于Alita和Memento等先进基线模型。

📝 摘要(中文)

大型语言模型智能体在适应新任务时面临工具可用性和经验复用方面的根本挑战。现有方法要么依赖覆盖范围有限的预定义工具,要么从头开始构建工具而不利用过去的经验,导致效率低下和性能欠佳。我们提出了SMITH(共享记忆集成工具中心),一种统一的认知架构,通过分层记忆组织无缝集成动态工具创建与跨任务经验共享。SMITH将智能体记忆组织为程序性、语义和情景性组件,从而实现系统的能力扩展,同时保留成功的执行模式。我们的方法将工具创建形式化为受控沙箱环境中的迭代代码生成,并通过语义相似度匹配的情景记忆检索实现经验共享。我们进一步提出了一种基于智能体集成难度重新估计的课程学习策略。在GAIA基准上的大量实验表明了SMITH的有效性,实现了81.8%的Pass@1准确率,优于最先进的基线,包括Alita(75.2%)和Memento(70.9%)。我们的工作为构建真正自适应的智能体奠定了基础,这些智能体通过工具创建和经验积累的原则性集成不断发展其能力。

🔬 方法详解

问题定义:现有的大语言模型智能体在处理新任务时,面临两大挑战:一是预定义工具的覆盖范围有限,无法满足所有任务需求;二是缺乏有效的经验复用机制,导致每次遇到新任务都需要从头开始探索,效率低下。现有方法要么依赖人工设计的工具集,要么每次都重新生成工具,无法充分利用历史经验,导致性能受限。

核心思路:SMITH的核心思路是构建一个统一的认知架构,将动态工具创建与跨任务经验共享相结合。通过分层记忆组织,智能体可以系统地扩展自身能力,同时保留成功的执行模式。工具创建被形式化为在受控沙箱环境中的迭代代码生成过程,而经验共享则通过语义相似度匹配的情景记忆检索来实现。

技术框架:SMITH的整体架构包含三个主要组件:程序性记忆(Procedural Memory)、语义记忆(Semantic Memory)和情景记忆(Episodic Memory)。程序性记忆存储智能体的技能和工具,语义记忆存储知识和概念,情景记忆存储过去的经验和执行轨迹。当智能体遇到新任务时,首先从语义记忆中检索相关知识,然后从情景记忆中检索相似的经验,并利用这些经验动态地创建或调整工具。工具创建过程在受控的沙箱环境中进行,以确保安全性和可靠性。

关键创新:SMITH的关键创新在于统一了动态工具创建和跨任务经验共享。传统的智能体通常将工具视为静态资源,或者每次都从头开始创建工具。SMITH则通过认知记忆架构,将工具创建与经验积累相结合,使得智能体可以不断学习和进化。此外,SMITH还提出了一种基于智能体集成难度重新估计的课程学习策略,进一步提高了学习效率。

关键设计:SMITH的关键设计包括:1) 分层记忆组织,将记忆分为程序性、语义和情景性三个层次,分别存储不同类型的信息;2) 基于语义相似度匹配的情景记忆检索机制,用于快速找到相关的经验;3) 在受控沙箱环境中进行工具创建,确保安全性和可靠性;4) 基于智能体集成难度重新估计的课程学习策略,用于提高学习效率。具体的参数设置和网络结构等技术细节未在摘要中详细说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SMITH在GAIA基准测试中取得了显著成果,Pass@1准确率达到81.8%,超越了Alita (75.2%) 和 Memento (70.9%) 等先进基线模型。这一结果表明,SMITH在动态工具创建和跨任务经验共享方面具有显著优势,能够有效提升智能体的适应能力和解决问题的能力。

🎯 应用场景

SMITH架构具有广泛的应用前景,可用于构建各种需要持续学习和适应环境的智能体,例如:自动化客服、智能助手、机器人流程自动化(RPA)等。通过动态工具创建和经验共享,智能体可以更好地应对复杂多变的任务,提高工作效率和质量。该研究为构建更智能、更灵活的AI系统提供了新的思路。

📄 摘要(原文)

Large Language Model agents face fundamental challenges in adapting to novel tasks due to limitations in tool availability and experience reuse. Existing approaches either rely on predefined tools with limited coverage or build tools from scratch without leveraging past experiences, leading to inefficient exploration and suboptimal performance. We introduce SMITH (Shared Memory Integrated Tool Hub), a unified cognitive architecture that seamlessly integrates dynamic tool creation with cross-task experience sharing through hierarchical memory organization. SMITH organizes agent memory into procedural, semantic, and episodic components, enabling systematic capability expansion while preserving successful execution patterns. Our approach formalizes tool creation as iterative code generation within controlled sandbox environments and experience sharing through episodic memory retrieval with semantic similarity matching. We further propose a curriculum learning strategy based on agent-ensemble difficulty re-estimation. Extensive experiments on the GAIA benchmark demonstrate SMITH's effectiveness, achieving 81.8% Pass@1 accuracy and outperforming state-of-the-art baselines including Alita (75.2%) and Memento (70.9%). Our work establishes a foundation for building truly adaptive agents that continuously evolve their capabilities through principled integration of tool creation and experience accumulation.