EvoAgent: An Evolvable Agent Framework with Skill Learning and Multi-Agent Delegation

📄 arXiv: 2604.20133v1 📥 PDF

作者: Aimin Zhang, Jiajing Guo, Fuwei Jia, Chen Lv, Boyu Wang, Fangzheng Li

分类: cs.AI

发布日期: 2026-04-22


💡 一句话要点

EvoAgent:一种可进化Agent框架,通过技能学习和多Agent委托解决复杂任务。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: LLM Agent 技能学习 多Agent系统 任务分解 进化算法

📋 核心要点

  1. 现有LLM Agent在复杂任务处理中存在技能获取和优化困难,以及长期能力积累不足的问题。
  2. EvoAgent通过结构化技能学习和分层子Agent委托机制,实现技能的持续生成、优化和动态任务分解。
  3. 实验表明,EvoAgent显著提升了LLM Agent在专业性、准确性和实用性方面的表现,平均得分提升约28%。

📝 摘要(中文)

本文提出了EvoAgent,一个可进化的大语言模型(LLM)Agent框架,它集成了结构化的技能学习和分层子Agent委托机制。EvoAgent将技能建模为多文件结构的、具备触发机制和进化元数据的能力单元,并通过用户反馈驱动的闭环过程实现技能的持续生成和优化。此外,通过结合三阶段技能匹配策略和三层记忆架构,该框架支持复杂问题的动态任务分解和长期能力积累。基于真实外贸场景的实验结果表明,集成EvoAgent后,GPT5.2在专业性、准确性和实用性方面取得了显著提升。在五维LLM-as-Judge评估协议下,总体平均得分提高了约28%。进一步的模型迁移实验表明,Agent系统的性能不仅取决于底层模型的内在能力,还取决于模型与Agent架构之间的协同程度。

🔬 方法详解

问题定义:现有的大语言模型Agent在处理复杂任务时,面临着技能获取和优化困难的问题。它们通常依赖于预定义的技能或提示工程,难以适应不断变化的任务需求。此外,长期能力积累不足,导致Agent在处理新任务时需要从头开始学习,效率低下。现有方法缺乏有效的技能管理和进化机制,难以实现Agent能力的持续提升。

核心思路:EvoAgent的核心思路是将Agent的技能建模为结构化的、可进化的单元,并通过用户反馈驱动的闭环过程实现技能的持续生成和优化。通过分层子Agent委托机制,将复杂任务分解为更小的子任务,并分配给不同的子Agent执行,从而提高任务处理的效率和准确性。这种设计借鉴了生物进化的思想,使Agent能够不断适应环境变化,提升自身能力。

技术框架:EvoAgent框架包含以下主要模块:1) 技能建模:将技能建模为多文件结构的单元,包含技能描述、触发机制和进化元数据。2) 技能学习:通过用户反馈驱动的闭环过程,生成和优化技能。3) 任务分解:采用三阶段技能匹配策略,将复杂任务分解为子任务。4) 子Agent委托:将子任务分配给不同的子Agent执行。5) 记忆架构:采用三层记忆架构,支持长期能力积累。整个流程包括任务输入、任务分解、技能匹配、子Agent执行、结果整合和用户反馈等步骤。

关键创新:EvoAgent的关键创新在于其可进化的技能学习机制和分层子Agent委托机制。与现有方法相比,EvoAgent能够自动生成和优化技能,无需人工干预。此外,通过分层子Agent委托机制,EvoAgent能够处理更复杂的任务,并实现长期能力积累。这种设计使得Agent能够不断适应环境变化,提升自身能力。

关键设计:EvoAgent的关键设计包括:1) 技能表示:采用多文件结构表示技能,包含技能描述、触发机制和进化元数据。2) 技能匹配策略:采用三阶段技能匹配策略,包括粗粒度匹配、细粒度匹配和上下文匹配。3) 记忆架构:采用三层记忆架构,包括短期记忆、中期记忆和长期记忆。4) 进化算法:采用遗传算法优化技能参数,例如触发阈值和奖励函数。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,集成EvoAgent后,GPT5.2在真实外贸场景中的专业性、准确性和实用性方面取得了显著提升。在五维LLM-as-Judge评估协议下,总体平均得分提高了约28%。模型迁移实验表明,Agent系统的性能不仅取决于底层模型的内在能力,还取决于模型与Agent架构之间的协同程度。这些结果验证了EvoAgent的有效性和通用性。

🎯 应用场景

EvoAgent具有广泛的应用前景,例如智能客服、自动化办公、智能家居、金融风控等领域。它可以应用于需要处理复杂任务和不断学习的场景,例如外贸谈判、合同审核、客户服务等。通过不断学习和进化,EvoAgent可以提高工作效率、降低成本,并提供更优质的服务。未来,EvoAgent可以与其他技术相结合,例如知识图谱、强化学习等,进一步提升其能力和应用范围。

📄 摘要(原文)

This paper proposes EvoAgent - an evolvable large language model (LLM) agent framework that integrates structured skill learning with a hierarchical sub-agent delegation mechanism. EvoAgent models skills as multi-file structured capability units equipped with triggering mechanisms and evolutionary metadata, and enables continuous skill generation and optimization through a user-feedback-driven closed-loop process. In addition, by incorporating a three-stage skill matching strategy and a three-layer memory architecture, the framework supports dynamic task decomposition for complex problems and long-term capability accumulation. Experimental results based on real-world foreign trade scenarios demonstrate that, after integrating EvoAgent, GPT5.2 achieves significant improvements in professionalism, accuracy, and practical utility. Under a five-dimensional LLM-as-Judge evaluation protocol, the overall average score increases by approximately 28%. Further model transfer experiments indicate that the performance of an agent system depends not only on the intrinsic capabilities of the underlying model, but also on the degree of synergy between the model and the agent architecture.