EvoAgentX: An Automated Framework for Evolving Agentic Workflows

📄 arXiv: 2507.03616v2 📥 PDF

作者: Yingxu Wang, Siwei Liu, Jinyuan Fang, Zaiqiao Meng

分类: cs.AI

发布日期: 2025-07-04 (更新: 2025-09-23)

🔗 代码/项目: GITHUB


💡 一句话要点

EvoAgentX:自动化演进Agent工作流的开源框架,提升多任务性能。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多Agent系统 工作流优化 自动化演进 大型语言模型 智能Agent

📋 核心要点

  1. 现有多Agent系统框架依赖手动配置,缺乏动态演进和性能优化的原生支持,限制了其应用范围。
  2. EvoAgentX通过自动化生成、执行和演进优化多Agent工作流,实现性能提升,降低人工干预。
  3. EvoAgentX在多项任务上取得了显著性能提升,例如在GAIA数据集上整体准确率提升高达20%。

📝 摘要(中文)

本文提出EvoAgentX,一个开源平台,旨在自动化多Agent工作流的生成、执行和演进优化。现有的多Agent系统框架通常需要手动配置工作流,并且缺乏对动态演进和性能优化的原生支持。此外,许多多Agent系统优化算法没有集成到一个统一的框架中。EvoAgentX采用模块化架构,包含五个核心层:基础组件层、Agent层、工作流层、演进层和评估层。特别地,在演进层中,EvoAgentX集成了TextGrad、AFlow和MIPRO三种多Agent系统优化算法,以迭代地改进Agent提示、工具配置和工作流拓扑。在HotPotQA、MBPP和MATH数据集上,EvoAgentX分别针对多跳推理、代码生成和数学问题求解进行了评估,并使用GAIA评估了其在真实世界任务中的表现。实验结果表明,EvoAgentX持续实现了显著的性能提升,包括HotPotQA F1值提高7.44%,MBPP pass@1提高10.00%,MATH解决准确率提高10.00%,以及GAIA上的整体准确率提高高达20.00%。

🔬 方法详解

问题定义:现有的多Agent系统(MAS)框架在解决复杂任务时,通常需要人工配置工作流,这既耗时又容易出错。此外,这些框架缺乏对动态演进和性能优化的原生支持,难以适应不断变化的任务需求。许多MAS优化算法分散存在,没有集成到一个统一的平台中,限制了算法的复用和比较。

核心思路:EvoAgentX的核心思路是自动化多Agent工作流的生成、执行和演进优化。通过集成多种优化算法,EvoAgentX能够迭代地改进Agent的提示、工具配置和工作流拓扑,从而提升整体性能。这种自动化演进的方法旨在减少人工干预,并使MAS能够更好地适应复杂和动态的任务环境。

技术框架:EvoAgentX采用模块化架构,包含五个核心层:基础组件层、Agent层、工作流层、演进层和评估层。基础组件层提供构建Agent和工作流所需的各种组件,如LLM接口、工具接口等。Agent层定义了Agent的行为和能力。工作流层定义了Agent之间的协作方式和任务流程。演进层集成了多种优化算法,用于迭代改进Agent和工作流。评估层用于评估Agent和工作流的性能。

关键创新:EvoAgentX的关键创新在于其自动化演进的能力。通过集成TextGrad、AFlow和MIPRO等多种优化算法,EvoAgentX能够自动搜索最优的Agent提示、工具配置和工作流拓扑。与需要手动配置和优化的传统MAS框架相比,EvoAgentX能够显著降低人工成本,并提升整体性能。

关键设计:EvoAgentX的演进层是其核心组成部分。该层集成了三种MAS优化算法:TextGrad、AFlow和MIPRO。TextGrad使用梯度下降来优化Agent的提示。AFlow使用进化算法来优化工作流拓扑。MIPRO使用混合整数规划来优化Agent的工具选择。这些算法协同工作,以迭代地改进Agent和工作流的各个方面。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

EvoAgentX在多个数据集上取得了显著的性能提升。在HotPotQA数据集上,F1值提高了7.44%;在MBPP数据集上,pass@1提高了10.00%;在MATH数据集上,解决准确率提高了10.00%;在GAIA数据集上,整体准确率提高了高达20.00%。这些结果表明,EvoAgentX能够有效地优化多Agent工作流,并提升其在各种复杂任务上的性能。

🎯 应用场景

EvoAgentX可应用于各种需要多Agent协作的复杂任务,例如智能客服、自动化软件开发、金融风险管理和科学研究。通过自动化Agent工作流的生成和优化,EvoAgentX能够显著提升任务效率和性能,降低人工成本,并促进多Agent系统的广泛应用。

📄 摘要(原文)

Multi-agent systems (MAS) have emerged as a powerful paradigm for orchestrating large language models (LLMs) and specialized tools to collaboratively address complex tasks. However, existing MAS frameworks often require manual workflow configuration and lack native support for dynamic evolution and performance optimization. In addition, many MAS optimization algorithms are not integrated into a unified framework. In this paper, we present EvoAgentX, an open-source platform that automates the generation, execution, and evolutionary optimization of multi-agent workflows. EvoAgentX employs a modular architecture consisting of five core layers: the basic components, agent, workflow, evolving, and evaluation layers. Specifically, within the evolving layer, EvoAgentX integrates three MAS optimization algorithms, TextGrad, AFlow, and MIPRO, to iteratively refine agent prompts, tool configurations, and workflow topologies. We evaluate EvoAgentX on HotPotQA, MBPP, and MATH for multi-hop reasoning, code generation, and mathematical problem solving, respectively, and further assess it on real-world tasks using GAIA. Experimental results show that EvoAgentX consistently achieves significant performance improvements, including a 7.44% increase in HotPotQA F1, a 10.00% improvement in MBPP pass@1, a 10.00% gain in MATH solve accuracy, and an overall accuracy improvement of up to 20.00% on GAIA. The source code is available at: https://github.com/EvoAgentX/EvoAgentX