MetaAgent: Automatically Constructing Multi-Agent Systems Based on Finite State Machines

📄 arXiv: 2507.22606v1 📥 PDF

作者: Yaolun Zhang, Xiaogeng Liu, Chaowei Xiao

分类: cs.AI

发布日期: 2025-07-30

备注: ICML 2025


💡 一句话要点

MetaAgent:基于有限状态机自动构建多智能体系统

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 有限状态机 自动构建 大型语言模型 优化算法

📋 核心要点

  1. 现有的人工设计多智能体系统泛化性不足,自动设计方法存在工具集成、数据依赖和通信结构等问题。
  2. MetaAgent 提出基于有限状态机的多智能体自动构建框架,通过优化算法改进系统设计。
  3. 实验结果表明,MetaAgent 生成的系统性能超越其他自动设计方法,可与人工设计系统媲美。

📝 摘要(中文)

大型语言模型(LLMs)已展现出在多智能体系统中解决各种实际任务的能力。然而,现有的人工设计的多智能体框架通常仅限于少量预定义场景,而当前的自动设计方法存在诸多局限,例如缺乏工具集成、依赖外部训练数据以及通信结构僵化。本文提出了MetaAgent,一个基于有限状态机的框架,可以自动生成多智能体系统。给定任务描述,MetaAgent将设计一个多智能体系统,并通过优化算法对其进行改进。在部署多智能体系统时,有限状态机将控制智能体的动作和状态转换。为了评估我们的框架,我们在基于文本的任务和实际任务上进行了实验。结果表明,生成的多智能体系统超越了其他自动设计方法,并且可以达到与针对特定任务优化的人工设计的多智能体系统相当的性能。

🔬 方法详解

问题定义:论文旨在解决多智能体系统自动构建的问题。现有方法,如人工设计框架,通常只能处理预定义的少量场景,泛化能力差。而现有的自动设计方法,则存在工具集成度低、依赖外部训练数据、通信结构僵化等问题,限制了其应用范围和性能。

核心思路:论文的核心思路是利用有限状态机(FSM)来驱动多智能体系统的自动生成和优化。通过将智能体的行为和状态转换建模为 FSM,可以实现对智能体行为的精确控制和灵活调整。同时,结合优化算法,可以根据任务描述自动搜索和改进多智能体系统的设计,从而克服现有方法的局限性。

技术框架:MetaAgent 的整体框架包含以下几个主要阶段:1) 任务描述输入:接收任务的文本描述作为输入。2) 多智能体系统设计:基于任务描述,自动设计多智能体系统的结构,包括智能体的数量、角色和通信方式等。3) 有限状态机生成:为每个智能体生成有限状态机,定义其行为和状态转换规则。4) 优化算法:利用优化算法(具体算法未知)对多智能体系统进行改进,例如调整 FSM 的参数或改变智能体之间的通信策略。5) 系统部署:将优化后的多智能体系统部署到实际环境中,由 FSM 控制智能体的行为。

关键创新:MetaAgent 的关键创新在于将有限状态机引入到多智能体系统的自动构建过程中。与传统的基于规则或模型的自动设计方法相比,基于 FSM 的方法具有更强的灵活性和可解释性。此外,MetaAgent 还结合了优化算法,可以自动搜索和改进多智能体系统的设计,从而提高其性能和适应性。

关键设计:论文中关于 FSM 的具体设计细节(例如状态的定义、状态转换的条件、动作的执行方式等)以及优化算法的具体实现(例如目标函数、搜索策略等)描述不足,属于未知信息。但可以推测,FSM 的设计需要考虑任务的特点和智能体的能力,而优化算法则需要平衡系统的性能和复杂性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,MetaAgent 生成的多智能体系统在文本任务和实际任务上均表现出色,超越了其他自动设计方法。更重要的是,MetaAgent 的性能可以与针对特定任务优化的人工设计的多智能体系统相媲美,这证明了其自动设计方法的有效性和潜力。具体的性能提升数据未知。

🎯 应用场景

MetaAgent 有潜力应用于各种需要多智能体协作的场景,例如智能交通、仓储物流、客户服务、游戏 AI 等。通过自动构建和优化多智能体系统,可以降低开发成本,提高系统性能,并实现更灵活和智能的解决方案。未来,该技术有望推动多智能体系统在更多领域的应用。

📄 摘要(原文)

Large Language Models (LLMs) have demonstrated the ability to solve a wide range of practical tasks within multi-agent systems. However, existing human-designed multi-agent frameworks are typically limited to a small set of pre-defined scenarios, while current automated design methods suffer from several limitations, such as the lack of tool integration, dependence on external training data, and rigid communication structures. In this paper, we propose MetaAgent, a finite state machine based framework that can automatically generate a multi-agent system. Given a task description, MetaAgent will design a multi-agent system and polish it through an optimization algorithm. When the multi-agent system is deployed, the finite state machine will control the agent's actions and the state transitions. To evaluate our framework, we conduct experiments on both text-based tasks and practical tasks. The results indicate that the generated multi-agent system surpasses other auto-designed methods and can achieve a comparable performance with the human-designed multi-agent system, which is optimized for those specific tasks.