Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation

📄 arXiv: 2507.18224v4 📥 PDF

作者: Shiyuan Li, Yixin Liu, Qingsong Wen, Chengqi Zhang, Shirui Pan

分类: cs.MA, cs.CL

发布日期: 2025-07-24 (更新: 2025-11-19)

备注: Accepted as an oral presentation by AAAI 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出ARG-Designer,通过自回归图生成自动设计多智能体通信拓扑,提升任务适应性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 通信拓扑设计 自回归图生成 大型语言模型 自动化设计

📋 核心要点

  1. 现有MAS设计方法依赖预定义智能体和交互结构,缺乏对任务的适应性,限制了其应用范围。
  2. ARG-Designer将MAS设计转化为条件自回归图生成,动态确定智能体数量、角色和通信链接。
  3. 实验表明,ARG-Designer在多个基准测试中达到SOTA性能,并提升了token效率和可扩展性。

📝 摘要(中文)

本文提出了一种基于大型语言模型(LLM)的多智能体系统(MAS)自动设计方法,旨在解决复杂问题。现有方法依赖于模板图修改,受限于预定义的智能体集合和硬编码的交互结构,难以适应特定任务需求。为此,本文将MAS设计重新定义为条件自回归图生成任务,联合设计系统组成和结构。提出了ARG-Designer,一种新型自回归模型,通过从零开始构建协作图来实现这一范式。ARG-Designer以自然语言任务查询为条件,顺序且动态地确定所需智能体的数量,从可扩展的池中选择合适的角色,并建立它们之间的最佳通信链接。这种生成方法创建了一个定制化的拓扑结构,灵活且可扩展,精确地满足不同任务的独特需求。在六个不同的基准测试中进行的大量实验表明,ARG-Designer不仅实现了最先进的性能,而且还具有更高的token效率和更强的可扩展性。

🔬 方法详解

问题定义:现有基于LLM的多智能体系统设计方法,通常采用模板图修改的方式,即在预先定义好的智能体集合和交互结构上进行调整。这种方法的痛点在于,无法灵活地适应不同任务的需求,因为智能体的数量、角色以及它们之间的通信方式都是固定的,难以根据任务的特性进行定制化设计。

核心思路:本文的核心思路是将多智能体系统的设计问题转化为一个条件自回归图生成问题。这意味着,不再依赖于预定义的模板图,而是从零开始,根据给定的任务描述,逐步生成智能体的数量、角色以及它们之间的通信拓扑结构。这种自回归的方式允许模型根据已生成的部分图结构,动态地调整后续的生成过程,从而更好地适应任务的需求。

技术框架:ARG-Designer的整体框架是一个自回归生成模型。它以自然语言的任务描述作为输入,然后逐步生成多智能体系统的协作图。这个过程可以分为以下几个阶段:1)智能体数量预测:模型首先预测需要多少个智能体来完成任务。2)角色选择:对于每个智能体,模型从一个可扩展的角色池中选择合适的角色。3)通信链接建立:模型确定智能体之间应该如何进行通信,即建立智能体之间的连接。整个过程是自回归的,意味着每个阶段的决策都会受到之前阶段决策的影响。

关键创新:ARG-Designer最关键的创新在于它将多智能体系统的设计问题转化为一个条件自回归图生成问题。与传统的模板图修改方法相比,这种方法具有更高的灵活性和可扩展性,可以根据任务的需求动态地调整智能体的数量、角色和通信拓扑结构。此外,ARG-Designer还引入了一个可扩展的角色池,允许模型根据任务的需要选择不同的智能体角色。

关键设计:ARG-Designer的具体实现细节未知,但可以推测其可能包含以下关键设计:1)使用Transformer架构作为自回归生成模型的基础。2)设计合适的损失函数,用于训练模型生成高质量的协作图。3)采用合适的图神经网络(GNN)来编码和处理图结构信息。4)角色池的设计需要考虑角色的多样性和可扩展性,以便适应不同的任务需求。5)可能使用了强化学习等技术来优化生成的协作图的性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ARG-Designer在六个不同的基准测试中取得了state-of-the-art的性能。相较于现有方法,ARG-Designer不仅在任务完成度上有所提升,而且还具有更高的token效率和更强的可扩展性。具体的性能提升数据和对比基线未知,但总体而言,ARG-Designer在多智能体系统自动设计方面取得了显著的进展。

🎯 应用场景

该研究成果可应用于各种需要多智能体协作的复杂问题,例如:智能交通系统、供应链管理、金融交易、软件开发等。通过自动设计高效的通信拓扑,可以显著提升多智能体系统的性能和效率,降低人工设计成本,并促进多智能体技术在更广泛领域的应用。

📄 摘要(原文)

Multi-agent systems (MAS) based on large language models (LLMs) have emerged as a powerful solution for dealing with complex problems across diverse domains. The effectiveness of MAS is critically dependent on its collaboration topology, which has become a focal point for automated design research. However, existing approaches are fundamentally constrained by their reliance on a template graph modification paradigm with a predefined set of agents and hard-coded interaction structures, significantly limiting their adaptability to task-specific requirements. To address these limitations, we reframe MAS design as a conditional autoregressive graph generation task, where both the system composition and structure are designed jointly. We propose ARG-Designer, a novel autoregressive model that operationalizes this paradigm by constructing the collaboration graph from scratch. Conditioned on a natural language task query, ARG-Designer sequentially and dynamically determines the required number of agents, selects their appropriate roles from an extensible pool, and establishes the optimal communication links between them. This generative approach creates a customized topology in a flexible and extensible manner, precisely tailored to the unique demands of different tasks. Extensive experiments across six diverse benchmarks demonstrate that ARG-Designer not only achieves state-of-the-art performance but also enjoys significantly greater token efficiency and enhanced extensibility. The source code of ARG-Designer is available at https://github.com/Shiy-Li/ARG-Designer.