Multi-agent Architecture Search via Agentic Supernet

📄 arXiv: 2502.04180v2 📥 PDF

作者: Guibin Zhang, Luyang Niu, Junfeng Fang, Kun Wang, Lei Bai, Xiang Wang

分类: cs.LG, cs.CL, cs.MA

发布日期: 2025-02-06 (更新: 2025-06-09)


💡 一句话要点

提出基于Agentic Supernet的多智能体架构搜索MaAS,实现查询感知的资源高效分配。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 架构搜索 Agentic Supernet 查询感知 资源分配

📋 核心要点

  1. 现有多智能体系统设计依赖人工,或产生静态、复杂的“一刀切”方案,无法动态适应不同查询的需求。
  2. 论文提出Agentic Supernet,通过优化智能体架构的概率分布,实现查询感知的智能体系统采样。
  3. 实验表明,MaAS在降低推理成本的同时,性能超越现有方法,并具备良好的迁移能力。

📝 摘要(中文)

本文提出了一种基于Agentic Supernet的多智能体架构搜索框架MaAS,旨在解决现有方法无法根据查询难度和领域动态分配推理资源的问题。MaAS优化一个agentic supernet,该网络是智能体架构的概率和连续分布。通过从supernet中采样查询相关的智能体系统,MaAS能够提供高质量的解决方案并定制资源分配,例如LLM调用、工具调用和token成本。在六个基准测试上的综合评估表明,MaAS仅需现有手工或自动多智能体系统6%~45%的推理成本,性能超越它们0.54%~11.82%,并具有卓越的跨数据集和跨LLM主干可迁移性。

🔬 方法详解

问题定义:现有方法在构建多智能体系统时,通常依赖人工设计或自动化搜索静态的、复杂的系统。这些系统无法根据不同查询的难度和领域动态地分配推理资源,导致资源浪费和效率低下。因此,需要一种能够根据查询自适应调整架构的多智能体系统设计方法。

核心思路:论文的核心思路是优化一个Agentic Supernet,它代表了智能体架构的概率和连续分布。通过从这个Supernet中采样,可以得到针对特定查询优化的智能体系统。这种方法避免了搜索单一的、静态的架构,而是允许根据查询的特性动态地选择合适的架构。

技术框架:MaAS框架包含以下主要模块:1) Agentic Supernet构建:定义智能体架构的搜索空间,包括不同的智能体角色、工具选择、通信方式等。2) 查询感知的采样:根据输入的查询,从Supernet中采样出合适的智能体架构。采样过程可以基于强化学习或进化算法等优化策略。3) 智能体协作执行:采样的智能体系统协同完成任务,例如信息检索、问题求解等。4) 性能评估与反馈:根据智能体系统的性能,更新Supernet的参数,从而优化架构分布。

关键创新:最重要的技术创新点在于Agentic Supernet的概念和查询感知的采样机制。与现有方法不同,MaAS不是搜索单一的智能体架构,而是学习一个架构的分布,并根据查询动态地选择合适的架构。这种方法能够更好地适应不同查询的需求,并实现资源的高效利用。

关键设计:Agentic Supernet的设计需要考虑以下关键因素:1) 搜索空间:定义智能体架构的组成元素,例如智能体的数量、类型、工具选择等。2) 采样策略:选择合适的采样算法,例如强化学习、进化算法等,以优化架构的选择。3) 性能评估指标:定义评估智能体系统性能的指标,例如准确率、效率、成本等。4) Supernet更新机制:设计合适的更新机制,以根据性能反馈优化架构分布。

🖼️ 关键图片

img_0

📊 实验亮点

实验结果表明,MaAS在六个基准测试中,仅需现有手工或自动多智能体系统6%~45%的推理成本,性能超越它们0.54%~11.82%,并具有卓越的跨数据集和跨LLM主干可迁移性。这些结果验证了MaAS在资源效率和性能方面的优势。

🎯 应用场景

MaAS可应用于各种需要多智能体协作的场景,例如智能客服、自动化报告生成、复杂问题求解等。通过动态调整智能体架构,MaAS能够在保证性能的同时,显著降低推理成本,提高资源利用率。未来,该技术有望推动多智能体系统在实际应用中的普及。

📄 摘要(原文)

Large Language Model (LLM)-empowered multi-agent systems extend the cognitive boundaries of individual agents through disciplined collaboration and interaction, while constructing these systems often requires labor-intensive manual designs. Despite the availability of methods to automate the design of agentic workflows, they typically seek to identify a static, complex, one-size-fits-all system, which, however, fails to dynamically allocate inference resources based on the difficulty and domain of each query. To address this challenge, we shift away from the pursuit of a monolithic agentic system, instead optimizing the \textbf{agentic supernet}, a probabilistic and continuous distribution of agentic architectures. We introduce MaAS, an automated framework that samples query-dependent agentic systems from the supernet, delivering high-quality solutions and tailored resource allocation (\textit{e.g.}, LLM calls, tool calls, token cost). Comprehensive evaluation across six benchmarks demonstrates that MaAS \textbf{(I)} requires only $6\sim45\%$ of the inference costs of existing handcrafted or automated multi-agent systems, \textbf{(II)} surpasses them by $0.54\%\sim11.82\%$, and \textbf{(III)} enjoys superior cross-dataset and cross-LLM-backbone transferability.