SYMPHONY: Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly

📄 arXiv: 2601.22623v1 📥 PDF

作者: Wei Zhu, Zhiwen Tang, Kun Yue

分类: cs.AI, cs.MA

发布日期: 2026-01-30

备注: Accepted by NeurIPS 2025


💡 一句话要点

SYMPHONY:异构语言模型协同的多智能体规划框架,提升复杂任务解决能力

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 语言模型 蒙特卡洛树搜索 协同规划 异构智能体

📋 核心要点

  1. 现有方法在复杂任务规划中依赖单智能体框架,导致搜索分支多样性不足,限制了探索能力。
  2. SYMPHONY通过集成异构语言模型智能体池,利用不同智能体的推理模式,提升rollout的多样性。
  3. 实验表明,SYMPHONY在使用开源LLM时表现出色,使用云端LLM时性能进一步提升,超越现有基线。

📝 摘要(中文)

本文提出了一种名为SYMPHONY的协同多智能体规划框架,该框架集成了异构语言模型智能体池,旨在解决现有方法在复杂问题求解任务中探索能力不足的问题。现有方法主要采用单智能体框架,在蒙特卡洛树搜索(MCTS)规划期间生成搜索分支和估计奖励,这限制了生成分支的多样性,导致规划性能欠佳。SYMPHONY通过利用不同智能体的多样化推理模式,增强了rollout的多样性,从而促进更有效的探索。实验结果表明,即使使用可在消费级硬件上部署的开源LLM,SYMPHONY也能取得优异的性能。当使用通过API访问的云端LLM增强时,SYMPHONY的性能进一步提升,超越了现有的state-of-the-art基线,突显了异构多智能体协同在规划任务中的有效性。

🔬 方法详解

问题定义:论文旨在解决复杂任务规划中,现有方法因采用单智能体框架而导致的探索能力不足问题。单智能体框架在蒙特卡洛树搜索(MCTS)规划中,生成的分支多样性有限,难以充分探索解空间,从而影响规划性能。现有方法的痛点在于无法有效利用多种推理模式,导致搜索效率低下。

核心思路:SYMPHONY的核心思路是引入多智能体协同规划,利用异构语言模型智能体池中不同智能体的多样化推理模式,增强rollout的多样性。通过多个智能体并行探索,可以更全面地覆盖解空间,从而提高找到最优解的可能性。这种协同方式旨在弥补单智能体框架的局限性,提升整体规划性能。

技术框架:SYMPHONY的整体框架包含以下主要模块:1) 异构语言模型智能体池:包含多个基于不同语言模型的智能体,每个智能体具有不同的推理能力和知识背景。2) 蒙特卡洛树搜索(MCTS):利用MCTS算法进行规划,每个智能体在MCTS的rollout阶段贡献自己的搜索分支。3) 协同机制:设计协同机制,协调不同智能体的行为,例如通过投票或加权平均等方式整合不同智能体的建议。4) 奖励函数:定义奖励函数,评估每个rollout的质量,指导MCTS的搜索方向。

关键创新:SYMPHONY的关键创新在于将异构语言模型与多智能体规划相结合。与传统的单智能体规划方法相比,SYMPHONY能够利用多个智能体的多样性,更有效地探索解空间。此外,SYMPHONY的协同机制能够整合不同智能体的优势,提高整体规划性能。这种异构多智能体协同是与现有方法最本质的区别。

关键设计:SYMPHONY的关键设计包括:1) 智能体池的构建:选择具有不同架构和训练数据的语言模型,以确保智能体之间的异构性。2) 协同机制的设计:根据具体任务选择合适的协同策略,例如投票、加权平均或动态分配任务等。3) 奖励函数的设计:设计能够准确评估rollout质量的奖励函数,例如基于任务完成度、资源消耗或时间效率等指标。4) MCTS参数的调整:根据智能体的数量和任务的复杂度,调整MCTS的参数,例如搜索深度、分支因子和探索率等。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,SYMPHONY在多个benchmark任务上取得了显著的性能提升。例如,在使用开源LLM时,SYMPHONY的性能优于现有的单智能体规划方法。当使用云端LLM增强时,SYMPHONY的性能进一步提升,超越了state-of-the-art基线。具体而言,在XXX任务上,SYMPHONY的成功率提高了XX%,平均奖励提高了YY%。

🎯 应用场景

SYMPHONY具有广泛的应用前景,可应用于机器人导航、游戏AI、任务调度、自动驾驶等领域。通过利用异构语言模型智能体的协同规划能力,SYMPHONY能够解决复杂环境下的决策问题,提高任务完成效率和鲁棒性。未来,SYMPHONY有望成为构建更智能、更自主的智能体系统的关键技术。

📄 摘要(原文)

Recent advancements have increasingly focused on leveraging large language models (LLMs) to construct autonomous agents for complex problem-solving tasks. However, existing approaches predominantly employ a single-agent framework to generate search branches and estimate rewards during Monte Carlo Tree Search (MCTS) planning. This single-agent paradigm inherently limits exploration capabilities, often resulting in insufficient diversity among generated branches and suboptimal planning performance. To overcome these limitations, we propose Synergistic Multi-agent Planning with Heterogeneous langauge model assembly (SYMPHONY), a novel multi-agent planning framework that integrates a pool of heterogeneous language model-based agents. By leveraging diverse reasoning patterns across agents, SYMPHONY enhances rollout diversity and facilitates more effective exploration. Empirical results across multiple benchmark tasks show that SYMPHONY achieves strong performance even when instantiated with open-source LLMs deployable on consumer-grade hardware. When enhanced with cloud-based LLMs accessible via API, SYMPHONY demonstrates further improvements, outperforming existing state-of-the-art baselines and underscoring the effectiveness of heterogeneous multi-agent coordination in planning tasks.