MAS-on-the-Fly: Dynamic Adaptation of LLM-based Multi-Agent Systems at Test Time

作者: Guangyi Liu, Haojun Lin, Huan Zeng, Heng Wang, Quanming Yao

分类: cs.MA, cs.AI

发布日期: 2026-02-14

💡 一句话要点

MASFly：测试时动态自适应LLM多智能体系统框架

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 动态自适应 检索增强 经验引导

📋 核心要点

现有LLM多智能体系统依赖手动设计或固定自动化，缺乏部署后的动态适应能力，难以应对复杂多变的任务。
MASFly通过检索增强的SOP实例化和经验引导的监督机制，实现了测试时多智能体系统的动态生成和自适应执行。
实验表明，MASFly在TravelPlanner等基准测试中取得了显著的性能提升，并展现出良好的任务适应性和鲁棒性。

📝 摘要（中文）

基于大型语言模型（LLM）的多智能体系统（MAS）已成为解决复杂任务的一种有前景的范例。然而，现有的工作通常依赖于手动设计或“一刀切”的自动化，缺乏部署后的动态适应性。受生物系统适应方式的启发，我们引入了MASFly，这是一种新颖的多智能体框架，能够在测试时进行动态适应。为了适应系统生成，MASFly采用了一种检索增强的SOP实例化机制，该机制利用自构建的成功协作模式存储库，使LLM能够为新查询组装定制的MAS。对于自适应执行，MASFly结合了一种经验引导的监督机制，其中专门的Watcher智能体参考个性化的经验池来监控系统行为，并提供实时干预。大量的实验表明，MASFly实现了最先进的性能，最显著的是在TravelPlanner基准测试中达到了61.7%的成功率，同时表现出强大的任务适应性和鲁棒性。

🔬 方法详解

问题定义：现有的基于LLM的多智能体系统通常采用预定义的结构和交互模式，缺乏在测试时根据具体任务动态调整的能力。这种静态的系统设计难以适应复杂多变的任务环境，导致性能下降和泛化能力不足。现有的方法要么依赖人工设计，要么采用“一刀切”的自动化方案，无法充分利用LLM的潜力来实现真正的智能协作。

核心思路：MASFly的核心思路是赋予多智能体系统在测试时动态适应的能力，使其能够根据任务需求和环境变化实时调整自身的结构和行为。借鉴生物系统的适应机制，MASFly通过学习和利用历史经验，动态地生成和优化多智能体系统，从而提高其性能和鲁棒性。

技术框架：MASFly包含两个主要模块：自适应系统生成和自适应执行。自适应系统生成模块利用检索增强的SOP（Standard Operating Procedure）实例化机制，从一个自构建的成功协作模式存储库中检索相关的协作模式，并利用LLM生成定制的多智能体系统。自适应执行模块则采用经验引导的监督机制，通过一个专门的Watcher智能体监控系统行为，并根据个性化的经验池提供实时干预。

关键创新：MASFly的关键创新在于其动态适应能力，它能够在测试时根据任务需求和环境变化实时调整多智能体系统的结构和行为。这种动态适应能力是通过检索增强的SOP实例化和经验引导的监督机制来实现的。与现有方法相比，MASFly不再依赖预定义的结构和交互模式，而是能够根据具体任务动态地生成和优化多智能体系统。

关键设计：SOP实例化机制的关键在于构建一个包含成功协作模式的存储库，并设计一个有效的检索算法来找到相关的协作模式。经验引导的监督机制的关键在于设计一个能够有效监控系统行为并提供实时干预的Watcher智能体，以及构建一个能够反映系统经验的个性化经验池。具体的参数设置和网络结构等技术细节在论文中进行了详细描述。

🖼️ 关键图片

📊 实验亮点

MASFly在TravelPlanner基准测试中取得了显著的性能提升，成功率达到61.7%，超越了现有的最先进方法。此外，实验还表明MASFly具有强大的任务适应性和鲁棒性，能够在不同的任务和环境下保持良好的性能。这些结果验证了MASFly的有效性和优越性。

🎯 应用场景

MASFly具有广泛的应用前景，可应用于智能交通、智能制造、金融服务、医疗健康等领域。例如，在智能交通领域，MASFly可以用于构建能够实时优化交通流量的多智能体系统；在智能制造领域，MASFly可以用于构建能够协同完成复杂装配任务的多智能体系统。该研究有望推动多智能体系统在实际应用中的普及和发展。

📄 摘要（原文）

Large Language Model (LLM)-based multi-agent systems (MAS) have emerged as a promising paradigm for solving complex tasks. However, existing works often rely on manual designs or "one-size-fits-all" automation, lacking dynamic adaptability after deployment. Inspired by how biological systems adapt, we introduce MASFly, a novel multi-agent framework enabling dynamic adaptation at test time. To adapt system generation, MASFly employs a retrieval-augmented SOP instantiation mechanism that leverages a self-constructed repository of successful collaboration patterns, enabling the LLM to assemble customized MASs for new queries. For adaptive execution, MASFly incorporates an experience-guided supervision mechanism, where a dedicated Watcher agent monitors system behaviors with reference to a personalized experience pool and provides real-time interventions. Extensive experiments demonstrate that MASFly achieves state-of-the-art performance, most notably a 61.7% success rate on the TravelPlanner benchmark, while exhibiting strong task adaptability and robustness.

MAS-on-the-Fly: Dynamic Adaptation of LLM-based Multi-Agent Systems at Test Time

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理