ResMAS: Resilience Optimization in LLM-based Multi-agent Systems
作者: Zhilun Zhou, Zihan Liu, Jiahe Liu, Qingyu Shao, Yihan Wang, Kun Shao, Depeng Jin, Fengli Xu
分类: cs.AI
发布日期: 2026-01-08
💡 一句话要点
ResMAS:提升基于LLM的多智能体系统在扰动下的鲁棒性
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多智能体系统 大型语言模型 鲁棒性优化 强化学习 拓扑生成 提示优化 通信拓扑 智能体失效
📋 核心要点
- 现有基于LLM的多智能体系统易受扰动影响,缺乏主动的鲁棒性设计,通常只能被动防御。
- ResMAS框架通过强化学习自动设计鲁棒的通信拓扑,并结合拓扑感知的提示优化,提升系统整体鲁棒性。
- 实验证明ResMAS能显著提升多智能体系统在多种任务下的鲁棒性,并具备良好的泛化能力。
📝 摘要(中文)
本文研究了基于大型语言模型的多智能体系统(LLM-based MAS)在扰动下的鲁棒性问题。现有工作主要集中在事后检测和缓解攻击,缺乏对系统固有鲁棒性的主动设计。研究发现,通信拓扑和提示设计对系统鲁棒性有显著影响。为此,提出了ResMAS框架,分两个阶段提升MAS的鲁棒性。首先,训练一个奖励模型来预测MAS的鲁棒性,并基于此训练一个拓扑生成器,通过强化学习自动设计针对特定任务的鲁棒拓扑。其次,引入一种拓扑感知的提示优化方法,根据智能体之间的连接和交互来优化每个智能体的提示。大量实验表明,该方法显著提高了MAS在各种约束下的鲁棒性,并具有很强的泛化能力。
🔬 方法详解
问题定义:论文旨在解决基于LLM的多智能体系统在面对扰动(如智能体失效)时鲁棒性不足的问题。现有方法主要关注于扰动发生后的检测和防御,缺乏对系统本身鲁棒性的主动设计,使得系统在面对突发情况时容易崩溃。
核心思路:论文的核心思路是通过优化多智能体系统的通信拓扑结构和提示设计来提升其鲁棒性。通过学习得到一个更健壮的拓扑结构,使得即使部分智能体失效,系统也能维持正常运行。同时,根据拓扑结构优化每个智能体的提示,使其更好地适应与其他智能体的交互,从而提高整体性能。
技术框架:ResMAS框架包含两个主要阶段:1) 鲁棒拓扑生成:首先,训练一个奖励模型,用于预测给定拓扑结构的鲁棒性。然后,利用强化学习训练一个拓扑生成器,该生成器以任务描述为输入,输出一个鲁棒的拓扑结构。2) 拓扑感知提示优化:根据生成的拓扑结构,优化每个智能体的提示。具体来说,每个智能体的提示会考虑其与其他智能体的连接和交互,从而更好地适应整个系统的运行。
关键创新:论文的关键创新在于提出了一个端到端的框架,能够自动设计鲁棒的多智能体系统。与现有方法相比,ResMAS不是被动地应对扰动,而是主动地优化系统的结构和行为,从而提高其在各种情况下的适应能力。此外,拓扑感知的提示优化方法也能够充分利用智能体之间的关系,进一步提升系统的性能。
关键设计:在拓扑生成阶段,奖励模型的设计至关重要,它需要准确地评估拓扑结构的鲁棒性。强化学习算法的选择也会影响拓扑生成器的训练效果。在提示优化阶段,如何有效地利用拓扑信息来调整提示是一个关键问题。论文中可能使用了某种形式的注意力机制或者图神经网络来编码拓扑信息,并将其融入到提示中。
📊 实验亮点
实验结果表明,ResMAS在多种任务下均能显著提升多智能体系统的鲁棒性。具体而言,与基线方法相比,ResMAS在智能体失效的情况下,性能下降幅度更小,能够更好地维持系统的正常运行。此外,ResMAS还展现出良好的泛化能力,能够在新的任务和模型上取得优异的表现。
🎯 应用场景
ResMAS可应用于各种需要多智能体协作的场景,例如:分布式计算、智能交通、协同机器人、供应链管理等。通过提升系统的鲁棒性,可以减少因智能体故障或环境变化带来的损失,提高系统的可靠性和稳定性。该研究对于构建更可靠、更智能的多智能体系统具有重要意义。
📄 摘要(原文)
Large Language Model-based Multi-Agent Systems (LLM-based MAS), where multiple LLM agents collaborate to solve complex tasks, have shown impressive performance in many areas. However, MAS are typically distributed across different devices or environments, making them vulnerable to perturbations such as agent failures. While existing works have studied the adversarial attacks and corresponding defense strategies, they mainly focus on reactively detecting and mitigating attacks after they occur rather than proactively designing inherently resilient systems. In this work, we study the resilience of LLM-based MAS under perturbations and find that both the communication topology and prompt design significantly influence system resilience. Motivated by these findings, we propose ResMAS: a two-stage framework for enhancing MAS resilience. First, we train a reward model to predict the MAS's resilience, based on which we train a topology generator to automatically design resilient topology for specific tasks through reinforcement learning. Second, we introduce a topology-aware prompt optimization method that refines each agent's prompt based on its connections and interactions with other agents. Extensive experiments across a range of tasks show that our approach substantially improves MAS resilience under various constraints. Moreover, our framework demonstrates strong generalization ability to new tasks and models, highlighting its potential for building resilient MASs.