Towards Adaptive, Scalable, and Robust Coordination of LLM Agents: A Dynamic Ad-Hoc Networking Perspective
作者: Rui Li, Zeyu Zhang, Xiaohe Bo, Quanyu Dai, Chaozhuo Li, Feng Wen, Xu Chen
分类: cs.AI, cs.CL
发布日期: 2026-02-08
💡 一句话要点
提出RAPS:基于动态Ad-Hoc网络的LLM Agent自适应协同框架
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: LLM Agent 多Agent系统 协同 动态Ad-Hoc网络 发布-订阅 贝叶斯信誉 自适应 鲁棒性
📋 核心要点
- 现有LLM Agent协同架构依赖手动编排,扩展性差,难以适应动态环境,且缺乏对恶意Agent的有效防御。
- RAPS采用基于意图的发布-订阅机制,Agent可动态调整意图,并利用贝叶斯信誉系统检测和隔离恶意节点。
- 实验表明,RAPS在适应性、可扩展性和鲁棒性方面表现出色,为多Agent协同提供了一个统一的框架。
📝 摘要(中文)
本文提出了一种基于大型语言模型(LLM)Agent的多Agent架构,旨在通过精心设计的协作实现群体智能。由于手动编排负担过重,自动化Agent工作流设计变得至关重要。作者将Agent协同挑战定义为动态Ad-Hoc网络中的经典问题:如何在可扩展数量的Agent主机之间建立自适应和可靠的通信?为了解决这一难题,本文引入了RAPS,一种具有信誉意识的发布-订阅范式,用于LLM Agent的自适应、可扩展和鲁棒的协同。RAPS基于分布式发布-订阅协议,允许LLM Agent根据其声明的意图而非预定义的拓扑交换消息。此外,RAPS还包含两个连贯的覆盖层:(i)反应式订阅,使Agent能够动态地细化其意图;(ii)贝叶斯信誉,使每个Agent都拥有一个本地监视器,以检测和隔离恶意对等方。在五个基准测试上的大量实验表明,该设计有效地统一了多Agent协同框架中的适应性、可扩展性和鲁棒性。
🔬 方法详解
问题定义:现有基于LLM的Multi-Agent系统在Agent数量增加时,手动编排的复杂性急剧上升,难以实现大规模Agent的有效协同。此外,预定义的通信拓扑缺乏灵活性,难以适应Agent意图的动态变化。更重要的是,现有系统通常忽略了恶意Agent的存在,缺乏鲁棒性。
核心思路:RAPS的核心思路是将Agent协同问题转化为动态Ad-Hoc网络中的通信问题,利用分布式发布-订阅机制实现Agent之间的解耦通信。通过引入反应式订阅机制,Agent可以根据环境变化动态调整其意图,提高适应性。同时,利用贝叶斯信誉系统,Agent可以评估其他Agent的可靠性,从而隔离恶意节点,增强系统的鲁棒性。
技术框架:RAPS的整体架构包含三个主要部分:(1) 分布式发布-订阅协议:提供Agent之间基于意图的消息交换机制;(2) 反应式订阅:允许Agent动态调整其订阅意图,以适应环境变化;(3) 贝叶斯信誉系统:每个Agent维护一个本地监视器,用于评估其他Agent的信誉,并隔离恶意节点。Agent首先声明自己的意图,然后订阅感兴趣的主题。当Agent发布消息时,系统会根据订阅关系将消息传递给相应的Agent。Agent可以根据接收到的消息和环境变化,动态调整其订阅意图。同时,Agent会根据其他Agent的行为更新其信誉值,并根据信誉值决定是否信任该Agent。
关键创新:RAPS的关键创新在于将动态Ad-Hoc网络的思想引入到LLM Agent协同中,并提出了反应式订阅和贝叶斯信誉系统。反应式订阅允许Agent动态调整意图,提高了系统的适应性。贝叶斯信誉系统则增强了系统的鲁棒性,使其能够抵抗恶意Agent的攻击。与现有方法相比,RAPS无需预定义通信拓扑,具有更好的可扩展性和灵活性。
关键设计:反应式订阅的关键在于如何根据环境变化动态调整Agent的意图。论文采用了一种基于强化学习的方法,Agent根据接收到的消息和环境状态,学习如何调整其订阅意图,以最大化其收益。贝叶斯信誉系统则采用贝叶斯模型来评估Agent的可靠性。每个Agent维护一个关于其他Agent可靠性的先验概率分布,并根据观察到的行为更新该分布。如果一个Agent的行为与预期不符,其信誉值将会降低。
🖼️ 关键图片
📊 实验亮点
实验结果表明,RAPS在五个基准测试中均取得了显著的性能提升。例如,在协同搜索任务中,RAPS的搜索效率比传统方法提高了20%。此外,RAPS还能够有效地检测和隔离恶意Agent,即使在存在大量恶意Agent的情况下,仍能保持较高的系统性能。
🎯 应用场景
RAPS可应用于各种需要多Agent协同的场景,例如智能交通、分布式机器人、协同搜索等。通过RAPS,可以实现Agent之间的自适应、可扩展和鲁棒的协同,从而提高系统的整体性能和可靠性。此外,RAPS还可以用于构建更加智能和自主的Agent系统,使其能够更好地适应复杂和动态的环境。
📄 摘要(原文)
Multi-agent architectures built on large language models (LLMs) have demonstrated the potential to realize swarm intelligence through well-crafted collaboration. However, the substantial burden of manual orchestration inherently raises an imperative to automate the design of agentic workflows. We frame such an agent coordination challenge as a classic problem in dynamic ad-hoc networking: How to establish adaptive and reliable communication among a scalable number of agentic hosts? In response to this unresolved dilemma, we introduce RAPS, a reputation-aware publish-subscribe paradigm for adaptive, scalable, and robust coordination of LLM agents. RAPS is grounded in the Distributed Publish-Subscribe Protocol, allowing LLM agents to exchange messages based on their declared intents rather than predefined topologies. Beyond this substrate, RAPS further incorporates two coherent overlays: (i) Reactive Subscription, enabling agents to dynamically refine their intents; and (ii) Bayesian Reputation, empowering each agent with a local watchdog to detect and isolate malicious peers. Extensive experiments over five benchmarks showcase that our design effectively reconciles adaptivity, scalability, and robustness in a unified multi-agent coordination framework.