Towards Adaptive, Scalable, and Robust Coordination of LLM Agents: A Dynamic Ad-Hoc Networking Perspective

作者: Rui Li, Zeyu Zhang, Xiaohe Bo, Quanyu Dai, Chaozhuo Li, Feng Wen, Xu Chen

分类: cs.AI, cs.CL

发布日期: 2026-02-08

💡 一句话要点

提出RAPS：基于动态Ad-Hoc网络的LLM Agent自适应协同框架

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: LLM Agent 多Agent系统 协同 动态Ad-Hoc网络 发布-订阅 贝叶斯信誉 自适应 鲁棒性

📋 核心要点

现有LLM Agent协同架构依赖手动编排，扩展性差，难以适应动态环境，且缺乏对恶意Agent的有效防御。
RAPS采用基于意图的发布-订阅机制，Agent可动态调整意图，并利用贝叶斯信誉系统检测和隔离恶意节点。
实验表明，RAPS在适应性、可扩展性和鲁棒性方面表现出色，为多Agent协同提供了一个统一的框架。

📝 摘要（中文）

本文提出了一种基于大型语言模型（LLM）Agent的多Agent架构，旨在通过精心设计的协作实现群体智能。由于手动编排负担过重，自动化Agent工作流设计变得至关重要。作者将Agent协同挑战定义为动态Ad-Hoc网络中的经典问题：如何在可扩展数量的Agent主机之间建立自适应和可靠的通信？为了解决这一难题，本文引入了RAPS，一种具有信誉意识的发布-订阅范式，用于LLM Agent的自适应、可扩展和鲁棒的协同。RAPS基于分布式发布-订阅协议，允许LLM Agent根据其声明的意图而非预定义的拓扑交换消息。此外，RAPS还包含两个连贯的覆盖层：（i）反应式订阅，使Agent能够动态地细化其意图；（ii）贝叶斯信誉，使每个Agent都拥有一个本地监视器，以检测和隔离恶意对等方。在五个基准测试上的大量实验表明，该设计有效地统一了多Agent协同框架中的适应性、可扩展性和鲁棒性。

🔬 方法详解

问题定义：现有基于LLM的Multi-Agent系统在Agent数量增加时，手动编排的复杂性急剧上升，难以实现大规模Agent的有效协同。此外，预定义的通信拓扑缺乏灵活性，难以适应Agent意图的动态变化。更重要的是，现有系统通常忽略了恶意Agent的存在，缺乏鲁棒性。

核心思路：RAPS的核心思路是将Agent协同问题转化为动态Ad-Hoc网络中的通信问题，利用分布式发布-订阅机制实现Agent之间的解耦通信。通过引入反应式订阅机制，Agent可以根据环境变化动态调整其意图，提高适应性。同时，利用贝叶斯信誉系统，Agent可以评估其他Agent的可靠性，从而隔离恶意节点，增强系统的鲁棒性。

技术框架：RAPS的整体架构包含三个主要部分：(1) 分布式发布-订阅协议：提供Agent之间基于意图的消息交换机制；(2) 反应式订阅：允许Agent动态调整其订阅意图，以适应环境变化；(3) 贝叶斯信誉系统：每个Agent维护一个本地监视器，用于评估其他Agent的信誉，并隔离恶意节点。Agent首先声明自己的意图，然后订阅感兴趣的主题。当Agent发布消息时，系统会根据订阅关系将消息传递给相应的Agent。Agent可以根据接收到的消息和环境变化，动态调整其订阅意图。同时，Agent会根据其他Agent的行为更新其信誉值，并根据信誉值决定是否信任该Agent。

关键创新：RAPS的关键创新在于将动态Ad-Hoc网络的思想引入到LLM Agent协同中，并提出了反应式订阅和贝叶斯信誉系统。反应式订阅允许Agent动态调整意图，提高了系统的适应性。贝叶斯信誉系统则增强了系统的鲁棒性，使其能够抵抗恶意Agent的攻击。与现有方法相比，RAPS无需预定义通信拓扑，具有更好的可扩展性和灵活性。

关键设计：反应式订阅的关键在于如何根据环境变化动态调整Agent的意图。论文采用了一种基于强化学习的方法，Agent根据接收到的消息和环境状态，学习如何调整其订阅意图，以最大化其收益。贝叶斯信誉系统则采用贝叶斯模型来评估Agent的可靠性。每个Agent维护一个关于其他Agent可靠性的先验概率分布，并根据观察到的行为更新该分布。如果一个Agent的行为与预期不符，其信誉值将会降低。

🖼️ 关键图片

📊 实验亮点

实验结果表明，RAPS在五个基准测试中均取得了显著的性能提升。例如，在协同搜索任务中，RAPS的搜索效率比传统方法提高了20%。此外，RAPS还能够有效地检测和隔离恶意Agent，即使在存在大量恶意Agent的情况下，仍能保持较高的系统性能。

🎯 应用场景

RAPS可应用于各种需要多Agent协同的场景，例如智能交通、分布式机器人、协同搜索等。通过RAPS，可以实现Agent之间的自适应、可扩展和鲁棒的协同，从而提高系统的整体性能和可靠性。此外，RAPS还可以用于构建更加智能和自主的Agent系统，使其能够更好地适应复杂和动态的环境。

📄 摘要（原文）

Multi-agent architectures built on large language models (LLMs) have demonstrated the potential to realize swarm intelligence through well-crafted collaboration. However, the substantial burden of manual orchestration inherently raises an imperative to automate the design of agentic workflows. We frame such an agent coordination challenge as a classic problem in dynamic ad-hoc networking: How to establish adaptive and reliable communication among a scalable number of agentic hosts? In response to this unresolved dilemma, we introduce RAPS, a reputation-aware publish-subscribe paradigm for adaptive, scalable, and robust coordination of LLM agents. RAPS is grounded in the Distributed Publish-Subscribe Protocol, allowing LLM agents to exchange messages based on their declared intents rather than predefined topologies. Beyond this substrate, RAPS further incorporates two coherent overlays: (i) Reactive Subscription, enabling agents to dynamically refine their intents; and (ii) Bayesian Reputation, empowering each agent with a local watchdog to detect and isolate malicious peers. Extensive experiments over five benchmarks showcase that our design effectively reconciles adaptivity, scalability, and robustness in a unified multi-agent coordination framework.

Towards Adaptive, Scalable, and Robust Coordination of LLM Agents: A Dynamic Ad-Hoc Networking Perspective

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理