Large Language Models Miss the Multi-Agent Mark

📄 arXiv: 2505.21298v4 📥 PDF

作者: Emanuele La Malfa, Gabriele La Malfa, Samuele Marro, Jie M. Zhang, Elizabeth Black, Michael Luck, Philip Torr, Michael Wooldridge

分类: cs.MA, cs.AI, cs.LG

发布日期: 2025-05-27 (更新: 2025-12-06)

备注: NeurIPS 2025 - position track -


💡 一句话要点

批判性分析:大型语言模型在多智能体系统应用中偏离理论基础

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 人工智能 智能体交互 环境建模

📋 核心要点

  1. 现有MAS LLM框架在应用多智能体系统概念时,未能充分理解和应用MAS理论的基础原则。
  2. 论文通过分析MAS LLM在智能体属性、环境设计、协调通信和行为度量等方面的不足,揭示了其与MAS理论的偏差。
  3. 论文旨在促进MAS LLM领域更好地整合已有的MAS理论,并使用更精确的术语,避免概念误用和研究方向的偏差。

📝 摘要(中文)

近年来,利用多个大型语言模型(LLM)构建多智能体系统(MAS LLM)以解决复杂任务的框架日益增多。然而,许多文献在采用MAS术语时,并未充分理解其基本原则。本文旨在强调MAS理论与当前MAS LLM实现之间的关键差异,重点关注智能体的社会属性、环境设计、协调与通信协议以及涌现行为的度量四个关键领域。我们认为,许多MAS LLM缺乏自主性、社会互动和结构化环境等多智能体特征,并且常常依赖于过度简化、以LLM为中心的架构。通过重新审视MAS文献已经解决的问题,该领域可能会减缓发展速度并失去吸引力。因此,我们系统地分析了这个问题,并概述了相关的研究机会;我们提倡更好地整合已建立的MAS概念和更精确的术语,以避免错误描述和错失机会。

🔬 方法详解

问题定义:当前的多智能体系统(MAS)大型语言模型(LLM)实现,虽然使用了MAS的术语,但往往忽略了MAS理论的基础,导致系统设计缺乏真正的多智能体特性。现有方法的痛点在于过度依赖LLM本身的能力,而忽视了智能体之间的交互、环境的结构化以及协调机制的设计。

核心思路:论文的核心思路是批判性地审视当前MAS LLM的实现,并将其与成熟的MAS理论进行对比,找出其中的差距和不足。通过强调MAS理论的重要性,并指出当前方法中存在的误用和简化,旨在引导未来的研究更加注重MAS的基本原则。

技术框架:论文并没有提出一个具体的新的技术框架,而是对现有框架进行分析和批判。其分析框架主要围绕四个关键领域展开:1) 智能体的社会属性(如自主性、社会互动);2) 环境设计(如环境的结构化程度);3) 协调与通信协议;4) 涌现行为的度量。通过对这些领域的分析,揭示了现有MAS LLM实现与MAS理论的偏差。

关键创新:论文的关键创新在于其批判性的视角和对MAS LLM领域现状的深刻反思。它并没有提出一个新的算法或模型,而是通过分析现有方法的不足,指出了未来研究的方向。这种反思性的工作对于一个新兴领域的发展至关重要,可以避免盲目跟风和重复造轮子。

关键设计:论文并没有涉及具体的技术细节,而是侧重于概念层面的分析和讨论。它强调了在设计MAS LLM时,应该更加注重智能体的自主性、社会互动和环境的结构化,并采用合适的协调与通信协议。这些设计原则是MAS理论的核心,也是构建真正多智能体系统的关键。

🖼️ 关键图片

fig_0

📊 实验亮点

该论文并非实验性研究,而是对现有研究的批判性分析。其亮点在于系统性地指出了当前MAS LLM实现中存在的理论偏差,并提出了未来研究方向的建议。通过强调MAS理论的重要性,为该领域的研究人员提供了重要的参考。

🎯 应用场景

该研究成果对多智能体系统、人工智能、自然语言处理等领域具有潜在应用价值。通过更准确地应用MAS理论,可以构建更智能、更协作的智能体系统,应用于机器人协同、智能交通、分布式计算、社会模拟等领域,从而提升系统的效率、鲁棒性和适应性。

📄 摘要(原文)

Recent interest in Multi-Agent Systems of Large Language Models (MAS LLMs) has led to an increase in frameworks leveraging multiple LLMs to tackle complex tasks. However, much of this literature appropriates the terminology of MAS without engaging with its foundational principles. In this position paper, we highlight critical discrepancies between MAS theory and current MAS LLMs implementations, focusing on four key areas: the social aspect of agency, environment design, coordination and communication protocols, and measuring emergent behaviours. Our position is that many MAS LLMs lack multi-agent characteristics such as autonomy, social interaction, and structured environments, and often rely on oversimplified, LLM-centric architectures. The field may slow down and lose traction by revisiting problems the MAS literature has already addressed. Therefore, we systematically analyse this issue and outline associated research opportunities; we advocate for better integrating established MAS concepts and more precise terminology to avoid mischaracterisation and missed opportunities.