A survey of agent interoperability protocols: Model Context Protocol (MCP), Agent Communication Protocol (ACP), Agent-to-Agent Protocol (A2A), and Agent Network Protocol (ANP)
作者: Abul Ehtesham, Aditi Singh, Gaurav Kumar Gupta, Saket Kumar
分类: cs.AI
发布日期: 2025-05-04 (更新: 2025-05-23)
💡 一句话要点
综述Agent互操作协议:MCP、ACP、A2A和ANP,旨在促进LLM驱动Agent的互联互通。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: Agent通信协议 互操作性 大型语言模型 自主Agent 模型上下文协议 Agent网络协议 去中心化标识符
📋 核心要点
- 现有Agent集成方法缺乏标准化,难以扩展、保证安全,且难以泛化到不同应用领域,阻碍了LLM驱动Agent生态系统的发展。
- 论文调研并对比了MCP、ACP、A2A和ANP四种Agent通信协议,旨在为构建互操作、安全和可扩展的Agent生态系统提供指导。
- 论文提出了一个分阶段的Agent协议采用路线图,从MCP到ACP,再到A2A和ANP,逐步实现更高级别的Agent互操作性。
📝 摘要(中文)
大型语言模型驱动的自主Agent需要稳健、标准化的协议,以便集成工具、共享上下文数据以及协调跨异构系统的任务。临时集成难以扩展、保护和泛化到各个领域。本综述考察了四种新兴的Agent通信协议:模型上下文协议(MCP)、Agent通信协议(ACP)、Agent间协议(A2A)和Agent网络协议(ANP),每种协议都解决了部署环境中的互操作性问题。MCP提供了一个JSON-RPC客户端-服务器接口,用于安全的工具调用和类型化数据交换。ACP定义了一个基于RESTful HTTP的通用通信协议,支持MIME类型化的多部分消息以及同步和异步交互。其轻量级和运行时独立的设计实现了可扩展的Agent调用,同时具有会话管理、消息路由以及与基于角色的和去中心化标识符(DID)的集成等功能。A2A使用基于能力的Agent卡实现点对点任务委托,支持跨企业Agent工作流的安全和可扩展协作。ANP支持开放网络Agent发现和使用W3C去中心化标识符DID和JSON-LD图的安全协作。对这些协议在多个维度上进行了比较,包括交互模式、发现机制、通信模式和安全模型。基于比较分析,提出了一种分阶段的采用路线图:首先使用MCP进行工具访问,然后使用ACP进行结构化、多模式消息传递、会话感知交互以及基于HTTP的可扩展部署中的在线和离线Agent发现,使用A2A进行协作任务执行,并扩展到ANP以实现去中心化的Agent市场。这项工作为设计安全、可互操作和可扩展的LLM驱动Agent生态系统奠定了全面的基础。
🔬 方法详解
问题定义:当前,大型语言模型驱动的自主Agent在集成工具、共享上下文数据和协调任务方面面临挑战。现有的Agent集成方法通常是临时的,缺乏统一的标准,导致难以扩展、保证安全,并且难以泛化到不同的应用领域。这阻碍了LLM驱动Agent生态系统的发展,限制了Agent之间的互操作性和协作能力。
核心思路:论文的核心思路是通过调研和比较现有的Agent通信协议,为构建互操作、安全和可扩展的Agent生态系统提供指导。论文分析了MCP、ACP、A2A和ANP四种协议,并提出了一个分阶段的采用路线图,旨在逐步实现更高级别的Agent互操作性。这种分阶段的方法允许开发者根据自身需求选择合适的协议,并逐步过渡到更复杂的协议。
技术框架:论文主要通过文献调研和比较分析的方式,对四种Agent通信协议进行了深入研究。没有提出新的技术框架,而是对现有协议进行了梳理和总结。论文分析了这些协议的交互模式、发现机制、通信模式和安全模型,并提出了一个分阶段的采用路线图。
关键创新:论文的主要创新在于对现有Agent通信协议进行了全面的综述和比较分析,并提出了一个实用的分阶段采用路线图。虽然没有提出全新的协议,但论文为开发者选择和使用合适的协议提供了有价值的指导,有助于推动Agent生态系统的发展。
关键设计:论文没有涉及具体的参数设置、损失函数或网络结构等技术细节。重点在于对现有协议的分析和比较,以及提出一个分阶段的采用路线图。该路线图建议从MCP开始,逐步过渡到ACP、A2A和ANP,以实现更高级别的Agent互操作性。
🖼️ 关键图片
📊 实验亮点
论文对MCP、ACP、A2A和ANP四种Agent通信协议进行了全面的比较分析,涵盖了交互模式、发现机制、通信模式和安全模型等多个维度。基于分析结果,论文提出了一个分阶段的采用路线图,为开发者选择和使用合适的协议提供了有价值的指导。
🎯 应用场景
该研究成果可应用于构建各种LLM驱动的Agent生态系统,例如智能助手、自动化工作流程、供应链管理、智能制造等领域。通过采用标准化的Agent通信协议,可以实现Agent之间的无缝协作,提高工作效率,降低开发成本,并促进Agent技术的广泛应用。
📄 摘要(原文)
Large language model powered autonomous agents demand robust, standardized protocols to integrate tools, share contextual data, and coordinate tasks across heterogeneous systems. Ad-hoc integrations are difficult to scale, secure, and generalize across domains. This survey examines four emerging agent communication protocols: Model Context Protocol (MCP), Agent Communication Protocol (ACP), Agent-to-Agent Protocol (A2A), and Agent Network Protocol (ANP), each addressing interoperability in deployment contexts. MCP provides a JSON-RPC client-server interface for secure tool invocation and typed data exchange. ACP defines a general-purpose communication protocol over RESTful HTTP, supporting MIME-typed multipart messages and synchronous and asynchronous interactions. Its lightweight and runtime-independent design enables scalable agent invocation, while features like session management, message routing, and integration with role-based and decentralized identifiers (DIDs). A2A enables peer-to-peer task delegation using capability-based Agent Cards, supporting secure and scalable collaboration across enterprise agent workflows. ANP supports open network agent discovery and secure collaboration using W3C decentralized identifiers DIDs and JSON-LD graphs. The protocols are compared across multiple dimensions, including interaction modes, discovery mechanisms, communication patterns, and security models. Based on the comparative analysis, a phased adoption roadmap is proposed: beginning with MCP for tool access, followed by ACP for structured, multimodal messaging session-aware interaction and both online and offline agent discovery across scalable, HTTP-based deployments A2A for collaborative task execution, and extending to ANP for decentralized agent marketplaces. This work provides a comprehensive foundation for designing secure, interoperable, and scalable ecosystems of LLM-powered agents.