Agentic Web: Weaving the Next Web with AI Agents
作者: Yingxuan Yang, Mulei Ma, Yuxuan Huang, Huacan Chai, Chenyu Gong, Haoran Geng, Yuanjian Zhou, Ying Wen, Meng Fang, Muhao Chen, Shangding Gu, Ming Jin, Costas Spanos, Yang Yang, Pieter Abbeel, Dawn Song, Weinan Zhang, Jun Wang
分类: cs.AI, cs.LG
发布日期: 2025-07-28
🔗 代码/项目: GITHUB
💡 一句话要点
构建Agentic Web:利用AI Agent实现自主、目标驱动的互联网交互
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: Agentic Web AI Agent 大型语言模型 自主交互 意图委托
📋 核心要点
- 现有互联网交互主要依赖人工驱动,用户需亲自执行诸多数字操作,效率较低,Agentic Web旨在解决这一问题。
- 论文提出Agentic Web框架,利用AI Agent实现自主交互,Agent之间可直接规划、协调和执行复杂任务,代表用户完成目标。
- 该研究分析了Agentic Web的演进历程,构建了包含智能、交互和经济三个维度的概念模型,并探讨了潜在风险和治理问题。
📝 摘要(中文)
本文探讨了由大型语言模型驱动的AI Agent向Agentic Web的转变,这标志着互联网进入了一个由自主、目标驱动交互定义的新阶段。在这种模式下,Agent直接相互交互,代表用户规划、协调和执行复杂任务。这种从人工驱动到机器间交互的转变允许意图委托,使用户摆脱了日常数字操作,并实现了更具交互性、自动化的Web体验。本文提出了一个结构化框架,用于理解和构建Agentic Web,追溯了其从PC和移动Web时代的演变,并确定了支持这种转变的核心技术基础。该框架的核心是一个由智能、交互和经济三个关键维度组成的概念模型。这些维度共同实现了AI Agent的检索、推荐、规划和协作等能力。分析了创建可扩展Agentic系统所涉及的架构和基础设施挑战,包括通信协议、编排策略和新兴范式,如Agent注意力经济。最后,讨论了Agentic系统可能带来的潜在应用、社会风险和治理问题,并概述了开发由人类意图和自主Agent行为塑造的开放、安全和智能生态系统的研究方向。
🔬 方法详解
问题定义:当前互联网交互模式主要依赖用户手动操作,效率低下,且难以处理日益复杂的任务。现有方法缺乏自主性和智能性,无法充分利用互联网资源为用户提供便捷服务。Agentic Web旨在通过引入AI Agent,实现互联网交互的自动化和智能化,从而提升用户体验和效率。
核心思路:论文的核心思路是构建一个由AI Agent驱动的互联网生态系统,Agent能够自主地理解用户意图、规划任务、与其他Agent协作,并最终完成目标。这种模式将用户从繁琐的操作中解放出来,实现意图委托,从而提升互联网的使用效率和价值。
技术框架:Agentic Web的技术框架主要包含以下几个核心模块:1) Agent大脑:负责Agent的智能决策,包括意图理解、知识推理、任务规划等;2) Agent交互:负责Agent之间的通信和协作,包括通信协议、消息传递机制等;3) Agent执行:负责Agent执行任务,包括调用API、访问数据、控制设备等;4) Agent经济:负责Agent之间的资源分配和激励机制,包括价值评估、奖励分配等。整体流程是用户发起请求,Agent大脑解析意图并规划任务,Agent交互模块协调多个Agent协作,Agent执行模块完成具体操作,Agent经济模块进行资源分配和激励。
关键创新:该论文的关键创新在于提出了Agentic Web的概念框架,并系统地分析了构建Agentic Web所面临的挑战和机遇。与现有方法相比,Agentic Web更加强调Agent的自主性和智能性,以及Agent之间的协作和交互。此外,该论文还提出了Agent注意力经济的概念,为Agent之间的资源分配和激励提供了一种新的思路。
关键设计:Agent大脑的设计需要考虑如何有效地利用大型语言模型,实现意图理解、知识推理和任务规划等功能。Agent交互的设计需要考虑如何保证Agent之间的通信效率和可靠性,以及如何实现Agent之间的安全认证和授权。Agent执行的设计需要考虑如何有效地调用各种API和访问各种数据源,以及如何保证Agent执行的安全性和可靠性。Agent经济的设计需要考虑如何公平地分配资源,以及如何激励Agent积极参与协作。
🖼️ 关键图片
📊 实验亮点
该论文提出了Agentic Web的概念框架,并对Agentic Web的关键技术和挑战进行了深入分析。此外,论文还提供了一个持续更新的Agentic Web相关研究的资源库,为研究人员提供了宝贵的参考资料。虽然没有具体的实验数据,但该论文为Agentic Web的研究奠定了基础,并指明了未来的研究方向。
🎯 应用场景
Agentic Web在智能家居、智能办公、电子商务、教育、医疗等领域具有广泛的应用前景。例如,在智能家居中,Agent可以根据用户的习惯和需求,自动调节温度、光线和音乐;在电子商务中,Agent可以帮助用户自动搜索和比较商品,并完成购买;在医疗领域,Agent可以帮助医生诊断疾病,并制定治疗方案。Agentic Web有望极大地提升人们的生活质量和工作效率。
📄 摘要(原文)
The emergence of AI agents powered by large language models (LLMs) marks a pivotal shift toward the Agentic Web, a new phase of the internet defined by autonomous, goal-driven interactions. In this paradigm, agents interact directly with one another to plan, coordinate, and execute complex tasks on behalf of users. This transition from human-driven to machine-to-machine interaction allows intent to be delegated, relieving users from routine digital operations and enabling a more interactive, automated web experience. In this paper, we present a structured framework for understanding and building the Agentic Web. We trace its evolution from the PC and Mobile Web eras and identify the core technological foundations that support this shift. Central to our framework is a conceptual model consisting of three key dimensions: intelligence, interaction, and economics. These dimensions collectively enable the capabilities of AI agents, such as retrieval, recommendation, planning, and collaboration. We analyze the architectural and infrastructural challenges involved in creating scalable agentic systems, including communication protocols, orchestration strategies, and emerging paradigms such as the Agent Attention Economy. We conclude by discussing the potential applications, societal risks, and governance issues posed by agentic systems, and outline research directions for developing open, secure, and intelligent ecosystems shaped by both human intent and autonomous agent behavior. A continuously updated collection of relevant studies for agentic web is available at: https://github.com/SafeRL-Lab/agentic-web.