Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey

作者: Xiaojing Chen, Haiqi Yu, Wei Ni, Dusit Niyato, Ruichen Zhang, Xin Wang, Shunqing Zhang, Shugong Xu

分类: eess.SY, cs.AI

发布日期: 2026-04-09

💡 一句话要点

针对Agentic AI推理中网络感知的能效优化方法综述

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: Agentic AI 能效优化 边缘计算 跨层协同设计 能源核算 无线通信 自主系统

📋 核心要点

Agentic AI在边缘计算等领域应用广泛，但其迭代推理和持续数据交换导致计算和通信能源消耗巨大，现有方法难以有效解决。
论文提出一个能源核算框架，识别感知-推理-行动周期中的计算和通信成本，并探讨跨层协同设计策略以优化能效。
论文总结了联邦绿色学习、碳感知代理等开放挑战，并为6G原生Agentic AI和自维持系统指明了发展方向。

📝 摘要（中文）

大型语言模型（LLMs）的快速发展催生了Agentic人工智能（AI），这是一种将感知、推理和行动整合到闭环流程中以实现持续适应的自主系统。虽然这种范式在移动边缘计算、自主系统和下一代无线网络中释放了变革性应用，但它通过迭代推理和持久数据交换带来了根本的能源挑战。与传统AI中计算浮点运算（FLOPs）是瓶颈不同，Agentic AI面临着复合的计算和通信能源成本。本综述提出了一个能源核算框架，用于识别感知-推理-行动周期中的计算和通信成本。我们建立了一个统一的分类法，涵盖模型简化、计算控制、输入和注意力优化以及硬件感知推理。我们探讨了联合优化模型参数、无线传输和边缘资源的跨层协同设计策略。最后，我们确定了联邦绿色学习、碳感知代理、第六代移动通信（6G）原生Agentic AI和自维持系统的开放挑战，为可扩展的自主智能提供了路线图。

🔬 方法详解

问题定义：Agentic AI在移动边缘计算等场景下，由于其感知、推理、行动的闭环迭代特性，导致计算和通信的能源消耗显著增加。传统AI主要关注计算复杂度（FLOPs），而Agentic AI需要同时考虑计算和通信的能耗，现有方法缺乏针对性的能效优化方案。

核心思路：论文的核心思路是建立一个全面的能源核算框架，将Agentic AI的能耗分解为感知、推理和行动三个阶段的计算和通信成本。基于此框架，探索跨层协同设计策略，联合优化模型参数、无线传输和边缘资源，从而实现整体能效的提升。

技术框架：论文首先提出了一个能源核算框架，用于量化Agentic AI在感知、推理和行动周期中的计算和通信成本。然后，论文建立了一个统一的分类法，涵盖了模型简化、计算控制、输入和注意力优化以及硬件感知推理等能效优化方法。最后，论文探讨了跨层协同设计策略，包括模型参数优化、无线传输优化和边缘资源优化。

关键创新：论文的关键创新在于提出了针对Agentic AI的能源核算框架，该框架能够更准确地评估Agentic AI的能耗，并为能效优化提供指导。此外，论文还强调了跨层协同设计的重要性，认为需要联合优化模型、无线传输和边缘资源才能实现最佳的能效。

关键设计：论文综述了多种能效优化方法，包括：模型简化（如模型剪枝、量化、知识蒸馏），计算控制（如动态电压频率调整、任务调度），输入和注意力优化（如选择性感知、注意力机制优化），以及硬件感知推理（如专用加速器、异构计算）。论文还讨论了联邦学习、碳感知等新兴技术在Agentic AI能效优化中的应用。

🖼️ 关键图片

📊 实验亮点

论文提出了一个能源核算框架，用于识别Agentic AI在感知-推理-行动周期中的计算和通信成本。通过对现有能效优化方法的分类和总结，为研究人员提供了全面的参考。此外，论文还指出了联邦绿色学习、碳感知代理等未来研究方向。

🎯 应用场景

该研究成果可应用于移动边缘计算、自主系统、下一代无线网络等领域，通过优化Agentic AI的能效，降低运营成本，延长设备续航时间，并减少碳排放，具有重要的经济和社会价值。未来的6G网络有望原生支持Agentic AI，实现更高效、更智能的自主服务。

📄 摘要（原文）

The rapid emergence of Large Language Models (LLMs) has catalyzed Agentic artificial intelligence (AI), autonomous systems integrating perception, reasoning, and action into closed-loop pipelines for continuous adaptation. While unlocking transformative applications in mobile edge computing, autonomous systems, and next-generation wireless networks, this paradigm creates fundamental energy challenges through iterative inference and persistent data exchange. Unlike traditional AI where bottlenecks are computational Floating Point Operations (FLOPs), Agentic AI faces compounding computational and communication energy costs. In this survey, we propose an energy accounting framework identifying computational and communication costs across the Perception-Reasoning-Action cycle. We establish a unified taxonomy spanning model simplification, computation control, input and attention optimization, and hardware-aware inference. We explore cross-layer co-design strategies jointly optimizing model parameters, wireless transmissions, and edge resources. Finally, we identify open challenges of federated green learning, carbon-aware agency, 6th generation mobile communication (6G)-native Agentic AI, and self-sustaining systems, providing a roadmap for scalable autonomous intelligence.

Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理