Adaptive and Resource-efficient Agentic AI Systems for Mobile and Embedded Devices: A Survey
作者: Sicong Liu, Weiye Wu, Xiangrui Xu, Teng Li, Bowen Pang, Bin Guo, Zhiwen Yu
分类: cs.LG, cs.AI, cs.DC
发布日期: 2025-09-30
💡 一句话要点
针对移动和嵌入式设备,提出自适应且资源高效的Agentic AI系统综述
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: Agentic AI 资源高效 移动设备 嵌入式系统 基础模型 边缘计算 自适应 多模态融合
📋 核心要点
- 现有Agentic AI系统在移动和嵌入式设备上部署时,面临着计算资源有限、能耗高、延迟敏感等挑战。
- 论文核心在于对自适应和资源高效的Agentic AI系统进行全面综述,并从弹性推理、测试时适应、动态多模态集成等方面总结关键技术。
- 论文分析了现有Agentic AI系统在精度、延迟和通信方面的权衡,并指出了未来在算法-系统协同设计、认知适应等方面的研究方向。
📝 摘要(中文)
基础模型通过将分散的架构统一为具有多模态推理和上下文适应性的可扩展骨干网络,重塑了人工智能。与此同时,由感知-决策-行动循环定义的AI Agent长期概念正在进入一个新范式:以基础模型作为其认知核心,Agent超越了基于规则的行为,实现了自主性、泛化和自我反思。这种双重转变受到自动驾驶、机器人、虚拟助手和GUI Agent等实际需求的推动,以及嵌入式硬件、边缘计算、移动部署平台和通信协议等生态系统进步的支持,这些共同促成了大规模部署。然而,这种融合与现实相冲突:虽然应用需要长期适应性和实时交互,但移动和边缘部署仍然受到内存、能源、带宽和延迟的限制。这在基础模型日益增长的复杂性和部署环境的有限资源之间造成了根本性的紧张关系。本综述首次系统地描述了自适应、资源高效的Agentic AI系统。我们总结了弹性推理、测试时适应、动态多模态集成和Agentic AI应用等使能技术,并确定了在平衡精度-延迟-通信权衡和维持分布偏移下的鲁棒性方面的开放挑战。我们进一步强调了算法-系统协同设计、认知适应和协作边缘部署方面的未来机会。通过映射基础模型结构、认知和硬件资源,这项工作建立了一个针对可扩展、自适应和资源高效的Agentic AI的统一视角。我们相信这篇综述可以帮助读者理解使能技术之间的联系,同时促进对Agentic智能和智能Agent融合的进一步讨论。
🔬 方法详解
问题定义:现有Agentic AI系统在移动和嵌入式设备上的部署面临资源约束,包括有限的内存、能量、带宽和计算能力。这与Agentic AI系统日益增长的复杂性,特别是基础模型(Foundation Models, FMs)的引入,形成了鲜明对比。现有方法难以在精度、延迟和通信成本之间取得平衡,并且在面对分布偏移时缺乏鲁棒性。
核心思路:本综述的核心思路是对现有自适应和资源高效的Agentic AI系统进行系统性的分类和总结,并从技术层面分析其解决资源约束问题的方法。通过对弹性推理、测试时适应、动态多模态集成等关键技术的深入剖析,为未来的研究提供指导。
技术框架:论文构建了一个统一的视角,将基础模型结构、认知和硬件资源联系起来。主要框架包括:1) 对Agentic AI系统的定义和发展趋势进行概述;2) 详细介绍弹性推理、测试时适应、动态多模态集成等关键技术;3) 探讨Agentic AI在不同应用场景下的应用;4) 识别当前面临的挑战和未来的研究方向。
关键创新:本综述的创新之处在于首次系统性地对自适应和资源高效的Agentic AI系统进行了全面的梳理和总结。它不仅涵盖了各种使能技术,还深入分析了这些技术在解决资源约束问题方面的作用。此外,论文还提出了算法-系统协同设计、认知适应和协作边缘部署等未来研究方向。
关键设计:论文并没有提出新的算法或模型,而是对现有技术进行了分类和分析。关键设计体现在对不同技术的选择和组织上,例如,弹性推理技术包括模型压缩、知识蒸馏、剪枝等,测试时适应技术包括域适应、持续学习等。论文还讨论了不同技术在精度、延迟和通信成本方面的权衡,并为未来的研究提供了指导。
🖼️ 关键图片
📊 实验亮点
该综述系统性地总结了弹性推理、测试时适应、动态多模态集成等关键技术,并分析了这些技术在Agentic AI系统中的应用。通过对现有方法的优缺点进行对比,为未来的研究提供了清晰的方向。此外,论文还强调了算法-系统协同设计的重要性,并提出了认知适应和协作边缘部署等有前景的研究方向。
🎯 应用场景
该研究对移动机器人、自动驾驶、智能家居、可穿戴设备等领域具有重要的应用价值。通过优化Agentic AI系统在资源受限设备上的性能,可以实现更智能、更高效的边缘计算应用,提升用户体验,并推动人工智能在物联网领域的广泛应用。
📄 摘要(原文)
Foundation models have reshaped AI by unifying fragmented architectures into scalable backbones with multimodal reasoning and contextual adaptation. In parallel, the long-standing notion of AI agents, defined by the sensing-decision-action loop, is entering a new paradigm: with FMs as their cognitive core, agents transcend rule-based behaviors to achieve autonomy, generalization, and self-reflection. This dual shift is reinforced by real-world demands such as autonomous driving, robotics, virtual assistants, and GUI agents, as well as ecosystem advances in embedded hardware, edge computing, mobile deployment platforms, and communication protocols that together enable large-scale deployment. Yet this convergence collides with reality: while applications demand long-term adaptability and real-time interaction, mobile and edge deployments remain constrained by memory, energy, bandwidth, and latency. This creates a fundamental tension between the growing complexity of FMs and the limited resources of deployment environments. This survey provides the first systematic characterization of adaptive, resource-efficient agentic AI systems. We summarize enabling techniques into elastic inference, test-time adaptation, dynamic multimodal integration, and agentic AI applications, and identify open challenges in balancing accuracy-latency-communication trade-offs and sustaining robustness under distribution shifts. We further highlight future opportunities in algorithm-system co-design, cognitive adaptation, and collaborative edge deployment. By mapping FM structures, cognition, and hardware resources, this work establishes a unified perspective toward scalable, adaptive, and resource-efficient agentic AI. We believe this survey can help readers to understand the connections between enabling technologies while promoting further discussions on the fusion of agentic intelligence and intelligent agents.