Agentic AI for Intent-driven Optimization in Cell-free O-RAN

📄 arXiv: 2602.22539v1 📥 PDF

作者: Mohammad Hossein Shokouhi, Vincent W. S. Wong

分类: cs.AI, eess.SP

发布日期: 2026-02-26

备注: Accepted by IEEE International Conference on Communications (ICC), Glasgow, UK, May 2026


💡 一句话要点

提出Agentic AI框架,用于Cell-free O-RAN中意图驱动的优化,提升资源利用率。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: Agentic AI O-RAN 意图驱动优化 深度强化学习 参数高效微调 Cell-free 资源管理 节能

📋 核心要点

  1. 现有O-RAN研究多集中于独立智能体处理简单意图,缺乏对智能体间协同以实现复杂意图的研究。
  2. 提出Agentic AI框架,通过多个LLM驱动的智能体协同工作,实现运营商定义的复杂意图,例如节能和用户体验保障。
  3. 实验结果表明,该框架在节能模式下显著降低了激活O-RU的数量,并利用PEFT方法大幅减少了内存占用。

📝 摘要(中文)

本文提出了一种用于cell-free O-RAN中意图翻译和优化的Agentic AI框架。该框架利用基于大型语言模型(LLM)的多个智能体进行推理和协作,以实现运营商定义的意图。一个主管智能体将运营商意图转化为优化目标和最小速率要求。基于此,用户权重智能体从记忆模块中检索相关经验,以确定预编码的用户优先级权重。如果意图包含节能目标,则激活开放无线单元(O-RU)管理智能体,使用深度强化学习(DRL)算法确定激活的O-RU集合。监控智能体测量和监控用户数据速率,并与其他智能体协调以保证满足最小速率要求。为了增强可扩展性,采用参数高效微调(PEFT)方法,使相同的底层LLM可用于不同的智能体。仿真结果表明,在节能模式下,所提出的Agentic AI框架与三种基线方案相比,减少了41.93%的激活O-RU数量。使用PEFT方法,与部署单独的LLM智能体相比,该框架减少了92%的内存使用量。

🔬 方法详解

问题定义:现有O-RAN架构下的资源优化方法通常针对单一目标,难以满足运营商复杂且多变的意图,例如同时考虑用户体验和节能。此外,独立智能体难以处理需要跨多个O-RAN组件协同的复杂任务。现有方法缺乏有效的智能体间协作机制,且为每个智能体部署独立的LLM会带来巨大的内存开销。

核心思路:本文的核心思路是利用Agentic AI,构建一个由多个智能体组成的协作系统,每个智能体负责不同的任务,并通过相互协调来实现运营商的整体意图。通过将复杂的意图分解为多个子任务,并分配给不同的智能体,可以更有效地利用O-RAN资源,并满足运营商的多样化需求。

技术框架:该框架包含四个主要智能体:主管智能体、用户权重智能体、O-RU管理智能体和监控智能体。主管智能体负责将运营商的意图转化为优化目标和约束条件。用户权重智能体根据历史经验确定用户优先级权重,用于预编码优化。O-RU管理智能体使用DRL算法确定激活的O-RU集合,以实现节能目标。监控智能体负责监控用户数据速率,并与其他智能体协调以保证满足最小速率要求。所有智能体共享一个底层LLM,并通过PEFT方法进行微调,以减少内存占用。

关键创新:该论文的关键创新在于提出了一个完整的Agentic AI框架,用于解决cell-free O-RAN中的复杂意图驱动的优化问题。该框架通过智能体间的协同工作,实现了对O-RAN资源的更有效利用。此外,采用PEFT方法显著降低了内存占用,提高了框架的可扩展性。与现有方法相比,该框架能够更好地满足运营商的多样化需求,并实现更高的性能。

关键设计:O-RU管理智能体使用深度Q网络(DQN)进行训练,目标是最小化激活的O-RU数量,同时满足用户最小速率要求。奖励函数被设计为激活O-RU数量的负数,并对违反速率要求的行为进行惩罚。PEFT方法采用LoRA(Low-Rank Adaptation),通过在LLM的Transformer层中添加低秩矩阵来微调模型,从而减少需要训练的参数数量。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在节能模式下,所提出的Agentic AI框架与三种基线方案相比,减少了41.93%的激活O-RU数量。此外,通过使用PEFT方法,与为每个智能体部署单独的LLM相比,该框架减少了92%的内存使用量,显著提升了系统的可扩展性。

🎯 应用场景

该研究成果可应用于未来的无线通信网络,特别是在开放式无线接入网(O-RAN)环境中,实现更智能、更高效的资源管理和优化。通过Agentic AI框架,运营商可以根据实际需求灵活调整网络配置,提升用户体验,降低运营成本,并实现绿色节能的目标。该框架还可扩展到其他无线网络场景,例如5G/6G网络、物联网等。

📄 摘要(原文)

Agentic artificial intelligence (AI) is emerging as a key enabler for autonomous radio access networks (RANs), where multiple large language model (LLM)-based agents reason and collaborate to achieve operator-defined intents. The open RAN (O-RAN) architecture enables the deployment and coordination of such agents. However, most existing works consider simple intents handled by independent agents, while complex intents that require coordination among agents remain unexplored. In this paper, we propose an agentic AI framework for intent translation and optimization in cell-free O-RAN. A supervisor agent translates the operator intents into an optimization objective and minimum rate requirements. Based on this information, a user weighting agent retrieves relevant prior experience from a memory module to determine the user priority weights for precoding. If the intent includes an energy-saving objective, then an open radio unit (O-RU) management agent will also be activated to determine the set of active O-RUs by using a deep reinforcement learning (DRL) algorithm. A monitoring agent measures and monitors the user data rates and coordinates with other agents to guarantee the minimum rate requirements are satisfied. To enhance scalability, we adopt a parameter-efficient fine-tuning (PEFT) method that enables the same underlying LLM to be used for different agents. Simulation results show that the proposed agentic AI framework reduces the number of active O-RUs by 41.93% when compared with three baseline schemes in energy-saving mode. Using the PEFT method, the proposed framework reduces the memory usage by 92% when compared with deploying separate LLM agents.