Toward Autonomous O-RAN: A Multi-Scale Agentic AI Framework for Real-Time Network Control and Management
作者: Hojjat Navidan, Mohammad Cheraghinia, Jaron Fontaine, Mohamed Seif, Eli De Poorter, H. Vincent Poor, Ingrid Moerman, Adnan Shahid
分类: cs.NI, cs.AI
发布日期: 2026-02-15
备注: Submitted to the IEEE Networks Journal
💡 一句话要点
提出多尺度Agentic AI框架,实现O-RAN实时网络控制与管理
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: O-RAN Agentic AI 多尺度控制 LLM SLM 无线物理层 网络管理 资源分配
📋 核心要点
- O-RAN的灵活性带来运营复杂性,现有控制环路和应用间存在潜在冲突,缺乏统一协调。
- 提出多尺度Agentic AI框架,利用LLM、SLM和WPFM代理,分层协调Non-RT、Near-RT和RT控制。
- 通过开源实现验证,在非平稳条件下的鲁棒运行和意图驱动的切片资源控制方面展示了有效性。
📝 摘要(中文)
开放无线接入网络(O-RAN)通过解耦的、软件驱动的组件和开放接口,有望实现灵活的6G网络接入,但这种可编程性也增加了运营复杂性。服务管理层和RAN智能控制器(RIC)中存在多个控制环路,而独立开发的控制应用程序可能会以意想不到的方式相互作用。同时,生成式人工智能(AI)的最新进展正在推动从孤立的AI模型向能够解释目标、协调多个模型和控制功能并随时间调整其行为的Agentic AI系统转变。本文提出了一种用于O-RAN的多尺度Agentic AI框架,该框架将RAN智能组织为跨非实时(Non-RT)、近实时(Near-RT)和实时(RT)控制环路的协调层次结构:(i) Non-RT RIC中的大型语言模型(LLM)代理将运营商意图转化为策略并管理模型生命周期;(ii) Near-RT RIC中的小型语言模型(SLM)代理执行低延迟优化,并且可以激活、调整或禁用现有的控制应用程序;(iii) 靠近分布式单元的无线物理层基础模型(WPFM)代理提供快速推理。我们描述了这些代理如何通过标准化的O-RAN接口和遥测进行协作。使用基于开源模型、软件和数据集的概念验证实现,我们在两个代表性场景中展示了所提出的Agentic方法:非平稳条件下的稳健运行和意图驱动的切片资源控制。
🔬 方法详解
问题定义:O-RAN虽然具有灵活性和可编程性,但其复杂性也带来了挑战。多个控制环路(Non-RT、Near-RT、RT)独立运行,控制应用之间可能存在冲突,难以实现全局优化和协同控制。现有方法难以有效处理这些复杂性,无法充分利用O-RAN的潜力。
核心思路:论文的核心思路是将人工智能代理(Agentic AI)引入O-RAN,构建一个多尺度的分层控制框架。通过不同层级的代理协同工作,实现对O-RAN的实时控制和管理。这种分层结构允许不同层级的代理处理不同时间尺度的任务,从而实现更高效的资源利用和更灵活的网络控制。
技术框架:该框架包含三个主要层级:Non-RT RIC、Near-RT RIC和RT层。Non-RT RIC层使用大型语言模型(LLM)代理,负责将运营商意图转化为策略,并管理模型的生命周期。Near-RT RIC层使用小型语言模型(SLM)代理,执行低延迟优化,并能激活、调整或禁用现有控制应用。RT层使用无线物理层基础模型(WPFM)代理,靠近分布式单元提供快速推理。这些代理通过标准化的O-RAN接口和遥测数据进行协作。
关键创新:该论文的关键创新在于将Agentic AI的概念引入O-RAN,并设计了一个多尺度的分层控制框架。通过不同层级的代理协同工作,实现了对O-RAN的全局优化和协同控制。此外,论文还提出了使用LLM、SLM和WPFM等不同类型的AI模型作为代理,以适应不同层级的控制需求。
关键设计:论文中关键的设计包括:(1) LLM代理的策略生成机制,如何将运营商意图转化为可执行的策略;(2) SLM代理的低延迟优化算法,如何在保证性能的同时降低延迟;(3) WPFM代理的快速推理方法,如何在资源受限的RT层实现高效的推理;(4) 不同层级代理之间的通信协议和数据格式,如何保证信息的有效传递和共享。具体的参数设置、损失函数和网络结构等细节在论文中未详细说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
论文通过概念验证实现,展示了该Agentic AI框架在非平稳条件下的鲁棒运行和意图驱动的切片资源控制方面的有效性。具体性能数据和对比基线在摘要中未提及,属于未知信息。但实验结果表明,该框架能够适应动态变化的网络环境,并根据运营商的意图进行资源分配,从而提升网络性能。
🎯 应用场景
该研究成果可应用于各种O-RAN部署场景,例如智能交通、工业自动化和智慧城市等。通过实现更高效的资源利用和更灵活的网络控制,可以提升用户体验,降低运营成本,并为新的应用和服务提供支持。未来,该框架可以进一步扩展到支持更多的AI模型和控制功能,从而实现更智能化的O-RAN管理。
📄 摘要(原文)
Open Radio Access Networks (O-RAN) promise flexible 6G network access through disaggregated, software-driven components and open interfaces, but this programmability also increases operational complexity. Multiple control loops coexist across the service management layer and RAN Intelligent Controller (RIC), while independently developed control applications can interact in unintended ways. In parallel, recent advances in generative Artificial Intelligence (AI) are enabling a shift from isolated AI models toward agentic AI systems that can interpret goals, coordinate multiple models and control functions, and adapt their behavior over time. This article proposes a multi-scale agentic AI framework for O-RAN that organizes RAN intelligence as a coordinated hierarchy across the Non-Real-Time (Non-RT), Near-Real-Time (Near-RT), and Real-Time (RT) control loops: (i) A Large Language Model (LLM) agent in the Non-RT RIC translates operator intent into policies and governs model lifecycles. (ii) Small Language Model (SLM) agents in the Near-RT RIC execute low-latency optimization and can activate, tune, or disable existing control applications; and (iii) Wireless Physical-layer Foundation Model (WPFM) agents near the distributed unit provide fast inference close to the air interface. We describe how these agents cooperate through standardized O-RAN interfaces and telemetry. Using a proof-of-concept implementation built on open-source models, software, and datasets, we demonstrate the proposed agentic approach in two representative scenarios: robust operation under non-stationary conditions and intent-driven slice resource control.