GENESIS: Harnessing AI Agents for Autonomous 6G RAN Synthesis, Research, and Testing

📄 arXiv: 2605.27360v1 📥 PDF

作者: Tamerlan Aghayev, Maxime Elkael, Michele Polese, Minh Dat Nguyen, Gabriele Gemmi, Andrea Lacava, Ali Saeizadeh, Reshma Prasad, Paolo Testolina, Angelo Feraudo, Soumendra Nanda, Pedram Johari, Salvatore D'Oro, Tommaso Melodia

分类: cs.NI, cs.AI

发布日期: 2026-05-26

备注: 18 pages, 16 figures


💡 一句话要点

GENESIS:利用AI Agent实现6G RAN的自主合成、研究与测试

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 6G RAN AI Agent 自主研发 无线实验 知识库 网络优化 自动化测试

📋 核心要点

  1. 现有蜂窝网络研发流程繁琐耗时,严重依赖人工,无法快速迭代新特性和应对复杂环境。
  2. GENESIS提出了一种基于AI Agent的框架,将研发意图转化为可验证的解决方案,并持续学习积累知识。
  3. 该框架通过无线实验验证解决方案,并将其反馈到知识库中,实现能力的迭代和提升。

📝 摘要(中文)

蜂窝网络研发受到六个结构性流程的制约,每个流程的每次迭代都需要耗费数月的人工工程工作:(i)将标准或研究论文中的新特性合成为生产代码;(ii)一致性和互操作性测试;(iii)加强对现场异常和多样化部署环境的抵抗能力;(iv)网络功能的数据驱动优化;(v)发现和原型化未来标准的新波形、功能和能力;(vi)保护堆栈免受漏洞攻击。尽管大型语言模型(LLM)已将通用软件工程中类似研发工作的时间从几天压缩到几分钟,但它们在无线接入网(RAN)用例中的已知缺陷却更加严重:它们会幻构应用程序编程接口(API)并误读规范,这会在第一个错误时扼杀RAN组件的互操作性,并且它们严重依赖仿真来设计算法,这在转移到真实硬件时会臭名昭著地崩溃。为了应对这些挑战,我们提出了GENESIS,一个agentic人工智能(AI)框架,它将意图(例如,规范条款、遥测异常或研究假设)转换为通过无线实验验证的解决方案,并反馈到持久的知识库中。GENESIS建立在三个可组合的原语(agents、skills、hooks)和一个知识层(SYNAPSE)之上,SYNAPSE既是ground truth的来源,也是框架产生的所有artifact的接收者,从而使能力在运行中复合。

🔬 方法详解

问题定义:当前蜂窝网络研发面临六大挑战:新特性合成、一致性测试、环境适应、数据优化、新功能原型设计和安全防护。这些流程高度依赖人工,耗时且容易出错,阻碍了创新和快速迭代。现有方法,特别是依赖LLM的方法,在RAN领域面临API幻构、规范误读以及仿真与实际硬件差异等问题。

核心思路:GENESIS的核心思路是利用AI Agent自主地执行研发任务,将意图转化为可验证的解决方案。通过构建一个包含agents、skills和hooks的可组合框架,以及一个名为SYNAPSE的知识层,GENESIS能够持续学习、积累知识,并实现能力的迭代和提升。这种方法旨在减少人工干预,加速研发流程,并提高解决方案的可靠性和有效性。

技术框架:GENESIS框架包含三个主要组成部分:Agents(执行特定任务的智能体)、Skills(Agent执行任务所需的技能)和Hooks(连接Agent和外部环境的接口)。这些组件与一个名为SYNAPSE的知识层交互,SYNAPSE存储了ground truth和框架产生的所有artifact。整个流程如下:首先,用户输入一个意图(例如,一个规范条款)。然后,一个或多个Agent被激活,利用其Skills和Hooks来生成一个解决方案。该解决方案通过无线实验进行验证,并将结果反馈到SYNAPSE中。SYNAPSE中的知识被用于改进Agent的Skills,从而实现能力的迭代。

关键创新:GENESIS的关键创新在于其agentic AI框架,该框架能够自主地执行蜂窝网络研发任务,并将意图转化为可验证的解决方案。与传统的依赖人工或基于仿真的方法不同,GENESIS通过无线实验验证解决方案,从而确保其在实际硬件环境中的有效性。此外,SYNAPSE知识层的引入使得GENESIS能够持续学习和积累知识,从而实现能力的迭代和提升。

关键设计:GENESIS框架的关键设计包括:(1)可组合的Agent、Skill和Hook架构,允许灵活地构建和定制Agent;(2)SYNAPSE知识层,用于存储ground truth和框架产生的所有artifact,并支持知识的共享和重用;(3)无线实验验证机制,用于确保解决方案在实际硬件环境中的有效性;(4)反馈机制,用于将实验结果反馈到SYNAPSE中,并改进Agent的Skills。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提出了一个可行的AI Agent框架,用于加速6G RAN的研发和测试。虽然具体实验数据未在摘要中给出,但GENESIS框架的设计目标是显著减少研发时间,并提高解决方案在实际硬件环境中的有效性。通过无线实验验证和知识积累,GENESIS有望超越传统仿真方法,并解决LLM在RAN领域的局限性。

🎯 应用场景

GENESIS可应用于加速6G无线接入网的研发过程,包括新特性开发、协议测试、性能优化和安全漏洞修复。它能够降低研发成本,缩短上市时间,并提高网络性能和安全性。此外,该框架还可用于自动化网络运维和管理,提高网络效率和可靠性。

📄 摘要(原文)

Cellular research and development (R&D) is throttled by six structural processes that each consume months of manual engineering work per iteration: (i) synthesizing new features from standards or research papers into production code; (ii) conformance and interoperability testing; (iii) hardening against field anomalies and diverse deployment environments; (iv) data-driven optimization of network functionalities; (v) discovering and prototyping novel waveforms, functionalities, and capabilities for future standards; and (vi) securing the stack against vulnerabilities. Although Large Language Models (LLMs) have compressed comparable R&D work in general software engineering from days to minutes, their known pitfalls worsen on Radio Access Network (RAN) use cases: they hallucinate Application Programming Interfaces (APIs) and mis-read specifications, which kills interoperability of RAN components at the first mistake, and they heavily rely on simulations for designing algorithms, which is notorious for breaking when transferred to real hardware. To address these challenges, we present GENESIS, an agentic Artificial Intelligence (AI) framework that converts intents (e.g., a specification clause, a telemetry anomaly, or a research hypothesis) into solutions validated with over-the-air experiments, fed back into a persistent knowledge base. GENESIS is built on three composable primitives (agents, skills, hooks) and a knowledge layer (SYNAPSE) that doubles as the source of ground truth and the recipient of every artifact the framework produces, making capabilities compound across runs.