Towards End-to-End Network Intent Management with Large Language Models

作者: Lam Dinh, Sihem Cherrared, Xiaofeng Huang, Fabrice Guillemin

分类: cs.NI, cs.LG

发布日期: 2025-04-18

备注: Full paper is accepted at IFIP Networking 2025

💡 一句话要点

利用大语言模型实现5G/6G网络端到端意图管理

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 意图网络 网络配置 5G/6G网络 无线接入网络 核心网络 自动化网络管理

📋 核心要点

现有网络配置方法难以将人类高级意图直接转化为底层网络配置，导致配置效率低且易出错。
利用大语言模型理解人类语言和生成代码的能力，将高级意图自动转化为5G/6G网络配置。
实验表明，开源LLM在网络配置生成方面可与闭源模型媲美，甚至在某些方面更优，且成本更低。

📝 摘要（中文）

本文探讨了大型语言模型（LLMs）在基于意图的网络（IBN）中扮演的关键角色，因为LLMs在理解人类语言和生成代码方面表现出色，能够将人类表达的高级意图转化为低级网络配置。本文利用闭源语言模型（如Google Gemini 1.5 pro、ChatGPT-4）和开源模型（如LLama、Mistral）来研究它们为5G/6G移动网络中的无线接入网络（RAN）和核心网络生成端到端网络配置的能力。我们引入了一种新的性能指标，称为FEACI，以定量评估生成答案的格式（F）、可解释性（E）、准确性（A）、成本（C）和推理时间（I）；现有的通用指标无法捕捉这些特征。研究结果表明，与需要昂贵硬件设置且并非所有用户都能访问的闭源模型相比，开源模型可以实现相当甚至更优越的翻译性能。

🔬 方法详解

问题定义：当前网络配置方法依赖于人工配置或预定义的规则，无法直接理解和执行用户的高级意图。这导致配置过程繁琐、耗时，且容易出错，难以适应快速变化的网络需求。现有评估指标也无法全面衡量生成配置的质量，特别是格式、可解释性、成本和推理时间等关键因素。

核心思路：利用大型语言模型（LLMs）强大的自然语言理解和代码生成能力，将用户的高级意图转化为具体的网络配置。通过设计合适的提示词（prompts），引导LLM生成符合要求的配置代码。同时，引入新的评估指标FEACI，全面评估生成配置的质量。

技术框架：该研究主要包括以下几个阶段：1) 定义网络意图：将用户的高级意图转化为自然语言描述；2) 提示词设计：设计合适的提示词，引导LLM生成网络配置；3) LLM推理：使用不同的LLM（包括闭源和开源模型）生成网络配置；4) 评估：使用FEACI指标评估生成配置的质量。

关键创新：该研究的关键创新在于：1) 利用LLM实现端到端的网络意图管理，简化了网络配置过程；2) 提出了新的评估指标FEACI，全面评估生成配置的质量，弥补了现有评估指标的不足；3) 证明了开源LLM在网络配置生成方面具有与闭源模型竞争的能力，降低了成本。

关键设计：FEACI指标是关键设计之一，它包含五个维度：格式（F）评估生成配置的语法正确性；可解释性（E）评估生成配置的可理解程度；准确性（A）评估生成配置是否满足用户意图；成本（C）评估生成配置所需的资源；推理时间（I）评估生成配置所需的时间。研究中使用了不同的LLM，包括Google Gemini 1.5 pro、ChatGPT-4、LLama和Mistral，并针对不同的LLM设计了不同的提示词。

🖼️ 关键图片

📊 实验亮点

实验结果表明，开源LLM（如Mistral）在某些指标上甚至优于闭源LLM（如ChatGPT-4），尤其是在成本和可访问性方面具有显著优势。FEACI指标的引入能够更全面地评估LLM生成的网络配置，为后续研究提供了新的评估标准。研究结果强调了开源LLM在网络自动化领域的潜力。

🎯 应用场景

该研究成果可应用于自动化网络配置、智能网络管理和基于意图的网络等领域。通过将人类意图转化为机器可执行的网络配置，可以显著提高网络配置效率，降低运维成本，并实现更加灵活和智能的网络管理。未来，该技术有望应用于更复杂的网络环境，例如云网络、边缘计算网络等。

📄 摘要（原文）

Large Language Models (LLMs) are likely to play a key role in Intent-Based Networking (IBN) as they show remarkable performance in interpreting human language as well as code generation, enabling the translation of high-level intents expressed by humans into low-level network configurations. In this paper, we leverage closed-source language models (i.e., Google Gemini 1.5 pro, ChatGPT-4) and open-source models (i.e., LLama, Mistral) to investigate their capacity to generate E2E network configurations for radio access networks (RANs) and core networks in 5G/6G mobile networks. We introduce a novel performance metrics, known as FEACI, to quantitatively assess the format (F), explainability (E), accuracy (A), cost (C), and inference time (I) of the generated answer; existing general metrics are unable to capture these features. The results of our study demonstrate that open-source models can achieve comparable or even superior translation performance compared with the closed-source models requiring costly hardware setup and not accessible to all users.

Towards End-to-End Network Intent Management with Large Language Models

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理