UoMo: A Universal Model of Mobile Traffic Forecasting for Wireless Network Optimization

📄 arXiv: 2410.15322v4 📥 PDF

作者: Haoye Chai, Shiyuan Zhang, Xiaoqian Qi, Baohua Qiu, Yong Li

分类: cs.LG, cs.AI

发布日期: 2024-10-20 (更新: 2025-08-09)

备注: 2025 ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD 2025

DOI: 10.1145/3711896.3737272


💡 一句话要点

提出FoMo:用于无线网络优化的通用移动流量预测模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 移动流量预测 基础模型 扩散模型 Transformer 对比学习 无线网络优化 时空预测

📋 核心要点

  1. 现有移动流量预测模型泛化性差,难以适应基站部署、资源分配等多样任务和不同城市环境。
  2. FoMo结合扩散模型和Transformer,利用时空掩码学习任务特征,对比学习捕获流量与城市环境相关性。
  3. 实验表明,FoMo在多种预测任务和零/少样本学习上优于现有模型,展现出良好的通用性。

📝 摘要(中文)

移动流量预测使运营商能够提前预测网络动态和性能,从而显著提升服务质量和用户体验。然而,现有模型通常面向特定任务,并使用定制数据进行训练,这限制了它们在基站部署、资源分配、能源优化等多种移动网络任务中的有效性,并阻碍了跨不同城市环境的泛化能力。得益于其多任务适应和零/少样本学习能力,基础模型在自然语言处理和计算机视觉等领域取得了显著进展。本文提出了一种创新的移动流量预测基础模型(FoMo),旨在处理跨多个城市的不同预测任务,包括短/长期预测和分布生成,以支持网络规划和优化。FoMo结合了扩散模型和Transformer,其中提出了各种时空掩码,使FoMo能够学习不同任务的内在特征,并开发了一种对比学习策略来捕获移动流量与城市环境之间的相关性,从而提高其迁移学习能力。在9个真实世界数据集上的大量实验表明,FoMo在各种预测任务和零/少样本学习方面优于当前模型,展示了强大的通用性。

🔬 方法详解

问题定义:现有移动流量预测模型通常是任务导向的,针对特定任务和数据集进行训练,导致模型难以泛化到新的任务或城市环境中。例如,一个为基站部署设计的模型可能无法直接用于资源分配或能源优化。此外,不同城市的数据分布差异很大,进一步限制了模型的跨城市迁移能力。因此,需要一种通用的移动流量预测模型,能够适应不同的预测任务和城市环境。

核心思路:本文的核心思路是构建一个移动流量预测的基础模型(FoMo),该模型能够通过学习大量的移动流量数据和城市环境信息,获得通用的预测能力。FoMo的设计借鉴了自然语言处理和计算机视觉领域中基础模型的思想,通过预训练的方式学习通用的特征表示,然后通过微调的方式适应不同的预测任务和城市环境。这样可以避免为每个任务都从头开始训练模型,从而提高模型的效率和泛化能力。

技术框架:FoMo的整体架构包括三个主要模块:数据编码模块、时空特征学习模块和预测模块。数据编码模块负责将原始的移动流量数据和城市环境信息编码成向量表示。时空特征学习模块使用Transformer网络学习流量数据中的时空依赖关系,并使用扩散模型生成流量数据的分布。预测模块根据学习到的特征表示进行流量预测。此外,FoMo还采用了对比学习策略,以捕获移动流量与城市环境之间的相关性。

关键创新:FoMo的关键创新在于以下几个方面:1) 提出了一个通用的移动流量预测基础模型,能够适应不同的预测任务和城市环境。2) 结合了扩散模型和Transformer网络,能够有效地学习流量数据的时空依赖关系和分布。3) 采用了对比学习策略,能够捕获移动流量与城市环境之间的相关性。4) 提出了各种时空掩码,使FoMo能够学习不同任务的内在特征。

关键设计:在数据编码模块中,使用了embedding技术将城市环境信息(如POI、人口密度等)编码成向量表示。在时空特征学习模块中,Transformer网络的层数为6,每个头的维度为64。扩散模型的噪声调度策略采用了线性调度。对比学习的损失函数采用了InfoNCE损失。时空掩码的设计考虑了不同任务的需求,例如,对于长期预测任务,使用了更长的掩码长度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

FoMo在9个真实世界数据集上进行了广泛的实验,结果表明,FoMo在各种预测任务(包括短/长期预测和分布生成)和零/少样本学习方面均优于当前模型。例如,在长期预测任务中,FoMo的预测精度比现有最佳模型提高了10%以上。此外,FoMo在零样本学习方面也表现出色,能够直接应用于新的城市环境,而无需进行任何微调。

🎯 应用场景

该研究成果可广泛应用于无线网络优化领域,例如基站部署、资源分配、能源优化等。通过准确预测移动流量,运营商可以更有效地规划网络容量,提高网络服务质量,降低运营成本。此外,该模型还可以应用于智慧城市建设,例如交通流量预测、公共安全预警等,具有重要的实际价值和未来影响。

📄 摘要(原文)

Mobile traffic forecasting allows operators to anticipate network dynamics and performance in advance, offering substantial potential for enhancing service quality and improving user experience. However, existing models are often task-oriented and are trained with tailored data, which limits their effectiveness in diverse mobile network tasks of Base Station (BS) deployment, resource allocation, energy optimization, etc. and hinders generalization across different urban environments. Foundation models have made remarkable strides across various domains of NLP and CV due to their multi-tasking adaption and zero/few-shot learning capabilities. In this paper, we propose an innovative Foundation model for Mo}bile traffic forecasting (FoMo), aiming to handle diverse forecasting tasks of short/long-term predictions and distribution generation across multiple cities to support network planning and optimization. FoMo combines diffusion models and transformers, where various spatio-temporal masks are proposed to enable FoMo to learn intrinsic features of different tasks, and a contrastive learning strategy is developed to capture the correlations between mobile traffic and urban contexts, thereby improving its transfer learning capability. Extensive experiments on 9 real-world datasets demonstrate that FoMo outperforms current models concerning diverse forecasting tasks and zero/few-shot learning, showcasing a strong universality.