HiSTM: Hierarchical Spatiotemporal Mamba for Cellular Traffic Forecasting

📄 arXiv: 2508.09184v1 📥 PDF

作者: Zineddine Bettouche, Khalid Ali, Andreas Fischer, Andreas Kassler

分类: cs.NI, cs.AI

发布日期: 2025-08-07


💡 一句话要点

HiSTM:用于蜂窝网络流量预测的分层时空Mamba模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: 蜂窝网络流量预测 时空预测 Mamba模型 状态空间模型 深度学习 网络优化

📋 核心要点

  1. 蜂窝网络流量预测面临用户移动性带来的复杂时空模式挑战,现有模型难以兼顾准确性和效率。
  2. HiSTM通过双空间编码器、Mamba时间模块和注意力机制,利用选择性状态空间方法捕获流量时空模式。
  3. 实验表明,HiSTM在真实数据集上显著优于基线模型,参数量更少,且具有良好的泛化性和长期预测能力。

📝 摘要(中文)

蜂窝网络流量预测对于网络规划、资源分配和跨小区负载均衡至关重要。然而,由于用户移动性导致复杂的时空模式,准确预测非常困难。现有的基于人工智能的流量预测模型通常需要在准确性和计算效率之间进行权衡。本文提出了分层时空Mamba(HiSTM),它结合了双空间编码器、基于Mamba的时间模块和注意力机制。HiSTM采用选择性状态空间方法来捕获网络流量中的空间和时间模式。评估结果表明,在真实世界数据集上,HiSTM相比STN基线在MAE指标上提升了29.4%,同时参数量减少了94%。HiSTM在不同数据集上具有良好的泛化能力,并在更长的时间范围内提高了预测精度。

🔬 方法详解

问题定义:论文旨在解决蜂窝网络流量预测的准确性和效率问题。现有基于AI的流量预测模型通常需要在准确性和计算效率之间进行权衡。复杂的时空模式,特别是用户移动性带来的影响,使得准确预测变得困难。

核心思路:论文的核心思路是利用Mamba架构及其选择性状态空间模型,结合空间编码器和注意力机制,来有效地捕获和建模蜂窝网络流量中的复杂时空依赖关系。Mamba架构在处理长序列数据方面具有优势,能够更好地捕捉时间上的依赖关系,而空间编码器则负责提取空间特征。

技术框架:HiSTM模型主要包含三个模块:双空间编码器、基于Mamba的时间模块和注意力机制。首先,双空间编码器用于提取流量数据的空间特征。然后,基于Mamba的时间模块利用选择性状态空间模型对时间序列进行建模,捕捉时间依赖关系。最后,注意力机制用于融合空间和时间特征,并进行最终的流量预测。

关键创新:HiSTM的关键创新在于将Mamba架构引入到蜂窝网络流量预测中,并结合双空间编码器和注意力机制,形成了一个端到端的时空预测模型。与传统的RNN或CNN模型相比,Mamba架构在处理长序列数据方面具有更高的效率和更好的性能。此外,双空间编码器的设计能够更好地捕捉流量数据的空间特征。

关键设计:HiSTM使用了分层的空间编码器,以捕捉不同尺度的空间信息。Mamba模块的具体参数设置(如状态维度、选择性参数等)需要根据具体数据集进行调整。损失函数通常采用均方误差(MSE)或平均绝对误差(MAE)。注意力机制可以使用标准的Scaled Dot-Product Attention。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,HiSTM在真实世界数据集上相比STN基线,在MAE指标上提升了29.4%,同时参数量减少了94%。这表明HiSTM在保证预测精度的同时,显著降低了计算复杂度。此外,HiSTM在不同数据集上表现出良好的泛化能力,并且在更长的时间范围内提高了预测精度,验证了其在实际应用中的潜力。

🎯 应用场景

HiSTM可应用于蜂窝网络的智能管理和优化,例如网络规划、资源动态分配、负载均衡、异常流量检测等。通过准确预测未来流量,运营商可以提前部署网络资源,优化网络性能,提升用户体验,并降低运营成本。该研究对于构建更智能、更高效的无线通信网络具有重要意义。

📄 摘要(原文)

Cellular traffic forecasting is essential for network planning, resource allocation, or load-balancing traffic across cells. However, accurate forecasting is difficult due to intricate spatial and temporal patterns that exist due to the mobility of users. Existing AI-based traffic forecasting models often trade-off accuracy and computational efficiency. We present Hierarchical SpatioTemporal Mamba (HiSTM), which combines a dual spatial encoder with a Mamba-based temporal module and attention mechanism. HiSTM employs selective state space methods to capture spatial and temporal patterns in network traffic. In our evaluation, we use a real-world dataset to compare HiSTM against several baselines, showing a 29.4% MAE improvement over the STN baseline while using 94% fewer parameters. We show that the HiSTM generalizes well across different datasets and improves in accuracy over longer time-horizons.