Spatial PDE-aware Selective State-space with Nested Memory for Mobile Traffic Grid Forecasting
作者: Zineddine Bettouche, Khalid Ali, Andreas Fischer, Andreas Kassler
分类: cs.LG
发布日期: 2026-03-12
💡 一句话要点
提出NeST-S6模型,利用嵌套记忆和空间偏微分方程感知选择性状态空间模型,解决移动流量网格预测问题。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)
关键词: 移动流量预测 时空预测 状态空间模型 偏微分方程 嵌套学习 卷积神经网络 网格预测
📋 核心要点
- 现有移动流量预测方法难以兼顾准确性和计算效率,特定小区模型成本高昂,全局模型无法捕捉空间异质性,而基于注意力或图神经网络的模型计算开销大。
- NeST-S6模型采用卷积选择性状态空间模型,利用空间偏微分方程感知核心处理空间信息,并引入嵌套学习长期记忆来适应未建模的动态变化。
- 实验结果表明,NeST-S6在米兰数据集上优于Mamba系列基线,在漂移压力测试中显著降低了误差,并大幅提高了网格重建速度和降低了计算量。
📝 摘要(中文)
蜂窝网络中的流量预测是一个具有挑战性的时空预测问题,因为它具有强时间依赖性、跨小区的空间异质性以及对大规模网络部署的可扩展性需求。传统的特定小区模型会产生过高的训练和维护成本,而全局模型通常无法捕获异构空间动态。最近基于注意力或图神经网络的时空架构提高了准确性,但引入了高计算开销,限制了它们在大型或实时环境中的适用性。我们研究时空网格预测,其中每个时间步长都是流量值的2D网格,并使用先前的网格块来预测下一个网格块。我们提出NeST-S6,一种具有空间偏微分方程(PDE)感知核心的卷积选择性状态空间模型(SSM),它以嵌套学习范式实现:卷积局部空间混合馈送空间PDE感知SSM核心,而嵌套学习长期记忆由学习的优化器更新,当单步预测误差表明存在未建模的动态时。在三个分辨率(202、502、1002)的移动流量网格(米兰数据集)上,NeST-S6在单步和6步自回归展开中均获得了比强大的Mamba系列基线更低的误差。在漂移压力测试下,我们的模型的嵌套记忆使MAE比无记忆消融降低了48-65%。与有竞争力的逐像素扫描模型相比,NeST-S6还将完整网格重建速度提高了32倍,并将MAC减少了4.3倍,同时实现了低61%的逐像素RMSE。
🔬 方法详解
问题定义:论文旨在解决移动蜂窝网络中大规模流量网格的精确和高效预测问题。现有方法,如特定小区模型,维护成本高;全局模型无法捕捉空间异质性;基于注意力或图神经网络的模型计算复杂度高,难以应用于大规模或实时场景。
核心思路:论文的核心思路是利用选择性状态空间模型(SSM)来建模时空依赖关系,并结合空间偏微分方程(PDE)感知能力来捕捉空间异质性。此外,引入嵌套学习长期记忆来适应流量模式的动态变化,从而提高预测精度和鲁棒性。
技术框架:NeST-S6模型主要包含以下几个模块:1) 卷积局部空间混合:利用卷积操作提取局部空间特征。2) 空间PDE感知SSM核心:利用SSM建模时序依赖,并融入空间PDE信息以感知空间异质性。3) 嵌套学习长期记忆:使用学习的优化器更新长期记忆,以适应未建模的动态变化。整体流程是,首先通过卷积提取空间特征,然后利用SSM核心进行时空建模,最后通过嵌套记忆进行动态调整。
关键创新:NeST-S6的关键创新在于:1) 空间PDE感知SSM核心:将空间PDE信息融入SSM,使其能够更好地捕捉空间异质性。2) 嵌套学习长期记忆:通过学习的优化器动态更新长期记忆,从而适应流量模式的动态变化。3) 卷积选择性状态空间模型:在状态空间模型中引入选择机制,从而提高模型的效率和准确性。
关键设计:在空间PDE感知SSM核心中,具体的PDE形式需要根据实际的流量特性进行选择。嵌套学习长期记忆的更新频率和优化器类型是重要的超参数。卷积局部空间混合中,卷积核的大小和数量需要根据网格分辨率进行调整。损失函数通常采用均方误差(MSE)或平均绝对误差(MAE)。
📊 实验亮点
NeST-S6在米兰数据集上取得了显著的性能提升。在单步和6步自回归展开中,NeST-S6优于Mamba系列基线。在漂移压力测试下,NeST-S6的嵌套记忆使MAE降低了48-65%。此外,NeST-S6还将完整网格重建速度提高了32倍,并将MAC减少了4.3倍,同时实现了低61%的逐像素RMSE。
🎯 应用场景
该研究成果可应用于移动网络运营商的流量预测和资源优化,例如,根据预测结果动态调整网络容量,优化基站配置,提高用户体验。此外,该模型也可扩展到其他时空预测领域,如智慧城市、交通管理和环境监测等。
📄 摘要(原文)
Traffic forecasting in cellular networks is a challenging spatiotemporal prediction problem due to strong temporal dependencies, spatial heterogeneity across cells, and the need for scalability to large network deployments. Traditional cell-specific models incur prohibitive training and maintenance costs, while global models often fail to capture heterogeneous spatial dynamics. Recent spatiotemporal architectures based on attention or graph neural networks improve accuracy but introduce high computational overhead, limiting their applicability in large-scale or real-time settings. We study spatiotemporal grid forecasting, where each time step is a 2D lattice of traffic values, and predict the next grid patch using previous patches. We propose NeST-S6, a convolutional selective state-space model (SSM) with a spatial PDE-aware core, implemented in a nested learning paradigm: convolutional local spatial mixing feeds a spatial PDE-aware SSM core, while a nested-learning long-term memory is updated by a learned optimizer when one-step prediction errors indicate unmodeled dynamics. On the mobile-traffic grid (Milan dataset) at three resolutions (202, 502, 1002), NeST-S6 attains lower errors than a strong Mamba-family baseline in both single-step and 6-step autoregressive rollouts. Under drift stress tests, our model's nested memory lowers MAE by 48-65% over a no-memory ablation. NeST-S6 also speeds full-grid reconstruction by 32 times and reduces MACs by 4.3 times compared to competitive per-pixel scanning models, while achieving 61% lower per-pixel RMSE.