Evaluating Spatio-Temporal Forecasting Trade-offs Between Graph Neural Networks and Foundation Models
作者: Ragini Gupta, Naman Raina, Bo Chen, Li Chen, Claudiu Danilov, Josh Eckhardt, Keyshla Bernard, Klara Nahrstedt
分类: cs.LG, cs.AI, cs.NI
发布日期: 2025-11-07 (更新: 2025-11-30)
🔗 代码/项目: GITHUB
💡 一句话要点
评估图神经网络与时间序列基础模型在时空预测中的权衡,优化传感器部署。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 时空预测 图神经网络 时间序列基础模型 传感器网络 性能评估
📋 核心要点
- 现有物联网部署侧重于数据量优化,忽略了采样频率和空间覆盖对预测模型性能的影响。
- 该研究系统评估了不同模型在不同传感器密度和采样频率下的时空预测性能。
- 实验表明,STGNN在稀疏部署下有效,TSFM在高频下有竞争力,Moirai通过学习跨传感器依赖关系表现最佳。
📝 摘要(中文)
现代物联网环境传感产生大量时空数据,用于支持预测等下游任务,这些任务通常由机器学习模型驱动。现有的过滤和策略性部署技术优化了边缘收集的数据量,但忽略了采样频率和空间覆盖的变化如何影响下游模型的性能。在许多预测模型中,结合来自额外传感器的数据可以通过提供更广泛的空间背景来消除预测噪声。本文针对经典模型(VAR)、神经网络(GRU、Transformer)、时空图神经网络(STGNN)和时间序列基础模型(TSFM:Chronos Moirai、TimesFM),在使用无线传感器网络中的真实温度数据时,在不同的空间传感器节点密度和采样间隔下,对预测模型进行了系统研究。结果表明,当传感器部署稀疏且采样率适中时,STGNN是有效的,它利用编码的图结构中的空间相关性来补偿有限的覆盖范围。相比之下,TSFM在高频时表现出竞争力,但当来自相邻传感器的空间覆盖范围减少时,性能会下降。至关重要的是,多元TSFM Moirai通过原生学习跨传感器依赖关系,优于所有模型。这些发现为在时空系统中构建高效的预测管道提供了可操作的见解。所有模型配置、训练、数据集和日志的代码都是开源的,以实现可重复性。
🔬 方法详解
问题定义:论文旨在解决在时空预测任务中,如何根据传感器部署(空间覆盖密度)和数据采样频率选择合适的预测模型的问题。现有方法通常只关注数据量优化,忽略了这些因素对不同模型性能的影响,导致预测效果不佳。
核心思路:论文的核心思路是系统性地评估不同类型的预测模型(包括经典模型、神经网络、时空图神经网络和时间序列基础模型)在不同传感器部署密度和采样频率下的性能。通过对比分析,揭示不同模型在不同场景下的优劣势,从而为实际应用提供模型选择的指导。
技术框架:该研究的技术框架主要包括以下几个步骤:1) 构建包含不同传感器部署密度和采样频率的时空数据集;2) 选择代表性的预测模型,包括VAR、GRU、Transformer、STGNN(具体模型未知)和TSFM(Chronos Moirai, TimesFM);3) 在不同数据集上训练和评估这些模型;4) 分析实验结果,总结不同模型在不同场景下的性能表现。
关键创新:该研究的关键创新在于其系统性的评估方法,它考虑了传感器部署和采样频率对不同模型性能的综合影响。此外,研究结果揭示了STGNN和TSFM在不同场景下的互补优势,以及多元TSFM Moirai在学习跨传感器依赖关系方面的优越性。
关键设计:论文中关于模型参数设置、损失函数和网络结构的具体技术细节未知。但可以推测,研究中可能使用了标准的均方误差(MSE)或平均绝对误差(MAE)作为损失函数,并对不同模型的超参数进行了优化,以保证公平的比较。
🖼️ 关键图片
📊 实验亮点
实验结果表明,STGNN在传感器部署稀疏且采样率适中时表现出色,能够有效利用空间相关性。TSFM在高频采样下具有竞争力,但空间覆盖不足时性能下降。多元TSFM Moirai通过学习跨传感器依赖关系,在所有场景下均优于其他模型,展现了其强大的时空预测能力。具体性能提升数据未知。
🎯 应用场景
该研究成果可应用于各种需要时空预测的领域,例如环境监测(温度、湿度预测)、交通流量预测、智慧城市建设等。通过选择合适的预测模型,可以提高预测精度,优化资源配置,并为决策提供更可靠的依据。研究结果有助于设计更高效的传感器网络部署策略,降低成本,提高系统整体性能。
📄 摘要(原文)
Modern IoT deployments for environmental sensing produce high volume spatiotemporal data to support downstream tasks such as forecasting, typically powered by machine learning models. While existing filtering and strategic deployment techniques optimize collected data volume at the edge, they overlook how variations in sampling frequencies and spatial coverage affect downstream model performance. In many forecasting models, incorporating data from additional sensors denoise predictions by providing broader spatial contexts. This interplay between sampling frequency, spatial coverage and different forecasting model architectures remain underexplored. This work presents a systematic study of forecasting models - classical models (VAR), neural networks (GRU, Transformer), spatio-temporal graph neural networks (STGNNs), and time series foundation models (TSFMs: Chronos Moirai, TimesFM) under varying spatial sensor nodes density and sampling intervals using real-world temperature data in a wireless sensor network. Our results show that STGNNs are effective when sensor deployments are sparse and sampling rate is moderate, leveraging spatial correlations via encoded graph structure to compensate for limited coverage. In contrast, TSFMs perform competitively at high frequencies but degrade when spatial coverage from neighboring sensors is reduced. Crucially, the multivariate TSFM Moirai outperforms all models by natively learning cross-sensor dependencies. These findings offer actionable insights for building efficient forecasting pipelines in spatio-temporal systems. All code for model configurations, training, dataset, and logs are open-sourced for reproducibility: https://github.com/UIUC-MONET-Projects/Benchmarking-Spatiotemporal-Forecast-Models