Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner

📄 arXiv: 2405.03185v2 📥 PDF

作者: Tong Nie, Guoyang Qin, Wei Ma, Jian Sun

分类: cs.LG

发布日期: 2024-05-06 (更新: 2024-10-24)

备注: Accepted at TR-Part C

DOI: 10.1016/j.trc.2024.104890

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于时空隐式神经表示的通用交通数据学习框架,解决现有方法泛化性不足的问题。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 时空数据建模 隐式神经表示 交通流量预测 谱嵌入 深度学习 交通数据重建

📋 核心要点

  1. 现有交通数据重建方法受限于数据特定维度或源依赖模式,缺乏统一表示能力。
  2. 论文提出将时空交通数据参数化为隐式神经表示,学习连续的时空动态。
  3. 实验表明,该方法在不同数据领域和网络拓扑上优于传统低秩模型,具有通用性。

📝 摘要(中文)

本文提出了一种新的范式,通过将时空交通数据(STTD)参数化为隐式神经表示来解决STTD学习问题。该方法利用基于坐标的神经网络,将坐标直接映射到交通变量,从而能够编码高频结构,揭示低维状态下的潜在动态。为了解开纠缠的时空交互,将变异性分解为独立的过程。此外,该方法还支持在传感器图等不规则空间中使用谱嵌入进行建模。通过连续表示,该方法能够以统一的输入对各种STTD进行建模,从而成为底层交通动态的通用学习器。实验结果表明,该模型优于传统的低秩模型,并且具有跨不同数据领域、输出分辨率和网络拓扑的通用性。模型分析进一步揭示了STTD的归纳偏置。该研究为各种实际任务中STTD的通用表示奠定了基础。

🔬 方法详解

问题定义:现有方法在重建时空交通数据时,通常依赖于特定维度或数据源的模式,缺乏统一的表示方法,难以泛化到不同的交通场景和数据类型。这限制了模型在复杂交通系统中的应用。

核心思路:论文的核心思路是将时空交通数据视为一个连续的场,并使用隐式神经表示(INR)来学习这个场的函数。通过将时空坐标作为输入,神经网络直接预测对应的交通变量,从而实现对交通数据的连续表示和建模。这种方法能够捕捉高频细节,并解耦时空交互。

技术框架:整体框架包含以下几个主要部分:1) 坐标编码:将时空坐标作为神经网络的输入。2) 隐式神经表示网络:使用基于坐标的神经网络(例如MLP)将坐标映射到交通变量。3) 谱嵌入:对于不规则空间(例如传感器图),使用谱嵌入将节点映射到低维空间。4) 变异性解耦:将时空变异性分解为独立的进程,以更好地捕捉动态。

关键创新:最重要的创新点在于将隐式神经表示引入到交通数据建模中。与传统的离散表示方法相比,INR能够学习连续的交通场,捕捉高频细节,并实现对不同类型交通数据的统一建模。此外,通过谱嵌入和变异性解耦,该方法还能够处理不规则空间和复杂的时空交互。

关键设计:论文中使用了基于坐标的多层感知机(MLP)作为隐式神经表示网络。损失函数通常采用均方误差(MSE)来衡量预测值和真实值之间的差异。对于谱嵌入,可以使用拉普拉斯特征映射等方法。具体的网络结构和参数设置需要根据具体的交通数据集进行调整。论文中可能还使用了正则化项来防止过拟合,并鼓励模型学习平滑的交通场。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该模型在真实世界的交通场景中显著优于传统的低秩模型。具体而言,该模型在各种交通数据集上实现了更高的预测精度和更低的重建误差。此外,实验还验证了该模型在不同数据领域、输出分辨率和网络拓扑上的通用性,证明了其作为通用交通数据学习器的有效性。

🎯 应用场景

该研究成果可应用于智能交通系统中的流量预测、交通状态估计、异常检测等领域。通过学习交通数据的连续表示,可以实现更精确、更鲁棒的交通管理和控制,提升交通效率和安全性。此外,该方法还可以扩展到其他时空数据建模任务,例如气象预测、环境监测等。

📄 摘要(原文)

Spatiotemporal Traffic Data (STTD) measures the complex dynamical behaviors of the multiscale transportation system. Existing methods aim to reconstruct STTD using low-dimensional models. However, they are limited to data-specific dimensions or source-dependent patterns, restricting them from unifying representations. Here, we present a novel paradigm to address the STTD learning problem by parameterizing STTD as an implicit neural representation. To discern the underlying dynamics in low-dimensional regimes, coordinate-based neural networks that can encode high-frequency structures are employed to directly map coordinates to traffic variables. To unravel the entangled spatial-temporal interactions, the variability is decomposed into separate processes. We further enable modeling in irregular spaces such as sensor graphs using spectral embedding. Through continuous representations, our approach enables the modeling of a variety of STTD with a unified input, thereby serving as a generalized learner of the underlying traffic dynamics. It is also shown that it can learn implicit low-rank priors and smoothness regularization from the data, making it versatile for learning different dominating data patterns. We validate its effectiveness through extensive experiments in real-world scenarios, showcasing applications from corridor to network scales. Empirical results not only indicate that our model has significant superiority over conventional low-rank models, but also highlight that the versatility of the approach extends to different data domains, output resolutions, and network topologies. Comprehensive model analyses provide further insight into the inductive bias of STTD. We anticipate that this pioneering modeling perspective could lay the foundation for universal representation of STTD in various real-world tasks. Code is available at https://github.com/tongnie/traffic_dynamics.