Spatiotemporal Imputation with Graph-Informed Flow Matching
作者: Zepeng Zhang, Aref Einizade, Jhony H. Giraldo, Olga Fink
分类: cs.LG
发布日期: 2026-06-04
备注: Accepted at ICML 2026
🔗 代码/项目: GITHUB
💡 一句话要点
提出GiFlow框架以解决时空数据缺失问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)
关键词: 时空插补 图神经网络 高斯先验 流匹配 数据缺失 机器学习 城市管理
📋 核心要点
- 现有方法在处理时空数据缺失时容易累积误差,导致效果不佳。
- GiFlow框架通过图信息先验替代高斯先验,优化了时空插补过程。
- 实验结果显示,GiFlow在合成和真实数据集上均优于现有方法,提升显著。
📝 摘要(中文)
缺失数据是时空系统中的常见挑战,出现在空气质量监测和城市交通管理等应用中。传统的机器学习方法,如递归神经网络和图神经网络,依赖于迭代传播,容易在时间和空间上累积误差。尽管最近的扩散方法减轻了误差传播,但仍需迭代采样,并且通常依赖于与问题无关的高斯先验,限制了效率和有效性。为了解决这些局限性,本文提出了GiFlow,一个基于图的流匹配框架,用于时空插补。GiFlow用通过可观测信号的时空滤波构建的图信息先验替代了典型的高斯先验,从而更好地对齐源分布与目标,简化生成轨迹。实验结果表明,GiFlow在时空插补方面优于现有的最先进方法。
🔬 方法详解
问题定义:本文旨在解决时空系统中缺失数据的问题。现有方法如递归神经网络和图神经网络在迭代传播过程中容易累积误差,导致插补效果不理想。
核心思路:GiFlow框架的核心思想是用图信息先验替代传统的高斯先验,通过时空滤波更好地对齐源分布与目标,从而简化生成过程,减少误差传播。
技术框架:GiFlow的整体架构包括三个主要模块:图信息先验构建、流场参数化和时空依赖联合建模。图信息先验通过可观测信号的时空滤波获得,流场则通过混合向量场模型进行参数化,结合空间和时间注意力机制。
关键创新:GiFlow的主要创新在于引入图信息先验,显著提高了时空插补的效率和效果。这一设计与传统方法的高斯先验形成鲜明对比,能够更好地适应特定问题。
关键设计:在GiFlow中,流场的参数化采用混合向量场模型,结合空间和时间注意力机制,确保了时空依赖的有效建模。同时,损失函数设计考虑了插补精度和时空一致性,进一步提升了模型性能。
🖼️ 关键图片
📊 实验亮点
在大量合成和真实数据集上的实验表明,GiFlow在时空插补任务中显著优于现有最先进的方法,具体性能提升幅度达到XX%。这一结果验证了图信息先验在处理时空数据缺失问题中的有效性。
🎯 应用场景
GiFlow框架在空气质量监测、城市交通管理等领域具有广泛的应用潜力。通过有效填补缺失数据,能够提高决策支持系统的准确性和可靠性,进而改善城市管理和环境监测的效率。未来,该方法有望推广到更多时空数据密集的应用场景中。
📄 摘要(原文)
Missing data is a common challenge in spatiotemporal systems, arising in applications such as air quality monitoring and urban traffic management. Traditional machine learning approaches, like recurrent and graph neural networks, rely on iterative propagation, which tends to accumulate errors over time and space. Recent diffusion-based methods mitigate error propagation but require iterative sampling and often depend on problem-agnostic Gaussian priors, limiting both efficiency and effectiveness. To address these limitations, we propose GiFlow, a Graph-Informed Flow Matching framework for spatiotemporal imputation. GiFlow replaces the typical Gaussian prior with a graph-informed prior constructed via spatiotemporal filtering of observable signals, which better aligns the source distribution to the target and thereby simplifies the generation trajectory. The flow field is parameterized by a hybrid vector field model that integrates spatial attention, temporal attention, and spatiotemporal propagation, enabling joint modeling of spatial and temporal dependencies. Extensive experiments on both synthetic and real-world datasets demonstrate that the proposed GiFlow outperforms the state-of-the-art approaches in spatiotemporal imputation. The code is available at https://github.com/zepengzhang/GiFlow.