Generating ensembles of spatially-coherent in-situ forecasts using flow matching

📄 arXiv: 2504.03463v2 📥 PDF

作者: David Landry, Claire Monteleoni, Anastase Charantonis

分类: physics.ao-ph, cs.LG

发布日期: 2025-04-04 (更新: 2025-04-25)

备注: 26 pages, 7 figures


💡 一句话要点

提出基于流匹配的空间一致性集合预报方法,提升气象预测后处理性能。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 气象预报 后处理 流匹配 生成模型 空间一致性 Transformer 集合预报

📋 核心要点

  1. 现有气象预报后处理方法难以同时保证空间一致性和准确捕捉多变量间的复杂相关性。
  2. FMAP利用流匹配生成模型,学习观测数据的分布,从而生成空间一致且能反映变量间相关性的预报集合。
  3. 实验表明,FMAP在EUPPBench数据集上,对地表温度和风速的预测精度优于现有方法,且只需单次训练。

📝 摘要(中文)

本文提出了一种基于机器学习的地面气象预报后处理方法,该方法具有空间一致性和多变量特性。相较于以往工作,本文提出的流匹配后处理(FMAP)能更好地表示观测分布的相关结构,同时提升站点的边缘性能。FMAP生成的预报不受底层网格预测模型的限制,并能从数据中推断新的相关结构。该模型能从有限的数值模拟中生成任意数量的预报,从而实现低成本的预报系统。与需要在生成时训练多个网络的其他方法不同,只需一次训练即可在多个提前期执行后处理。本文详细介绍了该方法,包括在流匹配生成建模框架内训练的空间注意力Transformer骨干网络。在EUPPBench数据集上的实验表明,FMAP在预测西欧站点地表温度和阵风值方面表现出良好的性能,提前期可达五天。

🔬 方法详解

问题定义:论文旨在解决地面气象预报后处理中,现有方法难以兼顾空间一致性和准确建模多变量相关性的问题。传统方法通常独立处理每个站点的预报,忽略了空间上的依赖关系,或者难以捕捉不同气象变量之间的复杂关联。这些局限性导致预报结果的空间不连续性和整体不准确性。

核心思路:论文的核心思路是利用流匹配(Flow Matching)生成模型,直接学习观测数据的分布,并从中采样生成预报集合。流匹配通过学习一个时间相关的向量场,将简单分布(如高斯分布)连续地变换到目标分布(观测数据分布)。通过这种方式,模型能够捕捉观测数据的复杂相关结构,并生成空间一致的预报结果。

技术框架:FMAP的整体框架包括以下几个主要步骤:1)数据预处理:对气象观测数据进行标准化和必要的转换。2)流匹配模型训练:使用空间注意力Transformer作为骨干网络,训练流匹配模型,学习从简单分布到观测数据分布的映射。3)预报生成:从简单分布中采样,通过训练好的流匹配模型生成预报集合。4)后处理(可选):对生成的预报进行必要的后处理,例如反标准化。

关键创新:FMAP的关键创新在于将流匹配生成模型应用于气象预报后处理,并利用空间注意力Transformer来捕捉空间依赖关系。与传统方法相比,FMAP能够直接学习观测数据的分布,从而生成空间一致且能反映变量间相关性的预报集合。此外,FMAP只需单次训练即可在多个提前期执行后处理,降低了计算成本。

关键设计:FMAP使用空间注意力Transformer作为流匹配模型的骨干网络,以捕捉空间依赖关系。损失函数采用标准的流匹配损失,旨在最小化预测向量场与真实向量场之间的差异。模型训练过程中,采用Adam优化器,并设置合适的学习率和batch size。空间注意力机制的具体实现方式和参数设置对模型的性能有重要影响,需要在实验中进行调整。

📊 实验亮点

实验结果表明,FMAP在EUPPBench数据集上,对地表温度和风速的预测精度优于现有方法。具体而言,FMAP在多个提前期上都取得了更低的均方根误差(RMSE)和更高的连续等级概率分数(CRPS)。此外,FMAP生成的预报集合具有更好的空间一致性,能够更准确地反映气象变量之间的相关性。该方法只需单次训练即可在多个提前期执行后处理,显著降低了计算成本。

🎯 应用场景

该研究成果可应用于提升气象预报的准确性和可靠性,尤其是在对空间一致性要求较高的场景,如农业气象、能源气象和环境气象等领域。通过生成高质量的预报集合,可以为决策者提供更全面的信息,从而做出更明智的决策。此外,该方法还可以扩展到其他需要空间一致性预测的领域,如水文预报和空气质量预报。

📄 摘要(原文)

We propose a machine-learning-based methodology for in-situ weather forecast postprocessing that is both spatially coherent and multivariate. Compared to previous work, our Flow MAtching Postprocessing (FMAP) better represents the correlation structures of the observations distribution, while also improving marginal performance at the stations. FMAP generates forecasts that are not bound to what is already modeled by the underlying gridded prediction and can infer new correlation structures from data. The resulting model can generate an arbitrary number of forecasts from a limited number of numerical simulations, allowing for low-cost forecasting systems. A single training is sufficient to perform postprocessing at multiple lead times, in contrast with other methods which use multiple trained networks at generation time. This work details our methodology, including a spatial attention transformer backbone trained within a flow matching generative modeling framework. FMAP shows promising performance in experiments on the EUPPBench dataset, forecasting surface temperature and wind gust values at station locations in western Europe up to five-day lead times.