XiChen: An observation-scalable fully AI-driven global weather forecasting system with 4D variational knowledge

📄 arXiv: 2507.09202v2 📥 PDF

作者: Wuxin Wang, Weicheng Ni, Lilan Huang, Tao Hao, Ben Fei, Shuo Ma, Taikang Yuan, Yanlai Zhao, Kefeng Deng, Xiaoyong Li, Hongze Leng, Boheng Duan, Lei Bai, Weimin Zhang, Kaijun Ren, Junqiang Song

分类: cs.LG, cs.AI, physics.ao-ph

发布日期: 2025-07-12 (更新: 2025-12-08)


💡 一句话要点

XiChen:一个可扩展观测数据的全AI全球天气预报系统

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 天气预报 人工智能 数据同化 四维变分 预训练模型

📋 核心要点

  1. 传统天气预报依赖于计算成本高的数值天气预报(NWP)系统生成初始条件,限制了AI在天气预报中的应用。
  2. XiChen通过预训练基础模型并微调,使其同时作为观测算子和数据同化模型,实现对观测数据的可扩展同化。
  3. XiChen集成了四维变分知识,在数据同化过程中保持物理平衡约束,实现了与NWP系统相当的预报精度,有效预报提前期超过8.75天。

📝 摘要(中文)

本文介绍了一个可扩展观测数据的全AI驱动的全球天气预报系统XiChen。该系统仅需15秒即可完成从数据同化(DA)到中程预报的整个流程。XiChen建立在一个预训练的天气预报基础模型之上,该模型经过微调后既可作为观测算子也可作为DA模型,从而能够可扩展地同化传统观测数据和原始卫星观测数据。此外,四维变分(4DVar)知识的集成确保了XiChen能够实现与业务NWP系统相当的DA和中程预报精度,其有效预报提前期超过8.75天。XiChen的一个关键特性是它能够在DA期间保持物理平衡约束,从而使观测变量能够有效地校正未观测变量。在单点扰动DA实验中,XiChen表现出与传统4DVar系统相似的流动依赖特性。这些结果表明,XiChen具有独立于NWP系统的全AI驱动天气预报的强大潜力。

🔬 方法详解

问题定义:现有AI驱动的天气预报模型依赖于数值天气预报(NWP)系统提供的初始条件,而NWP系统计算成本高昂。虽然一些端到端模型试图绕过NWP系统,但它们缺乏对新型观测数据的可扩展同化能力。因此,如何构建一个完全由AI驱动,且能够有效同化各种观测数据的全球天气预报系统是一个关键问题。

核心思路:XiChen的核心思路是构建一个预训练的基础模型,该模型能够通过微调同时作为观测算子和数据同化模型。通过这种方式,系统可以有效地同化各种观测数据,并利用四维变分(4DVar)知识来保持物理平衡约束,从而提高预报精度。这种设计旨在创建一个完全独立于NWP系统的AI驱动天气预报系统。

技术框架:XiChen的整体框架包括以下几个主要阶段:1) 预训练一个天气预报基础模型;2) 对基础模型进行微调,使其能够作为观测算子和数据同化模型;3) 利用四维变分(4DVar)知识进行数据同化,保持物理平衡约束;4) 进行中程天气预报。整个流程可以在15秒内完成。

关键创新:XiChen最重要的技术创新在于其能够可扩展地同化各种观测数据,包括传统观测数据和原始卫星观测数据。此外,通过集成四维变分(4DVar)知识,XiChen能够在数据同化过程中保持物理平衡约束,从而使观测变量能够有效地校正未观测变量。这与传统的AI天气预报模型依赖于NWP系统提供的初始条件形成了鲜明对比。

关键设计:论文中没有详细说明具体的网络结构和损失函数等技术细节,但强调了预训练基础模型的重要性,以及如何通过微调使其适应不同的任务。四维变分(4DVar)知识的集成是另一个关键设计,它确保了数据同化过程中的物理一致性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

XiChen实现了与业务NWP系统相当的数据同化和中程预报精度,其有效预报提前期超过8.75天。在单点扰动数据同化实验中,XiChen表现出与传统4DVar系统相似的流动依赖特性。整个流程仅需15秒即可完成,显著提高了预报效率。

🎯 应用场景

XiChen的潜在应用领域包括:快速天气预报、极端天气事件预警、气候变化研究等。该研究的实际价值在于降低天气预报的计算成本,提高预报效率,并为发展完全AI驱动的天气预报系统奠定基础。未来,XiChen有望应用于更广泛的气象服务领域,例如农业、交通运输和能源管理。

📄 摘要(原文)

Artificial intelligence (AI)-driven models have the potential to revolutionize weather forecasting, but still rely on initial conditions generated by costly Numerical Weather Prediction (NWP) systems. Although recent end-to-end forecasting models attempt to bypass NWP systems, these methods lack scalable assimilation of new types of observational data. Here, we introduce XiChen, an observation-scalable fully AI-driven global weather forecasting system, wherein the entire pipeline, from Data Assimilation (DA) to medium-range forecasting, can be accomplished within only 15 seconds. XiChen is built upon a foundation model that is pre-trained for weather forecasting and subsequently fine-tuned to serve as both observation operators and DA models, thereby enabling the scalable assimilation of conventional and raw satellite observations. Furthermore, the integration of Four-Dimensional Variational (4DVar) knowledge ensures XiChen to achieve DA and medium-range forecasting accuracy comparable to operational NWP systems, with skillful forecasting lead time beyond 8.75 days. A key feature of XiChen is its ability to maintain physical balance constraints during DA, enabling observed variables to correct unobserved ones effectively. In single-point perturbation DA experiments, XiChen exhibits flow-dependent characteristics similar to those of traditional 4DVar systems. These results demonstrate that XiChen holds strong potential for fully AI-driven weather forecasting independent of NWP systems.