Bridging Idealized and Operational Models: An Explainable AI Framework for Earth System Emulators

📄 arXiv: 2510.13030v1 📥 PDF

作者: Pouria Behnoudfar, Charlotte Moser, Marc Bocquet, Sibo Cheng, Nan Chen

分类: cs.LG

发布日期: 2025-10-14


💡 一句话要点

提出基于可解释AI的地球系统模拟器框架,融合理想化模型与运行模型优势

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 地球系统模型 可解释AI 数据同化 模型融合 厄尔尼诺 气候预测 数字孪生

📋 核心要点

  1. 现有高分辨率地球系统运行模型在模拟极端事件和统计分布方面存在偏差,而理想化模型虽然精确但较为孤立。
  2. 论文提出一种基于可解释AI的框架,通过潜在数据同化技术桥接不同复杂度的模型,融合各自优势。
  3. 实验表明,该框架能有效纠正CMIP6模型对厄尔尼诺现象的模拟偏差,提升全局精度,并提供物理上的可解释性。

📝 摘要(中文)

计算机模型是理解地球系统不可或缺的工具。高分辨率运行模型虽然取得了许多成功,但在模拟极端事件和统计分布方面仍存在偏差。相比之下,粗粒度的理想化模型能够隔离基本过程,并经过精确校准,擅长表征特定的动力学和统计特征。然而,不同模型由于学科界限仍然相互孤立。本文利用不同复杂程度模型的互补优势,开发了一个用于地球系统模拟器的可解释AI框架。该框架通过重新配置的潜在数据同化技术桥接模型层级,特别适用于利用来自理想化模型的稀疏输出。由此产生的桥接模型继承了运行模型的高分辨率和全面的变量,同时通过理想化模型的针对性改进实现了全局精度的提升。重要的是,AI的机制为这些改进提供了清晰的理由,超越了黑盒校正,实现了对物理上有深刻见解的理解,并在计算高效的框架中实现了有效的物理辅助数字孪生和不确定性量化。我们通过显著纠正CMIP6对厄尔尼诺时空模式的模拟偏差,利用统计上准确的理想化模型,证明了其强大之处。这项工作还强调了推动理想化模型开发和加强建模社区之间沟通的重要性。

🔬 方法详解

问题定义:论文旨在解决地球系统模型中,高分辨率运行模型存在偏差,而理想化模型又过于孤立的问题。现有方法难以有效融合两种模型的优势,导致模拟精度受限,且缺乏物理可解释性。

核心思路:核心思路是利用可解释AI框架,通过数据同化技术,将理想化模型的优势融入到高分辨率运行模型中。这样既能保持运行模型的分辨率和变量完整性,又能利用理想化模型对特定过程的精确刻画,从而提高整体模拟精度和可解释性。

技术框架:整体框架包含以下几个主要阶段:1) 准备阶段:收集高分辨率运行模型和理想化模型的输出数据。2) 潜在空间映射:利用数据同化技术,将理想化模型的稀疏输出映射到高分辨率运行模型的潜在空间。3) 模型融合:将映射后的理想化模型信息融入到运行模型中,构建桥接模型。4) 评估与解释:评估桥接模型的性能,并利用AI技术解释改进的原因。

关键创新:关键创新在于利用可解释AI框架,实现了不同复杂程度地球系统模型的有效融合。传统的模型融合方法往往是黑盒的,缺乏物理可解释性。而该框架通过AI技术,能够清晰地解释理想化模型如何改进运行模型的偏差,从而提供更深入的物理理解。

关键设计:论文采用了一种重新配置的潜在数据同化技术,专门用于处理来自理想化模型的稀疏输出。具体的技术细节包括:选择合适的潜在空间表示方法,设计有效的损失函数来衡量模型之间的差异,以及采用适当的优化算法来训练桥接模型。此外,可解释AI模块的设计也至关重要,需要选择合适的解释方法,例如基于梯度的方法或基于扰动的方法,来分析模型改进的原因。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该框架能够显著纠正CMIP6模型对厄尔尼诺时空模式的模拟偏差。通过利用统计上准确的理想化模型,该框架在全局范围内提高了模拟精度,并提供了对改进原因的物理可解释性。具体的性能数据和提升幅度在论文中进行了详细展示。

🎯 应用场景

该研究成果可应用于地球系统模拟、气候预测、极端天气事件预警等领域。通过融合不同复杂度的模型,可以提高模拟精度和可信度,为决策者提供更可靠的科学依据。此外,该框架的可解释性有助于深入理解地球系统的复杂过程,促进相关学科的发展。

📄 摘要(原文)

Computer models are indispensable tools for understanding the Earth system. While high-resolution operational models have achieved many successes, they exhibit persistent biases, particularly in simulating extreme events and statistical distributions. In contrast, coarse-grained idealized models isolate fundamental processes and can be precisely calibrated to excel in characterizing specific dynamical and statistical features. However, different models remain siloed by disciplinary boundaries. By leveraging the complementary strengths of models of varying complexity, we develop an explainable AI framework for Earth system emulators. It bridges the model hierarchy through a reconfigured latent data assimilation technique, uniquely suited to exploit the sparse output from the idealized models. The resulting bridging model inherits the high resolution and comprehensive variables of operational models while achieving global accuracy enhancements through targeted improvements from idealized models. Crucially, the mechanism of AI provides a clear rationale for these advancements, moving beyond black-box correction to physically insightful understanding in a computationally efficient framework that enables effective physics-assisted digital twins and uncertainty quantification. We demonstrate its power by significantly correcting biases in CMIP6 simulations of El Niño spatiotemporal patterns, leveraging statistically accurate idealized models. This work also highlights the importance of pushing idealized model development and advancing communication between modeling communities.