LEVDA: Latent Ensemble Variational Data Assimilation via Differentiable Dynamics

📄 arXiv: 2602.19406v1 📥 PDF

作者: Phillip Si, Peng Chen

分类: cs.LG, math.OC

发布日期: 2026-02-23


💡 一句话要点

提出LEVDA,利用可微动力学在潜空间进行集合变分数据同化,提升地球物理预测精度。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 数据同化 变分方法 潜空间模型 可微动力学 地球物理预测

📋 核心要点

  1. 传统地球物理数据同化方法计算成本高,而潜空间滤波方法约束较弱,难以保证预测精度。
  2. LEVDA在预训练可微神经动力学模型的潜空间中进行集合变分优化,联合同化状态和参数。
  3. 实验表明,LEVDA在观测稀疏情况下优于现有潜空间滤波方法,并显著提升了计算效率。

📝 摘要(中文)

由于混沌动力学和数值误差的根本限制,长期地球物理预测面临挑战。数据同化可以缓解这些问题,但传统的变分平滑器需要计算成本高昂的切线性和伴随模型。相比之下,最近高效的潜空间滤波方法通常强制执行弱轨迹级约束,并假设固定的观测网格。为了弥合这一差距,我们提出了潜空间集合变分数据同化(LEVDA),这是一种在预训练的可微神经动力学代理模型的低维潜空间中运行的集合空间变分平滑器。通过在集合子空间内执行四维集合变分(4DEnVar)优化,LEVDA联合同化状态和未知参数,而无需伴随代码或辅助的观测到潜空间编码器。利用代理模型的完全可微和时空连续性,LEVDA自然地适应任意时空位置的高度不规则采样。在三个具有挑战性的地球物理基准测试中,LEVDA在严重的观测稀疏性下,匹配或优于最先进的潜空间滤波基线,同时提供更可靠的不确定性量化。同时,与全状态4DEnVar相比,它实现了显著提高的同化精度和计算效率。

🔬 方法详解

问题定义:地球物理长期预测受混沌动力学和数值误差影响,传统变分数据同化方法需要计算复杂的切线性和伴随模型,计算成本高昂。而现有的潜空间滤波方法通常采用弱约束,且假设观测网格固定,难以适应实际应用中不规则的观测数据,限制了预测精度。

核心思路:LEVDA的核心思路是在预训练的可微神经动力学模型的低维潜空间中进行数据同化。通过将高维状态映射到低维潜空间,降低了计算复杂度。同时,利用可微动力学模型,可以方便地计算梯度,从而进行变分优化。此外,在潜空间中进行集合变分(4DEnVar)优化,可以联合同化状态和未知参数,提高预测精度。

技术框架:LEVDA的整体框架包括以下几个主要步骤:1) 使用历史数据训练一个可微神经动力学模型,作为真实动力学过程的代理模型。2) 将观测数据投影到潜空间。3) 在潜空间中,使用集合变分(4DEnVar)方法,联合优化状态和未知参数,使得模型预测与观测数据尽可能一致。4) 将优化后的潜空间状态映射回原始状态空间,得到同化后的状态。

关键创新:LEVDA的关键创新在于:1) 将数据同化过程放在低维潜空间中进行,降低了计算复杂度。2) 利用可微神经动力学模型,避免了手动推导切线性和伴随模型,简化了计算过程。3) 采用集合变分方法,可以联合同化状态和未知参数,提高预测精度。4) 能够处理任意时空位置的不规则采样数据。

关键设计:LEVDA的关键设计包括:1) 可微神经动力学模型的选择,需要根据具体问题选择合适的网络结构和训练方法。2) 潜空间的维度选择,需要在计算复杂度和信息损失之间进行权衡。3) 集合变分方法的参数设置,例如集合大小、观测误差协方差等,需要根据具体问题进行调整。4) 损失函数的设计,需要考虑模型预测与观测数据之间的差异,以及正则化项,以避免过拟合。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在三个地球物理基准测试中,LEVDA在观测数据稀疏的情况下,性能与最先进的潜空间滤波方法相当甚至更好,同时提供了更可靠的不确定性量化。与全状态4DEnVar相比,LEVDA显著提高了同化精度和计算效率,验证了其在实际应用中的潜力。

🎯 应用场景

LEVDA可应用于各种地球物理预测场景,例如天气预报、海洋环流预测、气候变化模拟等。其高效性和高精度使其在资源有限的情况下也能进行准确的长期预测,为防灾减灾、资源管理和环境保护提供决策支持。未来,LEVDA有望扩展到其他科学和工程领域,例如生物系统建模、金融市场预测等。

📄 摘要(原文)

Long-range geophysical forecasts are fundamentally limited by chaotic dynamics and numerical errors. While data assimilation can mitigate these issues, classical variational smoothers require computationally expensive tangent-linear and adjoint models. Conversely, recent efficient latent filtering methods often enforce weak trajectory-level constraints and assume fixed observation grids. To bridge this gap, we propose Latent Ensemble Variational Data Assimilation (LEVDA), an ensemble-space variational smoother that operates in the low-dimensional latent space of a pretrained differentiable neural dynamics surrogate. By performing four-dimensional ensemble-variational (4DEnVar) optimization within an ensemble subspace, LEVDA jointly assimilates states and unknown parameters without the need for adjoint code or auxiliary observation-to-latent encoders. Leveraging the fully differentiable, continuous-in-time-and-space nature of the surrogate, LEVDA naturally accommodates highly irregular sampling at arbitrary spatiotemporal locations. Across three challenging geophysical benchmarks, LEVDA matches or outperforms state-of-the-art latent filtering baselines under severe observational sparsity while providing more reliable uncertainty quantification. Simultaneously, it achieves substantially improved assimilation accuracy and computational efficiency compared to full-state 4DEnVar.