The Dynamic-Probabilistic Consistency Gap in Chaotic Surrogate Modeling
作者: Andre Herz, Matthijs Pals, Daniel Durstewitz, Georgia Koppe
分类: cs.LG, math.DS, stat.ML
发布日期: 2026-05-29
💡 一句话要点
提出KAFFEE框架,解决混沌系统代理模型中动态-概率一致性差距问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 混沌系统建模 动态系统重构 扩展卡尔曼滤波 不确定性估计 代理模型 动态-概率一致性 Lorenz-96系统
📋 核心要点
- 现有动态系统重构方法在追求有限范围概率目标时,可能导致动力学性能下降,预测不确定性与实际动力学解耦。
- KAFFEE框架基于可微扩展卡尔曼滤波,通过评估局部预测残差的可能性并传递协方差,缓解动态-概率一致性差距。
- 实验表明,KAFFEE在混沌系统上减少了失效模式,改进了动态不变量重构,并保持了良好的预测性能,同时能应用于DSR基础模型。
📝 摘要(中文)
动态系统重构(DSR)旨在学习能够捕捉时间序列数据底层动力学的代理模型。可靠地部署这些代理模型需要与学习到的动力学一致的不确定性估计。本文揭示了一个动态-概率一致性(DPC)差距:对有限范围概率目标的追求会降低动力学性能,或将预测不确定性与它应该反映的局部切线动力学解耦。我们分离出该差距背后的三种机制:核心坍塌、噪声掩蔽和盲不确定性。具体而言,我们表明,开环高斯展开目标会惩罚混沌系统中雅可比矩阵生成的协方差增长,从而鼓励削弱物理扩展或将其不确定性解耦的优化捷径。为了缓解这一差距,我们提出了KAFFEE(Kalman-Aware Framework For Ergodic Emulation),这是一个基于可微扩展卡尔曼滤波的训练框架,它评估局部预测残差(创新)的可能性,同时通过学习到的局部雅可比矩阵传递协方差。在随机超混沌Lorenz-96系统上,KAFFEE减少了已识别的失效模式,改进了相对于开环目标的动态不变量的重构,并保持了有竞争力的预测分数。我们进一步表明,当在13个混沌系统中概率性地调整DSR基础模型时,DPC差距会出现,其中KAFFEE能够在很大程度上保留零样本动力学的同时,实现上下文贝叶斯滤波。
🔬 方法详解
问题定义:论文旨在解决混沌系统代理模型中存在的动态-概率一致性(DPC)差距问题。现有方法,特别是基于开环高斯展开目标的方法,在优化过程中会为了追求短期预测精度而牺牲长期动力学特性,导致模型无法准确反映系统的不确定性演化,出现核心坍塌、噪声掩蔽和盲不确定性等问题。
核心思路:论文的核心思路是利用扩展卡尔曼滤波(EKF)来显式地建模和传递系统状态的协方差信息。通过将EKF嵌入到训练框架中,模型可以学习到与局部雅可比矩阵相关的协方差增长,从而更好地捕捉混沌系统的动力学特性和不确定性。这种方法避免了直接惩罚协方差增长,而是鼓励模型学习真实的动力学演化。
技术框架:KAFFEE框架主要包含以下几个阶段:1) 使用神经网络学习系统的状态转移函数和观测函数;2) 在训练过程中,使用扩展卡尔曼滤波来估计系统状态和协方差;3) 基于EKF的预测残差(创新)计算似然函数,作为训练的损失函数;4) 通过反向传播优化神经网络的参数,使得模型能够更好地捕捉系统的动力学特性。
关键创新:KAFFEE的关键创新在于将扩展卡尔曼滤波与神经网络训练相结合,从而实现了对混沌系统动力学和不确定性的联合建模。与传统的开环训练方法相比,KAFFEE能够更好地保持动态-概率一致性,避免了因追求短期预测精度而牺牲长期动力学特性的问题。
关键设计:KAFFEE的关键设计包括:1) 使用可微的扩展卡尔曼滤波,以便能够通过反向传播优化神经网络的参数;2) 基于预测残差(创新)计算似然函数,从而鼓励模型学习准确的局部动力学;3) 通过学习局部雅可比矩阵来传递协方差信息,从而更好地捕捉混沌系统的动力学特性;4) 损失函数的设计需要平衡预测精度和动态一致性,避免模型陷入局部最优。
🖼️ 关键图片
📊 实验亮点
在随机超混沌Lorenz-96系统上的实验表明,KAFFEE框架能够有效减少核心坍塌、噪声掩蔽和盲不确定性等问题,显著改进动态不变量的重构,并保持与开环目标相当甚至更优的预测性能。此外,在13个混沌系统上的实验表明,KAFFEE能够在很大程度上保留零样本动力学的同时,实现上下文贝叶斯滤波。
🎯 应用场景
该研究成果可应用于各种需要对混沌系统进行建模和预测的领域,例如气候预测、金融建模、机器人控制等。通过提高代理模型的精度和可靠性,可以更好地理解和控制这些复杂系统,从而做出更明智的决策。此外,该方法还可以用于对现有动态系统重构基础模型进行微调,提升其在特定任务上的性能。
📄 摘要(原文)
Dynamical systems reconstruction (DSR) aims to learn surrogate models that capture the dynamics underlying time-series data. Reliably deploying these surrogates requires uncertainty estimates consistent with the learned dynamics. We expose a dynamic-probabilistic consistency (DPC) gap: the pursuit of finite-horizon probabilistic objectives can degrade dynamics or decouple predictive uncertainty from the local tangent dynamics it ought to reflect. We isolate three mechanisms behind this gap: core collapse, noise masking, and blind uncertainty. Specifically, we show that open-loop Gaussian rollout objectives can penalize Jacobian-generated covariance growth in chaotic systems, encouraging optimization shortcuts that weaken physical expansion or decouple uncertainty from it. To mitigate this gap, we propose KAFFEE (Kalman-Aware Framework For Ergodic Emulation), a differentiable extended Kalman filter-based training framework that evaluates likelihood on local predictive residuals (innovations) while transporting covariance through learned local Jacobians. On stochastic hyperchaotic Lorenz-96, KAFFEE reduces the identified failure modes, improves reconstruction of dynamical invariants relative to open-loop objectives, and maintains competitive predictive scores. We further show that the DPC gap appears when probabilistically adapting a DSR foundation model across 13 chaotic systems, where KAFFEE enables in-context Bayesian filtering while largely preserving zero-shot dynamics.