Adaptive Diffusion Posterior Sampling for Data and Model Fusion of Complex Nonlinear Dynamical Systems
作者: Dibyajyoti Chakraborty, Hojin Kim, Romit Maulik
分类: cs.LG, nlin.CD, physics.flu-dyn
发布日期: 2026-03-13
💡 一句话要点
提出自适应扩散后验采样方法,用于复杂非线性动力系统的数据与模型融合。
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 扩散模型 代理模型 数据同化 非线性动力系统 湍流预测 自适应传感器 图Transformer 后验采样
📋 核心要点
- 高维混沌非线性动力系统的高精度数值模拟计算成本高昂,需要开发高效的代理模型。
- 论文提出一种基于扩散模型的概率代理建模方法,通过多步自回归训练和图Transformer架构,提升了长期预测的稳定性和几何适应性。
- 该框架能够预测最佳传感器位置,并利用扩散后验采样将传感器数据融入模型,在湍流预测和数据同化中表现出优越性能。
📝 摘要(中文)
本文提出了一种基于生成式机器学习的代理建模方法,利用深度学习扩散模型对湍流进行长期概率预测。引入多步自回归扩散目标,显著增强了长程预测的稳定性。针对复杂非结构化几何,采用结合扩散预处理和体素网格池化的多尺度图Transformer架构。该框架还提供了一个统一平台,通过不确定性估计或误差估计模块,预测时空上重要的传感器放置位置。最后,利用扩散后验采样同化这些动态变化的传感器位置的真实状态观测,无需重新训练代理模型。该方法在二维均匀各向同性湍流和后向阶梯流动中进行了验证,展示了其在预测、自适应传感器放置和高维混沌系统数据同化中的有效性。
🔬 方法详解
问题定义:现有的混沌、高维非线性动力系统的代理模型,特别是基于神经网络算子的确定性模型,难以捕捉系统内在的分布不确定性。此外,如何有效地融合来自不同来源(例如传感器)的数据,进一步提高预测精度,也是一个挑战。
核心思路:论文的核心思路是利用扩散模型强大的生成能力,构建一个能够预测湍流等复杂系统概率分布的代理模型。通过扩散后验采样,可以将观测数据(例如来自传感器的测量值)融入到模型的预测中,从而实现数据同化,提高预测精度。这种方法无需重新训练代理模型,具有很高的灵活性。
技术框架:整体框架包含三个主要模块:1) 基于扩散模型的代理模型训练,使用多步自回归扩散目标来提高长期预测的稳定性;2) 自适应传感器放置,通过不确定性估计或误差估计模块预测时空上重要的传感器位置;3) 扩散后验采样,将传感器观测数据同化到代理模型的预测中。对于复杂几何形状,采用多尺度图Transformer架构,并结合扩散预处理和体素网格池化。
关键创新:最重要的创新点在于将扩散模型应用于复杂非线性动力系统的代理建模和数据同化。传统方法通常依赖于确定性模型或需要重新训练模型才能进行数据同化。该方法通过扩散后验采样,实现了在无需重新训练的情况下,将观测数据融入到模型的预测中,具有很高的效率和灵活性。此外,自适应传感器放置模块也提高了数据同化的效率。
关键设计:多步自回归扩散目标函数的设计是关键,它通过在多个时间步上进行训练,显著提高了长期预测的稳定性。多尺度图Transformer架构结合扩散预处理和体素网格池化,能够有效地处理复杂非结构化几何形状。扩散后验采样利用贝叶斯公式,将先验(扩散模型的预测)和似然(观测数据)结合起来,得到后验分布,从而实现数据同化。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在二维均匀各向同性湍流和后向阶梯流动中均取得了良好的预测效果。多步自回归扩散目标显著提高了长期预测的稳定性。自适应传感器放置模块能够有效地选择重要的传感器位置,提高数据同化的效率。与传统方法相比,该方法在预测精度和数据同化效率方面均有显著提升。
🎯 应用场景
该研究成果可应用于航空航天、能源、环境等领域,例如飞行器气动性能预测、风力发电场优化、气候变化模拟等。通过结合数值模拟和传感器数据,可以更准确地预测复杂系统的行为,为工程设计和决策提供支持。未来,该方法有望扩展到更广泛的科学和工程领域。
📄 摘要(原文)
High-fidelity numerical simulations of chaotic, high dimensional nonlinear dynamical systems are computationally expensive, necessitating the development of efficient surrogate models. Most surrogate models for such systems are deterministic, for example when neural operators are involved. However, deterministic models often fail to capture the intrinsic distributional uncertainty of chaotic systems. This work presents a surrogate modeling formulation that leverages generative machine learning, where a deep learning diffusion model is used to probabilistically forecast turbulent flows over long horizons. We introduce a multi-step autoregressive diffusion objective that significantly enhances long-rollout stability compared to standard single-step training. To handle complex, unstructured geometries, we utilize a multi-scale graph transformer architecture incorporating diffusion preconditioning and voxel-grid pooling. More importantly, our modeling framework provides a unified platform that also predicts spatiotemporally important locations for sensor placement, either via uncertainty estimates or through an error-estimation module. Finally, the observations of the ground truth state at these dynamically varying sensor locations are assimilated using diffusion posterior sampling requiring no retraining of the surrogate model. We present our methodology on two-dimensional homogeneous and isotropic turbulence and for a flow over a backwards-facing step, demonstrating its utility in forecasting, adaptive sensor placement, and data assimilation for high dimensional chaotic systems.