Learning Transient Convective Heat Transfer with Geometry Aware World Models
作者: Onur T. Doganay, Alexander Klawonn, Martin Eigel, Hanno Gottschalk
分类: physics.flu-dyn, cs.CV
发布日期: 2026-01-29
备注: 36 pages, 18 figures, 2 tables
💡 一句话要点
提出几何感知世界模型,用于学习瞬态对流换热过程
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 世界模型 生成对抗网络 计算流体动力学 瞬态模拟 几何感知
📋 核心要点
- 传统PDE模拟计算成本高昂,难以满足实时应用需求,而标准视频生成模型缺乏对物理过程的精确控制。
- 论文提出一种几何感知世界模型,通过双重条件机制和通道维度适配,学习瞬态物理现象。
- 实验表明,该模型能有效重现复杂时空动态,并在一定程度上泛化到新的几何构型,但空间精度仍有提升空间。
📝 摘要(中文)
偏微分方程(PDE)模拟是工程和物理学的基础,但对于实时应用而言,其计算成本往往过高。生成式AI为替代建模提供了一条有希望的途径,但标准视频生成架构缺乏物理模拟所需的特定控制和数据兼容性。本文提出了一种几何感知世界模型架构,该架构源自视频生成架构(LongVideoGAN),旨在学习瞬态物理现象。我们引入了两个关键的架构元素:(1)一种结合全局物理参数和局部几何掩码的双重条件机制,以及(2)一种支持任意通道维度的架构适配,超越了标准RGB约束。我们在一个二维瞬态计算流体动力学(CFD)问题上评估了这种方法,该问题涉及由浮力驱动的流动引起的对流换热,并耦合到固体结构中的热流。我们证明了该条件模型成功地再现了训练数据的复杂时间动态和空间相关性。此外,我们评估了该模型在未见过的几何配置上的泛化能力,突出了其在受控模拟合成方面的潜力以及当前在分布外样本的空间精度方面的局限性。
🔬 方法详解
问题定义:论文旨在解决瞬态对流换热过程的快速模拟问题。传统的CFD模拟计算量大,耗时久,难以满足实时性要求。现有的视频生成模型虽然可以生成视频,但缺乏对物理参数的控制,并且通常只适用于RGB图像,无法直接应用于多通道的物理场数据。
核心思路:论文的核心思路是利用生成式对抗网络(GAN)学习瞬态物理过程的动态演化规律,并引入几何信息作为条件,从而实现对模拟过程的精确控制。通过将物理参数和几何形状作为条件输入,模型可以生成具有特定物理属性和几何形状的模拟结果。
技术框架:该模型基于LongVideoGAN架构,并进行了改进。整体架构包括生成器和判别器。生成器负责根据输入的物理参数和几何掩码生成模拟结果,判别器负责判断生成结果的真伪。模型训练过程中,生成器不断学习生成更逼真的模拟结果,判别器不断提高辨别真伪的能力。
关键创新:论文的关键创新在于引入了几何感知的条件机制和通道维度适配。几何感知的条件机制允许模型根据不同的几何形状生成不同的模拟结果,从而提高了模型的泛化能力。通道维度适配使得模型可以处理多通道的物理场数据,而不仅仅是RGB图像。
关键设计:模型使用了双重条件机制,包括全局物理参数和局部几何掩码。全局物理参数用于控制模拟过程的整体物理属性,局部几何掩码用于控制模拟结果的局部形状。模型还使用了自适应通道归一化(Adaptive Channel Normalization)来处理不同通道的数据。损失函数包括对抗损失、L1损失和感知损失,用于提高生成结果的真实性和视觉质量。
🖼️ 关键图片
📊 实验亮点
该模型在二维瞬态对流换热问题上取得了良好的效果,能够成功地再现训练数据的复杂时空动态。实验表明,该模型在未见过的几何配置上具有一定的泛化能力,但空间精度仍有提升空间。该模型为基于AI的物理模拟提供了一种新的思路。
🎯 应用场景
该研究成果可应用于工程设计、实时控制、虚拟现实等领域。例如,在工程设计中,可以利用该模型快速评估不同设计方案的性能,从而缩短设计周期。在实时控制中,可以利用该模型预测系统的未来状态,从而实现更精确的控制。在虚拟现实中,可以利用该模型生成逼真的物理模拟效果,从而提高用户体验。
📄 摘要(原文)
Partial differential equation (PDE) simulations are fundamental to engineering and physics but are often computationally prohibitive for real-time applications. While generative AI offers a promising avenue for surrogate modeling, standard video generation architectures lack the specific control and data compatibility required for physical simulations. This paper introduces a geometry aware world model architecture, derived from a video generation architecture (LongVideoGAN), designed to learn transient physics. We introduce two key architecture elements: (1) a twofold conditioning mechanism incorporating global physical parameters and local geometric masks, and (2) an architectural adaptation to support arbitrary channel dimensions, moving beyond standard RGB constraints. We evaluate this approach on a 2D transient computational fluid dynamics (CFD) problem involving convective heat transfer from buoyancy-driven flow coupled to a heat flow in a solid structure. We demonstrate that the conditioned model successfully reproduces complex temporal dynamics and spatial correlations of the training data. Furthermore, we assess the model's generalization capabilities on unseen geometric configurations, highlighting both its potential for controlled simulation synthesis and current limitations in spatial precision for out-of-distribution samples.