On the Generalization in Topology Optimization via Sensitivity-Conditioned Bernoulli Flow Matching
作者: Mohammad Rashed, Duarte F. Valoroso Madeira, Babak Gholami, Caglar Guerbuez, Yunjia Yang, Nils Thuerey
分类: cs.LG, cs.AI, cs.CE
发布日期: 2026-06-01
备注: ICML Paper
🔗 代码/项目: PROJECT_PAGE
💡 一句话要点
提出基于敏感度条件的伯努利流匹配方法,提升拓扑优化中模型的泛化能力
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 拓扑优化 域外泛化 流匹配 敏感度分析 伪敏感度
📋 核心要点
- 现有拓扑优化代理模型在分布偏移下泛化能力不稳定,缺乏对变异性来源的理解。
- 论文核心思想是利用伴随敏感度作为信息论最优的条件信号,并引入伪敏感度概念。
- 实验表明,基于敏感度条件的伯努利流匹配生成器能显著提升域外泛化性能。
📝 摘要(中文)
拓扑优化(TO)的代理模型在分布偏移下,例如改变载荷或边界条件时,表现出高度可变的域外(OOD)泛化能力,但这种变异性的来源尚不清楚。我们假设OOD性能取决于条件信号保留了多少关于伴随敏感度(简化梯度)的信息,而伴随敏感度驱动着经典的TO。将TO流程建模为因果马尔可夫链,数据处理不等式表明,在这种抽象下,敏感度场是拓扑预测的信息论最优条件信号。然而,在实践中,计算精确的伴随敏感度可能很昂贵或不可用;我们观察到某些物理场可以通过单调变换来近似敏感度。为了形式化这一点,我们引入了 extbf{伪敏感度}来表征哪些场能够实现泛化,哪些场信息贫乏。然后,我们表明,一个敏感度条件下的伯努利流匹配生成器在经验上证实了这些预测:以敏感度为条件产生最先进的OOD性能,而越来越远的物理场则退化为原始参数条件。结果在载荷偏移下的结构TO基准和边界条件偏移下的新CFD-TO数据集(如多出口配置)中均成立。代码和数据集可在https://tum-pbs.github.io/topotransformer/ 获得。
🔬 方法详解
问题定义:拓扑优化中,代理模型在面对载荷或边界条件等分布偏移时,泛化能力显著下降且不稳定。现有方法难以有效利用物理场信息,导致模型在新的分布下性能不佳。计算精确伴随敏感度成本高昂,限制了其在实际应用中的可行性。
核心思路:论文的核心思路是将拓扑优化过程视为一个因果马尔可夫链,并利用数据处理不等式证明伴随敏感度是拓扑预测的信息论最优条件信号。通过引入“伪敏感度”的概念,量化不同物理场作为条件信号的有效性,从而指导模型设计。
技术框架:整体框架包括以下几个关键模块:1) 将拓扑优化流程建模为因果马尔可夫链;2) 定义伪敏感度,用于评估不同物理场的信息量;3) 构建基于敏感度条件下的伯努利流匹配生成器,用于拓扑预测;4) 在结构拓扑优化和CFD-TO数据集上进行实验验证。
关键创新:论文的关键创新在于:1) 提出了伪敏感度的概念,为选择合适的物理场作为条件信号提供了理论依据;2) 将流匹配模型与敏感度信息相结合,显著提升了拓扑优化模型的域外泛化能力;3) 构建了一个新的CFD-TO数据集,用于评估模型在边界条件偏移下的性能。
关键设计:论文使用伯努利流匹配模型作为生成器,该模型通过学习数据分布的连续变换来实现拓扑预测。关键设计包括:1) 使用伴随敏感度或伪敏感度作为条件信号,指导流匹配过程;2) 设计合适的网络结构,以有效提取敏感度信息并将其融入到生成过程中;3) 使用合适的损失函数,例如流匹配损失,来训练生成器。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于敏感度条件的伯努利流匹配生成器在结构TO基准测试中取得了最先进的OOD性能。在CFD-TO数据集上,该方法在边界条件偏移下也表现出优异的泛化能力,显著优于基于原始参数条件的方法。这些结果验证了敏感度信息对于提升拓扑优化模型泛化能力的重要性。
🎯 应用场景
该研究成果可应用于结构设计、流体动力学优化等领域,例如汽车、航空航天等工程领域。通过提升拓扑优化模型的泛化能力,可以降低设计成本,缩短设计周期,并获得更优的结构或流体设计方案。未来,该方法有望应用于更复杂的物理场耦合优化问题。
📄 摘要(原文)
Surrogate models for topology optimization (TO) exhibit highly variable out-of-distribution (OOD) generalization under distribution shifts such as changing loads or boundary conditions, yet the source of this variability remains unclear. We hypothesize that OOD performance is governed by how much information the conditioning signal preserves about the adjoint sensitivity (reduced gradient) that drives classical TO. Modeling the TO pipeline as a causal Markov chain, the Data Processing Inequality establishes that, under this abstraction, the sensitivity field is an information-theoretically optimal conditioning signal for topology prediction. However, computing exact adjoint sensitivities can be expensive or unavailable in practice; we observe that certain physical fields can approximate sensitivities through monotone transformations. To formalize this, we introduce \textbf{pseudo-sensitivities} to characterize which fields enable generalization versus those that are information-poor. We then show that a sensitivity-conditioned Bernoulli flow-matching generator empirically confirms these predictions: conditioning on sensitivities yields state-of-the-art OOD performance, while increasingly distant physical fields degrade toward raw parameter conditioning. Results hold across structural TO benchmarks under load shifts and our new CFD-TO dataset under boundary-condition shifts such as multi-outlet configurations. Code and datasets are available at https://tum-pbs.github.io/topotransformer/ .