Conditional Variable Flow Matching: Transforming Conditional Densities with Amortized Conditional Optimal Transport

📄 arXiv: 2411.08314v4 📥 PDF

作者: Adam P. Generale, Andreas E. Robertson, Surya R. Kalidindi

分类: cs.LG

发布日期: 2024-11-13 (更新: 2025-04-01)


💡 一句话要点

提出条件变量流匹配(CVFM),用于学习条件分布的变换,解决条件随机动力系统预测问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 条件变量流匹配 条件分布变换 最优传输 条件随机动力系统 流模型

📋 核心要点

  1. 现有基于流的模型在预测条件随机动力系统时,难以有效处理条件变量的影响,且依赖配对数据和离散条件变量。
  2. CVFM通过学习条件流来转换条件分布,利用样本条件流、条件Wasserstein距离和损失重加权核实现条件最优传输。
  3. 实验表明,CVFM在离散/连续条件映射、图像域迁移和材料演化建模等任务上,性能和收敛性均优于现有方法。

📝 摘要(中文)

预测条件随机非线性动力系统是生物和物理科学中反复遇到的一个基本挑战。虽然基于流的模型在预测代表特定过程可能结果的概率分布的时间演化方面表现出色,但现有框架无法令人满意地解释条件变量对这些动力学的影响。现有方法存在诸多限制,例如需要配对条件的训练数据,并且是为离散条件变量开发的。我们提出了条件变量流匹配(CVFM),这是一个用于学习流的框架,该框架通过跨连续条件变量的摊销来转换条件分布,从而允许跨条件密度流形的预测。这是通过几项新颖的进展实现的。特别是,同时对主要变量和条件变量进行样本条件流,以及条件Wasserstein距离与损失重加权核相结合,从而促进条件最优传输。总的来说,这些进展允许在提供状态和条件变量不对应的测量数据的情况下学习系统动力学。我们在一系列日益具有挑战性的问题上演示了CVFM,包括离散和连续条件映射基准、图像到图像的域转移以及制造过程中材料内部结构的时间演化建模。我们观察到,与替代条件变体相比,CVFM 产生了改进的性能和收敛特性。

🔬 方法详解

问题定义:论文旨在解决条件随机非线性动力系统的预测问题,特别是现有方法在处理条件变量时的不足。现有方法通常需要配对的条件数据进行训练,并且主要针对离散的条件变量,难以泛化到连续条件变量的情况。此外,现有方法难以学习条件变量对系统动力学的复杂影响。

核心思路:论文的核心思路是利用条件变量流匹配(CVFM)学习一个流,该流能够将一个简单的先验分布转换成目标条件分布。通过在主要变量和条件变量上同时进行样本条件流,并结合条件Wasserstein距离和损失重加权核,实现条件最优传输,从而学习到条件变量对系统动力学的影响。

技术框架:CVFM的整体框架包含以下几个主要模块:1) 条件流网络:用于学习从先验分布到目标条件分布的映射。该网络以主要变量和条件变量作为输入,输出一个流的参数。2) 样本条件流:同时对主要变量和条件变量进行采样,并利用条件流网络计算它们的演化。3) 条件Wasserstein距离:用于衡量预测的条件分布与真实条件分布之间的差异。4) 损失重加权核:用于调整不同样本的损失权重,从而更好地学习条件变量的影响。

关键创新:CVFM的关键创新在于以下几个方面:1) 同时处理主要变量和条件变量的流:通过同时对两者进行建模,能够更好地捕捉它们之间的依赖关系。2) 条件Wasserstein距离:能够更准确地衡量条件分布之间的差异,从而提高学习的准确性。3) 损失重加权核:能够根据条件变量的重要性调整损失权重,从而更好地学习条件变量的影响。

关键设计:在具体实现上,CVFM使用了以下关键设计:1) 条件流网络结构:可以使用各种流模型,如RealNVP、Glow等。2) 损失函数:使用了条件Wasserstein距离作为主要的损失函数,并结合了损失重加权核。3) 训练策略:采用了端到端的训练方式,同时优化条件流网络的参数和损失重加权核的参数。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CVFM在离散和连续条件映射基准测试、图像到图像的域转移以及材料内部结构的时间演化建模等任务上进行了评估。实验结果表明,CVFM在性能和收敛性方面均优于现有的条件变分自编码器(CVAE)等方法。例如,在图像域迁移任务中,CVFM生成的图像质量更高,与目标域的分布更接近。

🎯 应用场景

CVFM在多个领域具有广泛的应用前景,包括:1) 预测生物和物理系统中条件随机动力系统的演化;2) 图像到图像的域转移,例如根据文本描述生成图像;3) 材料制造过程建模,预测材料内部结构随时间的变化;4) 金融市场预测,根据宏观经济指标预测股票价格。

📄 摘要(原文)

Forecasting conditional stochastic nonlinear dynamical systems is a fundamental challenge repeatedly encountered across the biological and physical sciences. While flow-based models can impressively predict the temporal evolution of probability distributions representing possible outcomes of a specific process, existing frameworks cannot satisfactorily account for the impact of conditioning variables on these dynamics. Amongst several limitations, existing methods require training data with paired conditions and are developed for discrete conditioning variables. We propose Conditional Variable Flow Matching (CVFM), a framework for learning flows transforming conditional distributions with amortization across continuous conditioning variables - permitting predictions across the conditional density manifold. This is accomplished through several novel advances. In particular, simultaneous sample conditioned flows over the main and conditioning variables, alongside a conditional Wasserstein distance combined with a loss reweighting kernel facilitating conditional optimal transport. Collectively, these advances allow for learning system dynamics provided measurement data whose states and conditioning variables are not in correspondence. We demonstrate CVFM on a suite of increasingly challenging problems, including discrete and continuous conditional mapping benchmarks, image-to-image domain transfer, and modeling the temporal evolution of materials internal structure during manufacturing processes. We observe that CVFM results in improved performance and convergence characteristics over alternative conditional variants.