Lagrangian Flow Matching: A Least-Action Framework for Principled Path Design

📄 arXiv: 2605.15419v1 📥 PDF

作者: Shukai Du, Junzhe Zhang, Yiming Li

分类: cs.LG

发布日期: 2026-05-14


💡 一句话要点

Lagrangian Flow Matching:基于最小作用量原理的概率路径设计

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: Flow Matching 生成模型 最优传输 拉格朗日量 最小作用量原理

📋 核心要点

  1. 现有Flow Matching方法依赖直线路径,限制了模型表达复杂动力学的能力。
  2. Lagrangian Flow Matching通过最小化拉格朗日作用量来设计概率路径和速度场。
  3. 实验表明,该方法能学习到更有意义的动力学,并保持与现有方法相当的性能。

📝 摘要(中文)

Flow Matching通过回归一个与预设概率路径相关的目标速度场来训练神经速度场,该路径连接一个简单的初始分布到数据分布。路径本身是一个核心设计选择。现有的构造方法,包括rectified和基于最优传输的路径,沿着耦合端点之间的直线传输样本,因此仅覆盖了狭窄的动力学类别。我们观察到,这对应于经典力学中最小作用量原理的最简单情况,其中动能拉格朗日量产生自由粒子的直线轨迹。基于此,我们提出了Lagrangian Flow Matching,这是一个基于物理的框架,其中概率路径和速度场通过最小化一般拉格朗日量的作用量来确定,同时满足连续性方程和预设的端点。我们证明了这个动态问题允许一个等价的静态最优传输(OT)公式,产生了一系列无模拟的训练目标,这些目标将基于OT的Flow Matching恢复为动能特殊情况,并将三角方差保持扩散路径恢复为谐振子情况。更一般的拉格朗日量会产生新的概率路径和速度场,数值实验表明,它们会在学习到的动力学中引起有意义的变化,同时保持与现有条件Flow Matching模型相当的竞争力。

🔬 方法详解

问题定义:现有的Flow Matching方法通常采用直线路径连接初始分布和数据分布,这种简单的路径选择限制了模型学习复杂动力学的能力。例如,基于最优传输的Flow Matching虽然性能良好,但其直线路径本质上是自由粒子的运动轨迹,无法捕捉更丰富的动力学行为。因此,如何设计更灵活、更具表达能力的概率路径是Flow Matching面临的关键问题。

核心思路:论文的核心思路是将概率路径的设计问题转化为一个基于最小作用量原理的物理问题。具体来说,通过引入拉格朗日量的概念,将路径的选择与系统的能量函数联系起来。通过最小化拉格朗日作用量,可以得到满足连续性方程和预设端点约束的最优概率路径和速度场。这种方法借鉴了经典力学的思想,将路径设计问题置于一个更广阔的物理框架下。

技术框架:Lagrangian Flow Matching的整体框架包括以下几个主要步骤:1. 定义一个通用的拉格朗日量,该拉格朗日量描述了系统在状态空间中的能量函数。2. 最小化拉格朗日作用量,同时满足连续性方程和预设的端点约束。这个过程可以通过变分法求解,得到最优的概率路径和速度场。3. 将得到的概率路径和速度场用于训练神经速度场,使其能够准确地预测样本在路径上的运动轨迹。4. 通过等价的静态最优传输(OT)公式,推导出无模拟的训练目标,避免了复杂的动力学模拟过程。

关键创新:该论文最重要的技术创新在于将概率路径的设计问题与经典力学中的最小作用量原理联系起来。通过引入拉格朗日量的概念,可以将路径的选择与系统的能量函数联系起来,从而设计出更灵活、更具表达能力的概率路径。与现有方法相比,Lagrangian Flow Matching不再局限于直线路径,而是可以根据不同的拉格朗日量生成各种复杂的路径,从而更好地捕捉数据分布的内在结构。

关键设计:论文的关键设计包括:1. 拉格朗日量的选择:不同的拉格朗日量对应不同的动力学行为。例如,动能拉格朗日量对应自由粒子运动,谐振子拉格朗日量对应简谐运动。2. 静态最优传输公式的推导:通过将动态问题转化为静态最优传输问题,可以避免复杂的动力学模拟过程,从而提高训练效率。3. 损失函数的设计:论文设计了一系列无模拟的训练目标,这些目标基于最优传输理论,可以直接用于训练神经速度场。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,Lagrangian Flow Matching能够学习到更有意义的动力学,并且在生成建模任务上取得了与现有条件Flow Matching模型相当的性能。例如,通过选择合适的拉格朗日量,该方法可以生成具有特定运动模式的图像序列。此外,实验还验证了该方法在不同数据集上的泛化能力。

🎯 应用场景

Lagrangian Flow Matching具有广泛的应用前景,例如生成建模、图像编辑、视频预测等。通过学习更具表达能力的概率路径,该方法可以生成更高质量、更逼真的图像和视频。此外,该方法还可以用于解决逆问题,例如从观测数据中推断系统的动力学模型。未来,该方法有望应用于机器人控制、药物发现等领域。

📄 摘要(原文)

Flow matching trains a neural velocity field by regression against a target velocity associated with a prescribed probability path connecting a simple initial distribution to the data distribution. A central design choice is the path itself. Existing constructions, including rectified and optimal-transport-based paths, transport samples along straight lines between coupled endpoints and thus cover only a narrow class of dynamics. We observe that this corresponds to the simplest case of the least-action principle in classical mechanics, in which the kinetic Lagrangian yields free-particle straight-line trajectories. Building on this observation, we propose Lagrangian flow matching, a physics-based framework in which the probability path and velocity field are determined by minimizing the action of a general Lagrangian subject to the continuity equation and the prescribed endpoints. We show that this dynamic problem admits an equivalent static optimal transport (OT) formulation, yielding a family of simulation-free training objectives that recover OT-based flow matching as the kinetic special case and the trigonometric variance-preserving diffusion path as the harmonic-oscillator case. More general Lagrangians give rise to new probability paths and velocity fields, and numerical experiments show that they induce meaningful changes in the learned dynamics while remaining competitive with existing conditional flow matching models.