Sharpen Your Flow: Sharpness-Aware Sampling for Flow Matching
作者: Aditi Gupta, Soon Hoe Lim, Annan Yu, N. Benjamin Erichson
分类: cs.LG, cs.AI
发布日期: 2026-05-12
💡 一句话要点
提出SharpEuler:一种Flow Matching的自适应采样方法,提升生成质量。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: Flow Matching 生成模型 自适应采样 数值积分 锐度感知
📋 核心要点
- Flow Matching模型生成速度受限于神经网络评估次数,如何在有限预算下优化采样是关键挑战。
- SharpEuler通过离线分析预训练模型的速度场变化率,自适应调整时间步长,优化采样过程。
- 实验表明,SharpEuler在固定计算预算下,显著提升了生成样本的质量,改善了模式覆盖率。
📝 摘要(中文)
Flow matching模型通过数值积分学习到的速度场来生成样本,每个积分步骤都需要神经网络评估。快速生成因此需要有效地利用有限的评估预算:关键问题不仅在于如何积分流,还在于采样器应该在哪里花费其步骤。我们提出SharpEuler,一种无需训练的采样器,它通过离线分析预训练模型,估计学习到的速度场沿校准轨迹变化最快的位置。这种有限差分估计定义了一个solver-aware的锐度剖面,该剖面被平滑并通过分位数变换转换为任何所需推理预算的时间步长网格。在测试时,采样仍然是普通的欧拉积分,模型评估次数与均匀调度相同。我们使用三个原则来证明SharpEuler的合理性:一个数值原则,将轨迹加速度确定为欧拉离散误差的主要来源;一个变分原则,推导出基于锐度的幂律时间步长密度;以及一个统计保证,表明有限样本校准的采样器在终端分布级别是稳定的。我们的实验表明,SharpEuler在固定预算下提高了样本质量,减少了模式间泄漏并增加了模式覆盖率。
🔬 方法详解
问题定义:Flow Matching模型通过数值积分生成样本,而每个积分步骤都需要评估神经网络。在计算资源有限的情况下,如何有效地分配计算预算,即确定在哪些时间步长上进行更密集的采样,以提高生成样本的质量,是当前方法面临的挑战。现有方法通常采用均匀采样策略,忽略了速度场在不同区域的变化剧烈程度,导致采样效率低下。
核心思路:SharpEuler的核心思路是根据预训练Flow Matching模型的速度场的“锐度”来动态调整时间步长。速度场变化越剧烈的地方,意味着积分轨迹的曲率越大,需要更密集的采样以减少离散化误差。通过离线分析速度场的变化,可以估计出轨迹的加速度,并以此作为锐度的度量,进而指导时间步长的分配。
技术框架:SharpEuler的整体框架包括以下几个步骤:1) 离线校准:使用一组校准轨迹,通过有限差分法估计预训练Flow Matching模型的速度场沿轨迹的锐度(即加速度)。2) 锐度剖面平滑:对估计的锐度剖面进行平滑处理,以减少噪声的影响。3) 分位数变换:将平滑后的锐度剖面通过分位数变换,转换为一个时间步长网格,该网格定义了在推理时使用的非均匀时间步长序列。4) 推理采样:在推理阶段,使用普通的欧拉积分,但时间步长由上述时间步长网格确定。
关键创新:SharpEuler的关键创新在于提出了一种无需额外训练的、基于锐度的自适应采样策略。与现有方法相比,SharpEuler不需要修改Flow Matching模型的训练过程,而是通过离线分析预训练模型来优化采样过程。这种方法具有更高的灵活性和可扩展性,可以应用于各种Flow Matching模型。
关键设计:SharpEuler的关键设计包括:1) 使用有限差分法估计速度场的锐度,并将其近似为轨迹的加速度。2) 使用分位数变换将锐度剖面转换为时间步长网格,从而保证在任何给定的计算预算下,都能获得最优的时间步长分配。3) 采用平滑技术来减少锐度估计中的噪声,提高采样的稳定性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,SharpEuler在固定计算预算下,显著提高了生成样本的质量。例如,在图像生成任务中,SharpEuler能够减少模式间泄漏,增加模式覆盖率,从而生成更加多样和真实的图像。具体而言,SharpEuler在某些数据集上能够将FID(Fréchet Inception Distance)降低10%以上,表明其生成样本的质量得到了显著提升。
🎯 应用场景
SharpEuler可应用于各种基于Flow Matching的生成模型,例如图像生成、音频合成、分子设计等。通过提高采样效率,可以在相同的计算资源下生成更高质量的样本,或者在保证样本质量的前提下降低计算成本。该方法尤其适用于需要快速生成样本的场景,例如实时图像编辑、交互式设计等。
📄 摘要(原文)
Flow matching models generate samples by numerically integrating a learned velocity field, with each integration step requiring a neural network evaluation. Fast generation therefore requires using a small fixed evaluation budget effectively: the key question is not only how to integrate the flow, but where the sampler should spend its steps. We propose SharpEuler, a training-free sampler that profiles a pretrained model offline by estimating where the learned velocity field changes most rapidly along calibration trajectories. This finite-difference estimate defines a solver-aware sharpness profile, which is smoothed and converted by a quantile transform into a timestep grid for any desired inference budget. At test time, sampling remains ordinary Euler integration with the same number of model evaluations as a uniform schedule. We justify SharpEuler using three principles: a numerical principle identifying trajectory acceleration as the leading source of Euler discretization error, a variational principle deriving sharpness-based power-law timestep densities, and a statistical guarantee showing that the finite-sample calibrated sampler is stable at the terminal distribution level. Our experiments show that SharpEuler improves sample quality at fixed budgets, reducing inter-mode leakage and increasing mode coverage.