Coupled Flow Matching

📄 arXiv: 2510.23015v1 📥 PDF

作者: Wenxi Cai, Yuheng Wang, Naichen Shi

分类: stat.ML, cs.LG

发布日期: 2025-10-27


💡 一句话要点

提出耦合流匹配(CPFM),实现可控降维和高保真重建。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 耦合流匹配 可控降维 高保真重建 Gromov-Wasserstein最优传输 双条件流匹配网络

📋 核心要点

  1. 传统降维方法在压缩过程中丢失的信息难以恢复,限制了其应用。
  2. CPFM通过学习耦合流,将残余信息保存在网络权重中,实现可控的信息保留与恢复。
  3. 实验表明,CPFM在语义嵌入和数据重建方面优于现有方法,具有更高的保真度。

📝 摘要(中文)

本文提出了一种名为耦合流匹配(CPFM)的框架,它集成了可控降维和高保真重建。CPFM学习高维数据x和低维嵌入y的耦合连续流,从而可以通过潜在空间流采样p(y|x),并通过数据空间流采样p(x|y)。与经典降维方法不同,CPFM将压缩过程中丢弃的信息保存在流网络的权重中,使得残余信息可以恢复。这种设计提供了定制化的可控性:用户可以决定在潜在空间中显式保留哪些语义因子,而互补信息仍然可以通过流网络恢复。耦合流匹配建立在两个组成部分之上:(i)扩展的Gromov-Wasserstein最优传输目标,它在数据和嵌入之间建立概率对应关系,以及(ii)双条件流匹配网络,它将对应关系外推到潜在空间。在多个基准测试上的实验表明,CPFM产生语义丰富的嵌入,并以比现有基线更高的保真度重建数据。

🔬 方法详解

问题定义:论文旨在解决高维数据降维问题,并克服传统降维方法信息丢失且难以恢复的缺点。现有方法通常难以在降维的同时保持数据的完整性和可控性,导致重建质量不高,且无法灵活控制保留哪些语义信息。

核心思路:CPFM的核心思路是学习高维数据和低维嵌入之间的耦合连续流。通过构建数据空间和潜在空间的双向映射,CPFM不仅可以进行降维,还能利用流网络的权重保留残余信息,从而实现高保真重建和可控的信息恢复。

技术框架:CPFM包含两个主要组成部分:一是扩展的Gromov-Wasserstein最优传输目标,用于建立数据和嵌入之间的概率对应关系;二是双条件流匹配网络,用于学习数据空间和潜在空间的耦合连续流。整体流程包括:首先,利用Gromov-Wasserstein最优传输建立数据和嵌入的对应关系;然后,训练双条件流匹配网络,学习数据到嵌入以及嵌入到数据的映射;最后,通过控制潜在空间保留的语义因子,实现可控的降维和高保真重建。

关键创新:CPFM的关键创新在于将流匹配技术应用于耦合的降维和重建任务,并利用流网络的权重来保留残余信息。与传统降维方法相比,CPFM能够更好地保持数据的完整性,并提供更灵活的可控性。此外,扩展的Gromov-Wasserstein最优传输目标也为建立数据和嵌入之间的对应关系提供了更有效的方法。

关键设计:CPFM的关键设计包括:(1) 使用Gromov-Wasserstein最优传输来建立数据和嵌入之间的概率对应关系,这有助于学习更准确的映射关系。(2) 设计双条件流匹配网络,该网络能够同时学习数据到嵌入以及嵌入到数据的映射,从而实现双向的转换。(3) 通过控制潜在空间保留的语义因子,实现对降维过程的可控性。损失函数的设计需要平衡降维的效率和重建的保真度,具体参数设置需要根据不同的数据集进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,CPFM在多个基准测试上优于现有基线方法。例如,在图像重建任务中,CPFM的重建图像具有更高的PSNR和SSIM值,表明其重建质量更高。此外,CPFM生成的嵌入具有更丰富的语义信息,能够更好地反映数据的内在结构。与传统降维方法相比,CPFM在降维的同时能够更好地保持数据的完整性,并提供更灵活的可控性。

🎯 应用场景

CPFM可应用于图像压缩、数据可视化、特征提取等领域。在图像压缩中,CPFM可以实现更高的压缩率和更好的图像质量。在数据可视化中,CPFM可以将高维数据映射到低维空间,方便用户进行分析和理解。在特征提取中,CPFM可以提取具有语义信息的特征,用于后续的机器学习任务。该研究的未来影响在于推动可控降维技术的发展,为更多应用场景提供更有效的解决方案。

📄 摘要(原文)

We introduce Coupled Flow Matching (CPFM), a framework that integrates controllable dimensionality reduction and high-fidelity reconstruction. CPFM learns coupled continuous flows for both the high-dimensional data x and the low-dimensional embedding y, which enables sampling p(y|x) via a latent-space flow and p(x|y) via a data-space flow. Unlike classical dimension-reduction methods, where information discarded during compression is often difficult to recover, CPFM preserves the knowledge of residual information within the weights of a flow network. This design provides bespoke controllability: users may decide which semantic factors to retain explicitly in the latent space, while the complementary information remains recoverable through the flow network. Coupled flow matching builds on two components: (i) an extended Gromov-Wasserstein optimal transport objective that establishes a probabilistic correspondence between data and embeddings, and (ii) a dual-conditional flow-matching network that extrapolates the correspondence to the underlying space. Experiments on multiple benchmarks show that CPFM yields semantically rich embeddings and reconstructs data with higher fidelity than existing baselines.