Simplex-to-Euclidean Bijections for Categorical Flow Matching

📄 arXiv: 2510.27480v1 📥 PDF

作者: Bernardo Williams, Victor M. Yeom-Song, Marcelo Hartmann, Arto Klami

分类: cs.LG

发布日期: 2025-10-31


💡 一句话要点

提出基于单纯形-欧几里得空间双射的分类流匹配方法,用于学习单纯形上的概率分布。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 分类流匹配 单纯形 Aitchison几何 双射 密度建模

📋 核心要点

  1. 现有方法在单纯形上建模概率分布时,通常依赖黎曼几何或自定义噪声过程,计算复杂且效率较低。
  2. 论文提出通过Aitchison几何定义的平滑双射,将单纯形映射到欧几里得空间,从而简化建模过程。
  3. 实验结果表明,该方法在合成数据和真实数据集上均表现出竞争力,验证了其有效性。

📝 摘要(中文)

本文提出了一种用于学习和采样单纯形上概率分布的方法。该方法通过平滑双射将开放单纯形映射到欧几里得空间,利用Aitchison几何来定义映射,并通过Dirichlet插值对离散观测进行去量化,从而支持分类数据的建模。这使得能够在欧几里得空间中通过双射进行密度建模,同时仍然允许精确恢复原始离散分布。与之前使用黎曼几何或自定义噪声过程在单纯形上操作的方法相比,我们的方法在尊重Aitchison几何的同时在欧几里得空间中工作,并在合成和真实世界的数据集上取得了具有竞争力的性能。

🔬 方法详解

问题定义:论文旨在解决学习和采样单纯形上的概率分布的问题。现有方法,如基于黎曼几何或自定义噪声过程的方法,在单纯形上直接操作,计算复杂,效率较低,难以有效建模高维分类数据。这些方法通常需要专门的优化器和采样策略,限制了其在实际应用中的灵活性和可扩展性。

核心思路:论文的核心思路是通过建立单纯形和欧几里得空间之间的双射关系,将单纯形上的概率分布学习问题转化为欧几里得空间中的密度建模问题。利用Aitchison几何来定义这种双射,保证了在映射过程中保持单纯形的几何结构。通过这种方式,可以利用欧几里得空间中成熟的密度建模技术,如流模型,来学习单纯形上的概率分布。

技术框架:整体框架包含以下几个主要步骤:1) 使用Dirichlet插值对离散的分类数据进行去量化,将其转化为连续数据;2) 利用Aitchison几何定义的双射,将单纯形映射到欧几里得空间;3) 在欧几里得空间中使用流模型学习数据的密度;4) 通过逆映射将欧几里得空间中的样本映射回单纯形,从而得到单纯形上的样本。

关键创新:最重要的技术创新点在于利用Aitchison几何定义了单纯形和欧几里得空间之间的双射。这种双射不仅是平滑的,而且能够保持单纯形的几何结构,从而保证了在欧几里得空间中学习到的密度能够有效地反映单纯形上的概率分布。与现有方法相比,该方法避免了在单纯形上直接进行复杂计算,简化了建模过程。

关键设计:论文中使用了Dirichlet插值来处理离散数据,将其转化为连续数据。Aitchison几何双射的具体形式取决于所选择的映射函数,例如可以使用指数映射和对数映射。流模型可以选择各种现有的架构,如RealNVP或Glow。损失函数通常采用负对数似然,用于训练流模型。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文在合成数据和真实数据集上进行了实验,结果表明该方法能够有效地学习和采样单纯形上的概率分布。与现有方法相比,该方法在某些数据集上取得了更好的性能,验证了其有效性和竞争力。具体的性能数据和对比基线在论文中有详细描述。

🎯 应用场景

该研究成果可应用于各种涉及分类数据的建模任务,例如自然语言处理中的文本分类、计算机视觉中的图像分类、以及生物信息学中的基因表达分析等。通过高效地学习和采样单纯形上的概率分布,可以提升这些任务的性能,并为新的应用场景提供可能性。

📄 摘要(原文)

We propose a method for learning and sampling from probability distributions supported on the simplex. Our approach maps the open simplex to Euclidean space via smooth bijections, leveraging the Aitchison geometry to define the mappings, and supports modeling categorical data by a Dirichlet interpolation that dequantizes discrete observations into continuous ones. This enables density modeling in Euclidean space through the bijection while still allowing exact recovery of the original discrete distribution. Compared to previous methods that operate on the simplex using Riemannian geometry or custom noise processes, our approach works in Euclidean space while respecting the Aitchison geometry, and achieves competitive performance on both synthetic and real-world data sets.