Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference
作者: Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent
分类: cs.LG, cs.AI
发布日期: 2026-02-14
💡 一句话要点
Pawsterior:变分流匹配框架,用于结构化领域的模拟推断
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 模拟推断 流匹配 变分推断 几何约束 离散潜在结构 结构化学习 后验推断
📋 核心要点
- 传统流匹配方法在处理受限参数空间或离散变量的SBI问题时存在局限性,导致学习效率低和难以满足物理约束。
- Pawsterior通过变分流匹配框架,将域几何信息融入推断过程,并支持离散潜在结构的SBI任务。
- 实验表明,Pawsterior在标准SBI基准测试中提高了后验保真度,并能处理传统方法无法解决的离散结构问题。
📝 摘要(中文)
我们提出了Pawsterior,一个变分流匹配框架,旨在改进和扩展基于模拟的推断(SBI)。许多SBI问题涉及受结构化域约束的后验,例如有界的物理参数或混合离散-连续变量,然而标准的流匹配方法通常在无约束空间中运行。这种不匹配导致学习效率低下,并且难以满足物理约束。我们的贡献有两方面。首先,通过推广CatFlow的几何归纳偏置,我们形式化了端点诱导的仿射几何约束,这是一种通过双边变分模型将域几何直接融入推断过程的原则。这种公式提高了采样过程中的数值稳定性,并带来了一致的更好的后验保真度,这通过在标准SBI基准测试中改进的分类器双样本测试性能得到证明。其次,更重要的是,我们的变分参数化使得SBI任务能够处理涉及离散潜在结构(例如,切换系统)的任务,而这些任务与传统的流匹配方法根本不兼容。通过解决几何约束和离散潜在结构,Pawsterior将流匹配扩展到更广泛的结构化SBI问题,这些问题以前是无法访问的。
🔬 方法详解
问题定义:论文旨在解决现有基于模拟的推断(SBI)方法在处理具有结构化域(例如,有界物理参数、混合离散-连续变量)的问题时存在的局限性。传统的流匹配方法通常在无约束空间中工作,这与实际问题的约束条件不符,导致学习效率低下,难以满足物理约束,甚至无法处理包含离散潜在结构的问题。
核心思路:Pawsterior的核心思路是利用变分流匹配框架,将问题的结构化信息(特别是域的几何信息)直接融入到推断过程中。通过引入端点诱导的仿射几何约束,使得模型能够更好地学习和尊重问题的约束条件。此外,变分参数化使得模型能够处理包含离散潜在结构的问题,这是传统流匹配方法无法做到的。
技术框架:Pawsterior采用双边变分模型,其整体框架可以概括为:1)定义一个基于流的生成模型,用于将潜在变量映射到模拟器的输入参数;2)引入端点诱导的仿射几何约束,将域的几何信息融入到流的训练过程中;3)使用变分推断方法,学习生成模型的参数,使得生成的样本能够尽可能地逼近真实数据;4)对于包含离散潜在结构的问题,通过变分参数化,将离散变量融入到模型中,并使用期望最大化(EM)算法进行训练。
关键创新:Pawsterior的关键创新在于:1)形式化了端点诱导的仿射几何约束,这是一种将域几何信息直接融入推断过程的原则,提高了采样过程中的数值稳定性,并改善了后验保真度;2)通过变分参数化,使得流匹配方法能够处理包含离散潜在结构的SBI任务,扩展了流匹配方法的应用范围。
关键设计:Pawsterior的关键设计包括:1)使用CatFlow的几何归纳偏置,以确保流的映射能够尊重域的几何结构;2)采用双边变分模型,同时学习正向和反向的流,以提高推断的准确性;3)对于离散潜在结构,使用Gumbel-Softmax技巧进行松弛,以便进行梯度反向传播;4)损失函数包括流匹配损失、变分下界损失和正则化项,以平衡模型的准确性和泛化能力。
📊 实验亮点
实验结果表明,Pawsterior在标准SBI基准测试中,通过分类器双样本测试,后验保真度得到了显著提升。更重要的是,Pawsterior成功地应用于包含离散潜在结构的SBI任务,而这是传统流匹配方法无法实现的。这些结果验证了Pawsterior在处理结构化SBI问题方面的优越性。
🎯 应用场景
Pawsterior可应用于各种涉及结构化参数空间的模拟推断问题,例如物理参数估计、机器人控制、系统生物学和金融建模等。它能够处理具有复杂约束和离散潜在结构的场景,为这些领域的模型校准、不确定性量化和决策优化提供更准确和可靠的工具,并有望推动相关领域的发展。
📄 摘要(原文)
We introduce Pawsterior, a variational flow-matching framework for improved and extended simulation-based inference (SBI). Many SBI problems involve posteriors constrained by structured domains, such as bounded physical parameters or hybrid discrete-continuous variables, yet standard flow-matching methods typically operate in unconstrained spaces. This mismatch leads to inefficient learning and difficulty respecting physical constraints. Our contributions are twofold. First, generalizing the geometric inductive bias of CatFlow, we formalize endpoint-induced affine geometric confinement, a principle that incorporates domain geometry directly into the inference process via a two-sided variational model. This formulation improves numerical stability during sampling and leads to consistently better posterior fidelity, as demonstrated by improved classifier two-sample test performance across standard SBI benchmarks. Second, and more importantly, our variational parameterization enables SBI tasks involving discrete latent structure (e.g., switching systems) that are fundamentally incompatible with conventional flow-matching approaches. By addressing both geometric constraints and discrete latent structure, Pawsterior extends flow-matching to a broader class of structured SBI problems that were previously inaccessible.