Debiased Counterfactual Generation via Flow Matching from Observations

📄 arXiv: 2605.07665v1 📥 PDF

作者: Hugh Dance, Johnny Xi, Peter Orbanz, Benjamin Bloem-Reddy

分类: stat.ML, cs.LG

发布日期: 2026-05-08


💡 一句话要点

提出基于流匹配的去偏反事实生成框架,通过利用观测数据分布提升反事实推断的准确性。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 反事实生成 流匹配 因果推断 去混杂 半参数估计 生成模型 分布迁移

📋 核心要点

  1. 现有方法将反事实分布视为独立生成目标,未能充分利用观测数据与反事实分布在支撑集、尾部行为及不变特征上的紧密关联。
  2. 提出基于流匹配的去混杂流框架,通过从观测分布出发进行变换,而非从零学习,从而更高效地建模反事实分布。
  3. 实验表明该方法在反事实分布估计任务中表现优于现有基线,并有效解决了流模型在处理复杂分布时的常见失效问题。

📝 摘要(中文)

在干预条件下估计反事实分布对于治疗风险评估和反事实生成任务至关重要。现有的方法通常将反事实分布建模为独立的生成目标,而忽略了其与观测数据之间的内在联系。本研究证明,在标准假设下,观测结果分布与反事实结果分布紧密相关:它们具有相同的支撑集和尾部行为,在弱混杂条件下统计距离相近,且共享对混杂因素不变的高维特征。基于此,我们提出不再从零开始学习反事实分布,而是通过一种从观测分布出发的“去混杂流”(deconfounding flow)来实现。我们利用流匹配(flow matching)技术构建该问题,并推导了一种基于新型高效影响函数校正的半参数有效估计量。此外,我们将该估计量扩展至高维空间中的最小能量流目标,证明了其在观测分布与反事实分布之间具有简洁的映射特性。实验结果表明,去混杂流方法优于现有的去偏反事实分布估计器,并有效缓解了基于流的方法中常见的失效模式。

🔬 方法详解

问题定义:论文旨在解决反事实分布估计中的偏差问题。现有方法通常将反事实生成视为独立的生成任务,忽略了观测数据与反事实数据在因果结构下的共享属性,导致在存在混杂因素时估计精度受限。

核心思路:核心思想是利用观测分布与反事实分布之间的统计相似性。通过证明两者在支撑集、尾部行为及不变特征上的重合,提出将反事实生成建模为从观测分布到反事实分布的“去混杂流”,从而实现更稳健的分布迁移。

技术框架:整体框架基于流匹配(Flow Matching)技术。首先通过观测数据学习基础分布,随后构建一个从观测分布映射到反事实分布的流模型,并引入基于高效影响函数(Efficient Influence Function)的校正机制,以消除混杂偏差。

关键创新:最重要的创新在于将因果推断中的去偏理论与生成模型中的流匹配相结合。通过利用观测分布作为生成起点,显著降低了模型学习的搜索空间,并利用半参数有效估计量确保了统计上的渐近最优性。

关键设计:关键设计包括:1. 引入高效影响函数校正项,用于在流匹配过程中动态调整梯度方向;2. 采用最小能量流(Minimal-energy flows)作为目标函数,在高维空间中实现观测与反事实分布间的最优传输路径,简化了训练过程并提升了收敛稳定性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,该方法在多项基准测试中显著优于现有的去偏反事实估计器。特别是在高维复杂数据场景下,该方法不仅提升了分布估计的准确性(通过更低的Wasserstein距离衡量),还成功克服了传统流模型在处理非平稳分布时的模式崩溃问题,展现了极强的鲁棒性。

🎯 应用场景

该研究在医疗健康领域具有极高价值,如评估不同治疗方案对患者的潜在疗效差异(个性化医疗)。此外,在经济学政策评估、市场营销中的用户行为干预分析以及任何涉及因果推断的高维数据生成任务中,该方法都能提供更准确的去偏反事实预测,助力决策制定。

📄 摘要(原文)

Estimating counterfactual distributions under interventions is central to treatment risk assessment and counterfactual generation tasks. Existing approaches model the counterfactual distribution as a standalone generative target, without exploiting its relationship to the observational data. In this work, we show that under standard assumptions, observational and counterfactual outcome distributions are tightly linked: they have identical support and tail behavior, remain statistically close under weak confounding, and share any features of high-dimensional outcomes which are invariant to confounders. These properties motivate learning counterfactual distributions not from scratch, but via a deconfounding flow from the observational distribution. We formulate this problem via flow-matching and derive a semiparametrically efficient estimator based on a novel efficient influence function correction. We subsequently extend our estimator to target minimal-energy flows in high-dimensions, which we show can be especially simple targets between observational and counterfactual distributions. In experiments, deconfounding flows outperform existing debiased counterfactual distribution estimators, while also mitigating known failure modes of flow-based methods.