Counterfactual identifiability beyond global monotonicity: non-monotone triangular structural causal models
作者: Pengcheng Tan, Jiang Chen, Dehui Du
分类: cs.LG, stat.ME
发布日期: 2026-05-06
💡 一句话要点
提出非单调三角结构因果模型,实现具身交互中反事实推断的精确性和稳定性。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 反事实推断 结构因果模型 非单调性 具身交互 可逆神经网络
📋 核心要点
- 现有反事实推断方法依赖全局单调性假设,在具身交互等复杂场景中失效。
- 提出非单调三角结构因果模型,通过机制可逆性和逆传输实现反事实可识别性。
- 实验表明,该模型在非单调环境中反事实推断的准确性和稳定性方面优于现有方法。
📝 摘要(中文)
结构因果模型为干预和反事实提供了一个统一的语义,但大多数可识别性结果依赖于全局单调性等限制性假设,这在具身交互中经常被违反,因为相同的外生扰动在不同的接触环境中可能引起相反的反应。本文探讨了在放弃全局单调性后,什么样的结构仍然足够。我们引入了非单调三角结构因果模型(NM-TM-SCM),它保留了三角递归,但用机制相关的可逆性和上下文无关的逆传输取代了全局单调性。我们证明了这些条件等价于外生同构,并意味着完全的反事实可识别性,并且我们给出了一个反例,表明仅局部可逆性是不够的。我们在CausalInverter中实例化了该理论,它具有三角可逆层、方向门和传输稳定性正则化。在合成的非单调机制上,结构偏差随着非单调性的增加而产生系统的反事实增益。在MuJoCo Door上,我们的模型实现了完美的事件级反事实恢复,相对于Transformer基线降低了连续角度误差,并提供了比Transformer和条件流预测器更稳定的恢复。在非单调性较弱的MuJoCo Push上,相同的低数据预测器仍然具有竞争力或更好,这与偏差-方差边界一致。这些结果确定了全局单调三角模型和无约束黑盒世界模型之间更广泛的可识别区域。
🔬 方法详解
问题定义:现有结构因果模型在进行反事实推断时,通常依赖于全局单调性假设。然而,在具身交互等复杂环境中,由于外生扰动可能导致非单调的因果效应(例如,相同的力在不同接触情况下可能导致相反的运动),全局单调性假设不再成立,导致反事实推断的准确性下降。因此,需要研究在放弃全局单调性假设后,什么样的结构仍然能够保证反事实的可识别性。
核心思路:论文的核心思路是用机制相关的可逆性和上下文无关的逆传输取代全局单调性,并保留三角递归结构。机制相关的可逆性保证了每个因果机制都是可逆的,即给定结果可以唯一确定原因。上下文无关的逆传输保证了因果机制的逆过程在不同上下文中具有一致性。通过这些假设,论文证明了可以实现完全的反事实可识别性。
技术框架:论文提出的方法主要包含以下几个部分:1) 非单调三角结构因果模型(NM-TM-SCM):该模型保留了三角递归结构,但允许非单调的因果机制。2) CausalInverter:该模型是NM-TM-SCM的具体实现,包含三角可逆层、方向门和传输稳定性正则化。三角可逆层用于建模可逆的因果机制,方向门用于处理非单调性,传输稳定性正则化用于保证逆传输的一致性。3) 实验验证:在合成数据和MuJoCo模拟环境中验证了该方法的有效性。
关键创新:该论文最重要的技术创新点在于提出了非单调三角结构因果模型,并证明了在机制相关的可逆性和上下文无关的逆传输的条件下,可以实现完全的反事实可识别性。与现有方法相比,该方法不再依赖于全局单调性假设,因此可以更好地处理具身交互等复杂环境中的反事实推断问题。
关键设计:CausalInverter的关键设计包括:1) 三角可逆层:使用可逆神经网络(如iResNet或Glow)实现,保证了因果机制的可逆性。2) 方向门:用于处理非单调性,例如,可以使用sigmoid函数来控制因果效应的方向。3) 传输稳定性正则化:通过最小化不同上下文中的逆传输之间的差异来实现,保证了逆传输的一致性。损失函数包括反事实预测误差和传输稳定性正则化项。
🖼️ 关键图片
📊 实验亮点
在MuJoCo Door环境中,CausalInverter实现了完美的事件级反事实恢复,并降低了相对于Transformer基线的连续角度误差。在MuJoCo Push环境中,CausalInverter在低数据情况下仍然具有竞争力或更好,验证了该方法在不同非单调程度环境下的有效性。合成数据实验表明,结构偏差随着非单调性的增加而产生系统的反事实增益。
🎯 应用场景
该研究成果可应用于机器人控制、自动驾驶、智能制造等领域。通过更准确的反事实推断,可以帮助机器人更好地理解环境,做出更合理的决策,从而提高其在复杂环境中的适应性和鲁棒性。例如,在自动驾驶中,可以利用反事实推断来评估不同驾驶策略的潜在风险,从而选择更安全的驾驶方案。
📄 摘要(原文)
Structural causal models provide a unified semantics for interventions and counterfactuals, but most identifiability results rely on restrictive assumptions like global monotonicity, which are often violated in embodied interaction, where the same exogenous perturbation can induce opposite responses under different contact contexts. We ask what structure still suffices once global monotonicity is dropped. We introduce non-monotone triangular structural causal models (NM-TM-SCM), which retain triangular recursion but replace global monotonicity with mechanism-wise invertibility and context-independent inverse transport. We prove that these conditions are equivalent to exogenous isomorphism and imply complete counterfactual identifiability, and we give a counterexample showing that local invertibility alone is insufficient. We instantiate the theory in CausalInverter, with triangular invertible layers, orientation gates, and transport-stability regularization. On synthetic non-monotonic mechanisms, the structural bias yields systematic counterfactual gains as non-monotonicity increases. On MuJoCo Door, our model achieves perfect event-level counterfactual recovery, lowers continuous angle error relative to a Transformer baseline, and delivers substantially more stable recovery than Transformer and conditional-flow predictors. On MuJoCo Push, where non-monotonicity is weaker, the same low-data predictors remain competitive or better, consistent with a bias-variance boundary. These results identify a broader identifiable regime between globally monotone triangular models and unconstrained black-box world models.