GST-UNet: A Neural Framework for Spatiotemporal Causal Inference with Time-Varying Confounding
作者: Miruna Oprescu, David K. Park, Xihaier Luo, Shinjae Yoo, Nathan Kallus
分类: cs.LG, stat.ME
发布日期: 2025-02-07 (更新: 2025-10-28)
备注: 29 pages, 6 figures, 6 tables, NeurIPS 2025
💡 一句话要点
GST-UNet:用于时空因果推断的神经框架,解决时变混杂因素问题
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 时空因果推断 时变混杂 U-Net G-computation 深度学习 因果推断 公共卫生
📋 核心要点
- 现有方法在处理时空因果推断时,要么依赖于过强的结构假设,要么无法处理干扰、空间混杂、时间延续和时变混杂等关键挑战。
- GST-UNet结合U-Net和G-computation,显式调整时变混杂因素,捕捉非线性时空依赖,从而实现从单一轨迹的有效因果推断。
- 在合成实验和真实世界野火烟雾暴露分析中验证了GST-UNet的有效性,证明其在数据稀缺场景下的优越性。
📝 摘要(中文)
本文提出了一种名为GST-UNet(G-computation Spatio-Temporal UNet)的理论驱动的神经框架,用于从时空观测数据中估计因果效应。在公共卫生、环境科学和政策评估等领域,随机实验往往不可行,因此该方法至关重要。GST-UNet结合了基于U-Net的时空编码器与基于回归的迭代G-computation,以估计复杂干预序列下特定位置的潜在结果。该模型显式地调整了时变混杂因素,并捕获了非线性时空依赖关系,从而能够在数据稀缺的情况下,从单个观测轨迹中进行有效的因果推断。通过合成实验和对2018年加州Camp Fire期间野火烟雾暴露与呼吸道住院的真实世界分析,验证了其有效性。这些结果表明,GST-UNet是一个有原则且随时可用的时空因果推断框架,推动了政策相关和科学领域中可靠的估计。
🔬 方法详解
问题定义:论文旨在解决从时空观测数据中进行因果推断的问题,特别是在存在时变混杂因素的情况下。现有方法要么依赖于过强的结构假设,限制了其适用性;要么无法有效地处理时变混杂,导致因果推断结果偏差。这些痛点限制了其在公共卫生、环境科学等领域的应用。
核心思路:论文的核心思路是将深度学习中的U-Net架构与因果推断中的G-computation方法相结合。U-Net用于捕获复杂的非线性时空依赖关系,而G-computation则用于调整时变混杂因素。通过这种结合,模型能够从观测数据中更准确地估计因果效应。这种设计旨在利用深度学习的强大表征能力和因果推断的严谨性。
技术框架:GST-UNet的整体框架包含两个主要模块:一个基于U-Net的时空编码器和一个基于回归的迭代G-computation模块。首先,U-Net编码器接收时空观测数据作为输入,学习数据的时空表征。然后,G-computation模块利用这些表征,迭代地估计在不同干预下的潜在结果。整个流程旨在模拟干预的影响,并调整时变混杂因素。
关键创新:GST-UNet的关键创新在于其将深度学习与因果推断相结合,并显式地处理了时变混杂因素。与现有方法相比,GST-UNet不需要强结构假设,并且能够更好地捕获非线性时空依赖关系。此外,该模型能够在数据稀缺的情况下,从单个观测轨迹中进行有效的因果推断,这在许多实际应用中非常重要。
关键设计:U-Net编码器的具体结构可以根据具体应用进行调整,例如卷积层数、滤波器大小等。G-computation模块中的回归模型可以是线性回归、非线性回归或更复杂的机器学习模型。损失函数通常包括预测误差和正则化项,以防止过拟合。模型训练采用端到端的方式,通过反向传播优化所有参数。
🖼️ 关键图片
📊 实验亮点
论文通过合成实验和真实世界案例研究验证了GST-UNet的有效性。在合成实验中,GST-UNet在各种设置下均优于基线方法。在对2018年加州Camp Fire期间野火烟雾暴露与呼吸道住院的真实世界分析中,GST-UNet能够更准确地估计烟雾暴露对呼吸道住院的影响,为公共卫生政策的制定提供了有价值的参考。
🎯 应用场景
GST-UNet在公共卫生、环境科学和政策评估等领域具有广泛的应用前景。例如,可以用于评估环境政策对健康的影响,预测气候变化对农业的影响,或评估社会干预措施的效果。该研究的实际价值在于提供了一种更可靠的因果推断工具,从而为决策者提供更准确的信息。未来,该方法可以进一步扩展到其他领域,例如金融风险管理和智能交通系统。
📄 摘要(原文)
Estimating causal effects from spatiotemporal observational data is essential in public health, environmental science, and policy evaluation, where randomized experiments are often infeasible. Existing approaches, however, either rely on strong structural assumptions or fail to handle key challenges such as interference, spatial confounding, temporal carryover, and time-varying confounding -- where covariates are influenced by past treatments and, in turn, affect future ones. We introduce GST-UNet (G-computation Spatio-Temporal UNet), a theoretically grounded neural framework that combines a U-Net-based spatiotemporal encoder with regression-based iterative G-computation to estimate location-specific potential outcomes under complex intervention sequences. GST-UNet explicitly adjusts for time-varying confounders and captures non-linear spatial and temporal dependencies, enabling valid causal inference from a single observed trajectory in data-scarce settings. We validate its effectiveness in synthetic experiments and in a real-world analysis of wildfire smoke exposure and respiratory hospitalizations during the 2018 California Camp Fire. Together, these results position GST-UNet as a principled and ready-to-use framework for spatiotemporal causal inference, advancing reliable estimation in policy-relevant and scientific domains.