Federated Causal Representation Learning in State-Space Systems for Decentralized Counterfactual Reasoning

📄 arXiv: 2602.19414v1 📥 PDF

作者: Nazal Mohamed, Ayush Mohanty, Nagi Gebraeel

分类: cs.LG, eess.SY, stat.ML

发布日期: 2026-02-23

备注: Manuscript under review


💡 一句话要点

提出联邦因果表征学习框架,解决工业互联系统中分散反事实推理难题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 联邦学习 因果表征学习 状态空间模型 反事实推理 工业控制系统

📋 核心要点

  1. 工业互联系统中的反事实推理面临数据隐私和模型专有性的挑战,现有集中式方法难以应用。
  2. 论文提出联邦学习框架,客户端学习解耦的潜在状态表征,服务器学习全局状态转移结构。
  3. 实验证明该方法在合成和真实数据集上具有良好的可扩展性和准确的反事实推理性能。

📝 摘要(中文)

本文提出了一种用于状态空间系统中联邦因果表征学习的框架,旨在解决工业资产(客户端)互联网络中分散反事实推理的问题。由于客户端特定数据的高维度和隐私性,以及客户端专有模型的不可修改性,集中式数据处理变得不可行。该框架允许每个客户端将高维观测映射到低维潜在状态,从而分离内在动态和控制驱动的影响。中央服务器估计全局状态转移和控制结构。这实现了分散的反事实推理,客户端可以在仅交换紧凑潜在状态的情况下,预测其他客户端的不同控制输入下输出的变化。论文证明了该方法收敛到集中式oracle,并提供了隐私保证。实验表明,该方法在合成和真实工业控制系统数据集上具有可扩展性和准确的跨客户端反事实推理能力。

🔬 方法详解

问题定义:论文旨在解决工业互联系统中,由于数据隐私和模型专有性限制,无法进行集中式数据处理,从而难以进行跨客户端的反事实推理的问题。现有方法无法在保护客户端数据隐私的同时,准确预测改变其他客户端控制输入对自身输出的影响。

核心思路:核心思路是利用联邦学习框架,让每个客户端学习一个将高维观测映射到低维潜在状态的表征,该表征能够解耦内在动态和控制驱动的影响。然后,中央服务器聚合这些潜在状态,学习全局的状态转移和控制结构。这样,客户端就可以在不共享原始数据的情况下,利用全局模型进行反事实推理。

技术框架:整体框架包含客户端和中央服务器两部分。客户端部分负责学习本地的状态空间模型,将高维观测数据编码为低维潜在状态。中央服务器部分负责聚合来自各个客户端的潜在状态,学习全局的状态转移矩阵和控制矩阵。客户端和服务器之间通过交换潜在状态和模型参数进行通信。整个流程可以迭代进行,直到模型收敛。

关键创新:关键创新在于将因果表征学习与联邦学习相结合,实现了在保护数据隐私的前提下进行跨客户端的反事实推理。通过学习解耦的潜在状态表征,能够更好地捕捉系统中的因果关系,提高反事实推理的准确性。此外,论文还提供了收敛性证明和隐私保证。

关键设计:论文使用状态空间模型来描述系统的动态过程。每个客户端的状态空间模型包含一个状态转移方程和一个观测方程。状态转移方程描述了状态如何随时间演变,观测方程描述了如何从状态中生成观测数据。论文使用变分自编码器(VAE)来学习潜在状态表征。损失函数包括重构损失和KL散度损失,用于保证潜在状态的有效性和解耦性。中央服务器使用梯度下降法来学习全局的状态转移矩阵和控制矩阵。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在合成数据集和真实工业控制系统数据集上都取得了良好的效果。与集中式oracle相比,该方法在反事实推理的准确性方面表现接近,同时保证了数据隐私。实验还验证了该方法的可扩展性,能够处理大规模的互联系统。在真实数据集上,该方法能够准确预测改变其他客户端控制输入对自身输出的影响,验证了其在实际应用中的潜力。

🎯 应用场景

该研究成果可应用于智能制造、智慧能源等领域,例如,预测改变某个工厂的生产计划对其他工厂的影响,或者预测改变某个电站的发电量对整个电网的影响。通过分散式反事实推理,可以帮助企业更好地进行决策,优化资源配置,提高生产效率,并降低运营风险。该方法在保护数据隐私的同时,实现了跨组织的协同优化,具有重要的实际应用价值。

📄 摘要(原文)

Networks of interdependent industrial assets (clients) are tightly coupled through physical processes and control inputs, raising a key question: how would the output of one client change if another client were operated differently? This is difficult to answer because client-specific data are high-dimensional and private, making centralization of raw data infeasible. Each client also maintains proprietary local models that cannot be modified. We propose a federated framework for causal representation learning in state-space systems that captures interdependencies among clients under these constraints. Each client maps high-dimensional observations into low-dimensional latent states that disentangle intrinsic dynamics from control-driven influences. A central server estimates the global state-transition and control structure. This enables decentralized counterfactual reasoning where clients predict how outputs would change under alternative control inputs at others while only exchanging compact latent states. We prove convergence to a centralized oracle and provide privacy guarantees. Our experiments demonstrate scalability, and accurate cross-client counterfactual inference on synthetic and real-world industrial control system datasets.