Differentially Private Synthetic Voltage Phasor Release for Distribution Grids

📄 arXiv: 2605.02390v1 📥 PDF

作者: Andrew Campbell, Chenyue Zhang, Anna Scaglione, Eli Kerr, Merilyn Chesler, Sean Peisert

分类: eess.SY

发布日期: 2026-05-04

备注: Submitted to IEEE TCNS


💡 一句话要点

提出一种差分隐私合成电压相量发布方法,用于配电网数据共享,保护网络拓扑隐私。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 差分隐私 合成数据 电压相量 配电网 电网基础模型 隐私保护 交流潮流

📋 核心要点

  1. 现有方法难以在保护电网拓扑隐私的同时,共享用于训练电网基础模型(GFMs)的电压相量数据。
  2. 该论文提出一种基于差分隐私(DP)的合成电压相量生成方法,通过在合成负荷中引入随机性来保护网络拓扑。
  3. 实验表明,该方法在保护网络参数隐私的同时,能够保留交流潮流的统计特性,优于直接扰动导纳矩阵的方法。

📝 摘要(中文)

训练机器学习模型,包括电网基础模型(GFMs),需要大量的真实电网数据,但出于隐私考虑,电力公司不愿共享负荷曲线和网络参数。本文研究了在差分隐私(DP)下发布配电网的合成电压相量轨迹。首先,对历史客户负荷拟合DP生成模型,然后通过真实导纳矩阵上的交流潮流方程传播合成负荷轨迹,生成电压相量。核心问题是DP合成负荷中的随机性是否足以保护负荷和由总线导纳矩阵编码的网络拓扑。结果表明,这种随机性是足够的。这意味着可以从DP合成负荷构建电压轨迹语料库,同时保留交流潮流的统计特性,这对于训练GFM至关重要。这种对潮流统计特性的保留与直接扰动导纳矩阵或向电压输出注入噪声的方法形成对比,后两者会扭曲底层物理特性。具体而言,本文推导了关于导纳矩阵的发布电压轨迹的$(\varepsilon,δ)$-DP保证,这意味着无需任何额外的噪声机制即可获得网络参数的隐私。该界限取决于邻接假设、交流潮流的雅可比矩阵和合成DP负荷的协方差。最后,本文提出了一种合成电压生成程序,并针对高斯输出扰动基线进行了实证评估,表明该方法在支持GFM训练方面具有明显优势。

🔬 方法详解

问题定义:论文旨在解决在保护配电网网络拓扑隐私的前提下,如何安全地发布合成电压相量数据,以支持电网基础模型(GFMs)的训练。现有方法,如直接扰动导纳矩阵或向电压输出添加噪声,会扭曲交流潮流的物理特性,影响GFM的训练效果。

核心思路:论文的核心思路是利用差分隐私(DP)合成负荷的固有随机性来保护网络拓扑的隐私。通过对历史负荷数据进行DP处理,生成合成负荷轨迹,然后通过真实的交流潮流方程传播这些轨迹,得到合成电压相量。关键在于证明合成负荷的随机性足以保护由导纳矩阵编码的网络拓扑信息。

技术框架:该方法包含以下主要步骤:1) 对历史客户负荷数据进行差分隐私处理,训练DP生成模型。2) 使用DP生成模型生成合成负荷轨迹。3) 将合成负荷轨迹作为输入,通过真实的交流潮流方程计算得到合成电压相量。4) 分析合成电压相量的隐私保护程度,推导关于导纳矩阵的$(\varepsilon,δ)$-DP保证。

关键创新:该方法最重要的创新点在于,它证明了通过差分隐私合成负荷产生的随机性,足以保护网络拓扑的隐私,而无需对导纳矩阵进行额外的扰动。这避免了传统方法中因扰动导纳矩阵而导致的潮流物理特性失真问题。

关键设计:论文的关键设计包括:1) 选择合适的DP机制来生成合成负荷,例如高斯机制或拉普拉斯机制。2) 精确计算交流潮流方程的雅可比矩阵,用于分析隐私损失。3) 推导$(\varepsilon,δ)$-DP保证的界限,该界限取决于邻接假设、雅可比矩阵和合成DP负荷的协方差。4) 采用合理的邻接假设,例如假设攻击者可以修改网络中的一条线路。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在保护网络参数隐私的同时,能够保留交流潮流的统计特性,优于高斯输出扰动等基线方法。具体而言,该方法能够在不显著降低GFM训练效果的前提下,提供可证明的差分隐私保证,为配电网数据共享提供了一种安全有效的解决方案。

🎯 应用场景

该研究成果可应用于电力系统数据共享平台,允许电力公司在保护用户隐私和网络拓扑安全的前提下,共享配电网的电压相量数据。这有助于研究人员和工程师开发更先进的电网基础模型(GFMs),提高电网的运行效率、可靠性和安全性,并促进智能电网技术的发展。

📄 摘要(原文)

Training machine learning models, including Grid Foundation Models (GFMs), requires large volumes of realistic grid data, yet substantial privacy concerns discourage utilities and data providers from sharing load profiles and network parameters. We study the release of synthetic voltage phasor trajectories for distribution grids under differential privacy (DP). We first fit a DP generative model to historical customer loads, then propagate synthetic load trajectories through the AC power flow equations on the true admittance matrix to produce voltage phasors. The central question is whether the randomness already present in the DP synthetic loads is sufficient to protect not only the loads, but also the network topology encoded by the bus admittance matrix. We show that it is. The implication is that a corpus of voltage trajectories can be constructed from DP synthetic loads while preserving the statistics of AC power flow, which is critical for training GFMs. This preservation of the power flow statistics stands in contrast to approaches that perturb the admittance matrix directly or inject noise into the voltage outputs, both of which distort the underlying physics. Concretely, we derive $(\varepsilon,δ)$-DP guarantees for the released voltage trajectories with respect to the admittance matrix, meaning privacy of the network parameters is obtained without any additional noise mechanism. Our bound depends on the adjacency assumption, the Jacobian of the AC power flow, and the covariance of the synthetic DP-loads. Finally, we present a synthetic voltage generation procedure and an empirical evaluation against Gaussian output-perturbation baselines, demonstrating that our approach provides a clear advantage for enabling GFM training.