Quantum-Enhanced Reinforcement Learning for Power Grid Security Assessment

📄 arXiv: 2504.14412v2 📥 PDF

作者: Benjamin M. Peter, Mert Korkali

分类: eess.SY, cs.LG

发布日期: 2025-04-19 (更新: 2025-06-21)

备注: 6 pages, 6 figures, 3 tables. Submitted to the 57th North American Power Symposium (NAPS) 2025


💡 一句话要点

提出量子增强强化学习,用于提升电力系统安全评估效率。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 量子计算 强化学习 电力系统安全评估 应急分析 参数化量子电路

📋 核心要点

  1. 电力系统安全评估面临组合爆炸的挑战,传统强化学习方法难以有效扩展。
  2. 论文提出一种混合量子-经典强化学习智能体,利用量子计算加速行动探索和模型学习。
  3. 实验表明,该智能体在维持电网稳定性方面优于传统强化学习方法,验证了量子增强的有效性。

📝 摘要(中文)

维护电力系统安全是一项日益严峻的挑战,需要创新的解决方案。强化学习(RL)智能体已被提议用于帮助电网运营商应对复杂网络中海量的决策空间和非线性行为。然而,将RL应用于电力系统安全评估,特别是针对组合复杂性的应急分析问题,已被证明难以扩展。通过利用量子计算在行动探索和基于模型的相互依赖性方面的优势,将量子计算集成到这些RL框架中,有助于提高计算效率并提升智能体的熟练程度。为了展示量子计算在RL智能体训练和仿真中的概念验证应用,我们提出了一种使用IBM Qiskit Runtime在量子硬件上运行的混合智能体。我们还详细介绍了用于生成相关量子输出的参数化量子电路(PQC)的构建。通过N-k应急分析,证明了该智能体在维持电网稳定性方面的能力优于没有量子增强的基准模型。此外,我们还对与量子后端集成的RL模型的训练过程进行了比较评估。

🔬 方法详解

问题定义:电力系统安全评估中的N-k应急分析是一个组合优化问题,需要评估大量可能的元件故障组合对系统稳定性的影响。传统的强化学习方法在处理这种高维状态空间和动作空间时,面临着计算复杂度高、收敛速度慢等问题,难以满足实时性要求。现有方法难以有效扩展到大规模电力系统,并且难以充分探索潜在的危险状态。

核心思路:论文的核心思路是利用量子计算的优势来增强强化学习智能体的性能。具体来说,通过设计参数化的量子电路(PQC)来生成动作,利用量子计算的并行性和纠缠性来加速动作探索,并提高智能体对复杂系统状态的建模能力。这种混合量子-经典的方法旨在克服传统强化学习在高维问题中的局限性。

技术框架:整体框架包括一个经典的强化学习智能体和一个量子后端。经典智能体负责与电力系统环境交互,并根据环境状态选择动作。量子后端则负责生成动作,并利用量子计算来加速动作探索。具体流程如下:1) 经典智能体接收电力系统状态;2) 经典智能体将状态信息传递给量子后端;3) 量子后端利用PQC生成动作;4) 经典智能体执行动作,并接收环境反馈;5) 经典智能体利用环境反馈更新策略。

关键创新:最重要的技术创新点在于将量子计算集成到强化学习框架中,并设计了适用于电力系统安全评估的PQC。与现有方法的本质区别在于,该方法利用量子计算的优势来加速动作探索和模型学习,从而提高了智能体的性能和效率。

关键设计:论文详细介绍了PQC的设计,包括量子比特的个数、量子门的类型和参数化方式。PQC的参数通过经典优化算法进行训练,以最大化智能体的奖励。此外,论文还讨论了如何将量子计算的结果集成到经典强化学习算法中,例如,利用量子计算生成的动作概率分布来指导经典智能体的动作选择。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,与没有量子增强的基准模型相比,所提出的量子增强强化学习智能体在维持电网稳定性方面表现更出色。通过N-k应急分析,验证了该智能体能够更有效地识别和应对潜在的危险状态。具体的性能数据和提升幅度在论文中进行了详细的展示和分析,证明了量子计算在强化学习中的有效性。

🎯 应用场景

该研究成果可应用于电力系统运行、规划和控制等领域。通过提高电力系统安全评估的效率和准确性,可以帮助电网运营商更好地应对各种突发事件,保障电力系统的安全稳定运行。此外,该方法还可以推广到其他具有复杂性和不确定性的控制问题,例如智能交通、金融风险管理等。

📄 摘要(原文)

The increasingly challenging task of maintaining power grid security requires innovative solutions. Novel approaches using reinforcement learning (RL) agents have been proposed to help grid operators navigate the massive decision space and nonlinear behavior of these complex networks. However, applying RL to power grid security assessment, specifically for combinatorially troublesome contingency analysis problems, has proven difficult to scale. The integration of quantum computing into these RL frameworks helps scale by improving computational efficiency and boosting agent proficiency by leveraging quantum advantages in action exploration and model-based interdependence. To demonstrate a proof-of-concept use of quantum computing for RL agent training and simulation, we propose a hybrid agent that runs on quantum hardware using IBM's Qiskit Runtime. We also provide detailed insight into the construction of parameterized quantum circuits (PQCs) for generating relevant quantum output. This agent's proficiency at maintaining grid stability is demonstrated relative to a benchmark model without quantum enhancement using N-k contingency analysis. Additionally, we offer a comparative assessment of the training procedures for RL models integrated with a quantum backend.