Interpretable Load Forecasting via Representation Learning of Geo-distributed Meteorological Factors

📄 arXiv: 2501.02241v1 📥 PDF

作者: Yangze Zhou, Guoxin Lin, Gonghao Zhang, Yi Wang

分类: cs.LG, cs.AI

发布日期: 2025-01-04


💡 一句话要点

提出基于地理分布式气象因素表征学习的 interpretable 负荷预测方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱七:动作重定向 (Motion Retargeting)

关键词: 负荷预测 气象因素 表征学习 图神经网络 Shapley值 可解释性 地理分布式 智能电网

📋 核心要点

  1. 现有负荷预测方法难以有效利用区域内不同地理位置的气象因素差异,导致预测精度受限。
  2. 该论文提出一种表征学习框架,提取地理分布式气象因素,并考虑它们之间的空间关系,从而更全面地利用气象信息。
  3. 实验结果表明,该方法在极端天气情况下显著提高了日前负荷预测的准确性,并揭示了气象因素重要性与区域经济之间的联系。

📝 摘要(中文)

气象因素(MF)对日前负荷预测至关重要,因为它显著影响消费者的用电行为。许多研究已将MF纳入负荷预测模型以提高准确性。一种常见的做法是从一个代表性位置选择MF,或将平均MF作为预测模型的输入。然而,区域内不同位置收集的MF差异可能很大,这给从众多位置选择合适的MF带来了挑战。本文提出了一个表征学习框架,用于提取地理分布式MF,同时考虑其空间关系。此外,本文在基于图的模型中采用Shapley值来揭示不同位置收集的MF与负荷之间的联系。为了降低计算Shapley值的计算复杂度,采用基于蒙特卡洛抽样和加权线性回归的加速方法。在两个真实世界数据集上的实验表明,所提出的方法提高了日前预测的准确性,尤其是在夏季的“累积温度效应”和冬季的“温度突变”等极端情况下。我们还发现不同位置MF的重要性与相应区域的GDP和支柱产业之间存在显著相关性。

🔬 方法详解

问题定义:日前负荷预测是电力系统运行的关键环节。现有方法通常选择单个代表性位置的气象数据或对多个位置的气象数据进行平均,忽略了地理分布式气象因素的空间差异性,导致预测精度下降,尤其是在极端天气条件下。此外,现有方法缺乏对不同位置气象因素与负荷之间关系的 interpretable 分析。

核心思路:该论文的核心思路是通过表征学习方法,将地理分布式气象因素映射到低维空间,捕捉它们之间的空间相关性。同时,利用 Shapley 值来解释不同位置的气象因素对负荷预测的贡献,从而提高预测精度和可解释性。

技术框架:该方法包含以下主要模块:1) 数据预处理:收集地理分布式气象数据和负荷数据,进行清洗和标准化。2) 表征学习:构建图神经网络,将不同位置的气象因素作为节点,利用空间距离构建边,学习每个位置气象因素的低维表征。3) 负荷预测:将学习到的气象因素表征与历史负荷数据结合,输入到预测模型(如 LSTM)中进行日前负荷预测。4) 可解释性分析:利用 Shapley 值计算每个位置气象因素对预测结果的贡献度。

关键创新:该论文的关键创新在于:1) 提出了基于图神经网络的地理分布式气象因素表征学习方法,有效捕捉了空间相关性。2) 将 Shapley 值应用于负荷预测模型,实现了对不同位置气象因素贡献度的 interpretable 分析。3) 提出了基于蒙特卡洛抽样和加权线性回归的 Shapley 值加速计算方法,降低了计算复杂度。

关键设计:图神经网络采用 GCN 或 GAT 等结构,节点特征为气象因素,边权重根据地理距离计算。损失函数包括表征学习损失和预测损失。Shapley 值计算采用蒙特卡洛抽样,通过采样不同的特征组合来估计每个特征的边际贡献。加权线性回归用于加速 Shapley 值的计算,通过拟合特征与预测结果之间的线性关系来近似 Shapley 值。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在两个真实世界数据集上均取得了显著的预测精度提升,尤其是在极端天气条件下。与传统方法相比,该方法在夏季“累积温度效应”和冬季“温度突变”等场景下,预测误差降低了 5%-10%。此外,Shapley 值分析揭示了不同位置气象因素的重要性与当地 GDP 和支柱产业之间存在显著相关性。

🎯 应用场景

该研究成果可应用于智能电网的日前负荷预测,提高预测精度,降低电网运行成本,并为电网调度提供更可靠的决策依据。此外,该方法的可解释性分析可以帮助电力公司了解不同区域气象因素对负荷的影响,从而制定更精细化的用电策略。该方法还可推广到其他受地理因素影响的预测问题,如交通流量预测、环境污染预测等。

📄 摘要(原文)

Meteorological factors (MF) are crucial in day-ahead load forecasting as they significantly influence the electricity consumption behaviors of consumers. Numerous studies have incorporated MF into the load forecasting model to achieve higher accuracy. Selecting MF from one representative location or the averaged MF as the inputs of the forecasting model is a common practice. However, the difference in MF collected in various locations within a region may be significant, which poses a challenge in selecting the appropriate MF from numerous locations. A representation learning framework is proposed to extract geo-distributed MF while considering their spatial relationships. In addition, this paper employs the Shapley value in the graph-based model to reveal connections between MF collected in different locations and loads. To reduce the computational complexity of calculating the Shapley value, an acceleration method is adopted based on Monte Carlo sampling and weighted linear regression. Experiments on two real-world datasets demonstrate that the proposed method improves the day-ahead forecasting accuracy, especially in extreme scenarios such as the "accumulation temperature effect" in summer and "sudden temperature change" in winter. We also find a significant correlation between the importance of MF in different locations and the corresponding area's GDP and mainstay industry.