Time series Foundation Models based on Physics-Informed Synthetic Histories for Cold-Start Photovoltaic Forecasting

📄 arXiv: 2606.07457v1 📥 PDF

作者: Lorenzo Longarini, Alessandro Rongoni, Simone Silenzi, Emanuele Frontoni, Riccardo Rosati

分类: cs.LG, eess.SP, stat.ML

发布日期: 2026-06-05

备注: To be published in the 2nd ICML Workshop on Foundation Models for Structured Data


💡 一句话要点

提出基于物理信息合成历史的时间序列基础模型以解决冷启动光伏预测问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 光伏预测 时间序列模型 合成数据 冷启动问题 机器学习 气象协变量 能源管理 智能电网

📋 核心要点

  1. 核心问题:现有光伏生产预测方法在冷启动阶段无法有效利用缺乏的现场观测数据,导致预测准确性低。
  2. 方法要点:本文提出一种基于物理信息的合成历史生成方法,结合时间序列基础模型,实现零-shot预测。
  3. 实验或效果:在440个光伏站点的评估中,协变量感知的基础模型显著优于传统基线,TabPFN-TS在真实反馈下实现最低误差。

📝 摘要(中文)

在光伏系统调试阶段,运营商需在目标站点观测数据可用之前进行生产预测,这限制了标准监督预测模型的直接应用。为了解决这一冷启动问题,本文提出了一种零-shot管道,通过植物元数据和气象协变量生成合成生产历史,从而使时间序列基础模型(TSFMs)能够通过推理时条件进行预测。对五种TSFMs在严格的冷启动基线、真实反馈和自我预测反馈策略下进行了基准测试,评估涵盖440个光伏站点及四个数据集和多样气候条件。结果表明,考虑协变量的基础模型在性能上优于基线,提升幅度约为1.7-2倍。

🔬 方法详解

问题定义:本文旨在解决光伏系统在冷启动阶段缺乏现场观测数据时的生产预测问题。现有方法在此情境下表现不佳,无法有效利用可用的元数据和气象信息。

核心思路:提出一种零-shot预测管道,通过合成历史数据生成方法,利用植物元数据和气象协变量生成合成的生产历史,从而为时间序列基础模型提供推理时的条件信息。

技术框架:整体架构包括三个主要模块:1) 合成历史生成模块,利用物理信息生成合成数据;2) 时间序列基础模型模块,进行生产预测;3) 反馈机制模块,评估和调整预测结果。

关键创新:最重要的创新在于通过合成历史的生成,使得时间序列基础模型能够在缺乏真实数据的情况下进行有效预测。这一方法与传统依赖大量历史数据的模型本质上不同。

关键设计:在模型设计中,采用了特定的损失函数来优化预测精度,并通过调整网络结构以适应合成数据的特性,确保模型在不同气候条件下的鲁棒性。具体参数设置和网络结构细节在实验部分进行了详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,考虑协变量的基础模型在440个光伏站点的评估中表现优异,TabPFN-TS在真实反馈下实现了最低的平均绝对误差(MAE为0.514,均方根误差RMSE为0.721 kWh kWp^{-1} d^{-1}),而Chronos-2在自我预测反馈下表现最为稳健。整体性能提升幅度约为1.7-2倍。

🎯 应用场景

该研究的潜在应用领域包括光伏能源管理、智能电网优化和可再生能源预测等。通过提高冷启动阶段的预测准确性,能够帮助光伏运营商更好地规划和调度能源生产,提升系统的整体效率和经济效益。未来,随着技术的进一步发展,该方法有望推广至其他类型的能源预测和管理场景。

📄 摘要(原文)

At commissioning time, Photovoltaic (PV) operators must forecast production before target-site observations are available, limiting the direct use of standard supervised forecasters. This cold-start setting is addressed with a zero-shot pipeline that generates a synthetic production history from plant metadata and meteorological covariates, enabling time-series foundation models (TSFMs) to forecast through inference-time conditioning. Five TSFMs are benchmarked against classical baselines under strict Cold-Start Baseline, Real Feedback, and Self-Forecast Feedback strategies. The evaluation spans $440$ PV sites across four datasets and diverse climate regimes. Covariate-aware foundation models outperform baselines by approximately $1.7-2\times$: TabPFN-TS achieves the lowest error under Real Feedback (MAE $0.514$, RMSE $0.721$ $kWh$ ${kWp}^{-1}$ ${d}^{-1}$), while Chronos-2 is most robust under Self-Forecast Feedback. Performance is largely insensitive to the synthetic-history source, indicating that accuracy is driven more by the availability of plausible temporal context than by the specific generator.