FETS Benchmark: Foundation Models Outperform Dataset-specific Machine Learning in Energy Time Series Forecasting

作者: Marco Obermeier, Marco Pruckner, Florian Haselbeck, Andreas Zeiselmair

分类: cs.LG, cs.AI, cs.CE

发布日期: 2026-04-24

💡 一句话要点

FETS基准测试表明：能源时间序列预测中，预训练模型优于特定数据集的机器学习方法

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 能源时间序列预测 预训练模型 基准测试 深度学习 时间序列分析

📋 核心要点

能源时间序列预测面临数据依赖性强、泛化能力弱的挑战，传统方法需要大量特定数据集训练。
论文提出FETS基准，探索预训练模型在能源预测中的应用，旨在学习通用模式并提升模型泛化能力。
实验结果表明，预训练模型在各种能源预测任务中均优于传统机器学习方法，尤其是在数据受限场景下。

📝 摘要（中文）

为了应对气候中性能源系统的转型，准确的能源时间序列预测至关重要。然而，这在很大程度上仍然是一项特定于数据集的任务，需要全面的训练数据，限制了可扩展性，并导致高昂的模型开发和维护成本。最近，旨在通过广泛的预训练学习通用模式的预训练模型在多个预测任务中表现出卓越的性能。尽管它们取得了成功，并且在解决能源预测方面的挑战方面具有强大的潜力，但它们在该领域的应用在很大程度上仍未被探索。我们通过提出能源时间序列预测中的预训练模型（FETS）基准来解决这一差距。我们（1）围绕三个主要维度：利益相关者、属性和数据类别，提供能源预测用例的结构化概述；（2）在9个数据类别中收集和分析54个数据集，并以典型的利益相关者利益为指导；（3）在不同的预测设置中，针对经典机器学习方法对预训练模型进行基准测试。预训练模型在所有设置和数据类别中始终优于特定于数据集的优化机器学习方法，尽管后者在训练期间已经看到了完整的历史目标数据。特别是，协变量知情的预训练模型实现了最强的性能。进一步的分析表明，预测性能与谱熵之间存在很强的相关性，性能在超过一定上下文长度后会饱和，并且在更高的聚合级别（如国家负荷、区域供热和电网数据）上性能得到改善。总的来说，我们的发现突出了预训练模型作为能源领域可扩展和通用的预测解决方案的强大潜力，尤其是在数据受限和隐私敏感的环境中。

🔬 方法详解

问题定义：能源时间序列预测通常依赖于特定数据集训练的机器学习模型，这些模型泛化能力差，难以适应新的数据集或场景。现有方法需要大量标注数据，且模型开发和维护成本高昂。

核心思路：利用预训练模型强大的表征学习能力，通过大规模预训练学习通用的时间序列模式，从而减少对特定数据集的依赖，提高模型在不同能源预测任务中的泛化能力。协变量信息也被纳入模型，以进一步提升预测精度。

技术框架：FETS基准包含三个主要部分：1）能源预测用例的结构化概述，涵盖利益相关者、属性和数据类别；2）收集和分析了来自9个数据类别的54个数据集；3）在不同的预测设置中，对预训练模型和经典机器学习方法进行了基准测试。整体流程包括数据预处理、模型训练与评估、结果分析等环节。

关键创新：该研究的关键创新在于首次系统性地评估了预训练模型在能源时间序列预测中的性能，并证明了其优于传统机器学习方法的潜力。此外，研究还分析了预测性能与谱熵、上下文长度和聚合级别之间的关系，为预训练模型在能源领域的应用提供了指导。

关键设计：论文使用了多种预训练模型，包括Transformer和N-BEATS等，并针对能源时间序列的特点进行了调整。协变量信息通过嵌入层融入模型输入。损失函数采用常用的均方误差（MSE）或平均绝对误差（MAE）。上下文长度的选择对模型性能有重要影响，实验中探索了不同上下文长度的影响。

📊 实验亮点

实验结果表明，预训练模型在所有设置和数据类别中均优于特定于数据集的优化机器学习方法。协变量知情的预训练模型表现最佳。研究还发现，预测性能与谱熵之间存在很强的相关性，性能在超过一定上下文长度后会饱和，并且在更高的聚合级别上性能得到改善。

🎯 应用场景

该研究成果可应用于智能电网、能源管理系统、可再生能源发电预测等领域。通过利用预训练模型，可以降低模型开发成本，提高预测精度，从而优化能源资源的分配和利用，促进能源系统的可持续发展。尤其在数据稀缺或隐私敏感的场景下，预训练模型的优势更加明显。

📄 摘要（原文）

Driven by the transition towards a climate-neutral energy system, accurate energy time series forecasting is critical for planning and operation. Yet, it remains largely a dataset-specific task, requiring comprehensive training data, limiting scalability, and resulting in high model development and maintenance effort. Recently, foundation models that aim to learn generalizable patterns via extensive pretraining have shown superior performance in multiple prediction tasks. Despite their success and strong potential to address challenges in energy forecasting, their application in this domain remains largely unexplored. We address this gap by presenting the Foundation Models in Energy Time Series Forecasting (FETS) benchmark. We (1) provide a structured overview of energy forecasting use cases along three main dimensions: stakeholders, attributes, and data categories; (2) collect and analyze 54 datasets across 9 data categories, guided by typical stakeholder interests; (3) benchmark foundation models against classical machine learning approaches across different forecasting settings. Foundation models consistently outperform dataset-specific optimized machine learning approaches across all settings and data categories, despite the latter having seen the full historic target data during training. In particular, covariate-informed foundation models achieve the strongest performance. Further analysis reveals a strong correlation between predictive performance and spectral entropy, performance saturation beyond a certain context length, and improved performance at higher aggregation levels such as national load, district heating, and power grid data. Overall, our findings highlight the strong potential of foundation models as scalable and generalizable forecasting solutions for the energy domain, particularly in data-constrained and privacy-sensitive settings.

FETS Benchmark: Foundation Models Outperform Dataset-specific Machine Learning in Energy Time Series Forecasting

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理