An Explainable, Attention-Enhanced, Bidirectional Long Short-Term Memory Neural Network for Joint 48-Hour Forecasting of Temperature, Irradiance, and Relative Humidity

📄 arXiv: 2508.21109v1 📥 PDF

作者: Georgios Vamvouras, Konstantinos Braimakis, Christos Tzivanidis

分类: cs.LG, cs.AI

发布日期: 2025-08-28

备注: 27 pages, 8 figures


💡 一句话要点

提出一种可解释的、注意力增强的BiLSTM网络,用于联合预测未来48小时的气象数据,以支持智能暖通空调系统的模型预测控制。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 气象预测 深度学习 BiLSTM 注意力机制 模型预测控制 智能暖通空调 可解释性

📋 核心要点

  1. 现有气象预测方法难以有效捕捉复杂的时间依赖性和特征间的相互影响,限制了智能暖通空调系统的优化控制。
  2. 提出一种基于注意力机制增强的双向长短期记忆网络,联合预测温度、太阳辐射和相对湿度,提升预测精度和可解释性。
  3. 实验结果表明,该模型在预测精度上优于现有方法,并通过集成梯度和注意力权重实现了特征贡献的可视化。

📝 摘要(中文)

本文提出了一种深度学习框架,用于预测未来48小时的温度、太阳辐射和相对湿度,以支持智能暖通空调(HVAC)系统中的模型预测控制(MPC)。该方法采用堆叠式双向长短期记忆(BiLSTM)网络,并引入注意力机制,通过联合预测所有三个变量来捕获时间依赖性和跨特征依赖性。使用2019-2022年的历史气象数据(包含编码的循环时间特征)进行训练,并使用2023年的数据评估泛化能力。该模型实现了平均绝对误差:温度1.3摄氏度,太阳辐射31 W/m2,相对湿度6.7个百分点,优于最先进的数值天气预报和机器学习基准。集成梯度用于量化特征贡献,注意力权重揭示了时间模式,从而增强了可解释性。通过结合多变量预测、基于注意力的深度学习和可解释性,这项工作推进了数据驱动的天气预测。所展示的准确性和透明度突出了该框架通过可靠的短期气象预测实现节能建筑控制的潜力。

🔬 方法详解

问题定义:论文旨在解决智能暖通空调系统中,对未来48小时温度、太阳辐射和相对湿度进行精准预测的问题。现有方法,如传统的数值天气预报和一些机器学习模型,在捕捉复杂的时间依赖性和特征间的相互影响方面存在不足,导致预测精度不高,难以满足模型预测控制(MPC)的需求。

核心思路:论文的核心思路是利用深度学习模型,特别是双向长短期记忆网络(BiLSTM),来学习历史气象数据中的时间序列模式。通过引入注意力机制,模型能够自动关注对预测结果影响更大的时间步和特征,从而提高预测精度。联合预测多个气象变量,可以捕捉它们之间的相互依赖关系,进一步提升预测性能。

技术框架:整体框架包含数据预处理、模型构建、训练和评估四个主要阶段。数据预处理包括数据清洗、归一化和特征工程,其中时间特征被编码成循环形式。模型构建阶段,使用堆叠的BiLSTM层来提取时间特征,然后通过注意力机制对不同时间步的特征进行加权。最后,使用全连接层输出预测结果。训练阶段,使用历史气象数据训练模型,并使用验证集进行调参。评估阶段,使用测试集评估模型的泛化能力。

关键创新:该论文的关键创新在于将注意力机制引入到BiLSTM网络中,用于联合预测多个气象变量。注意力机制使得模型能够自动学习不同时间步和特征的重要性,从而提高预测精度和可解释性。此外,通过集成梯度方法,可以量化每个特征对预测结果的贡献,进一步增强模型的可解释性。

关键设计:模型采用堆叠的BiLSTM结构,具体层数未知,但堆叠结构有助于提取更深层次的时间特征。时间特征采用循环编码方式,例如使用sin和cos函数对小时、天、月份等进行编码,使得模型能够更好地理解时间的周期性。损失函数未知,但通常会采用均方误差或平均绝对误差等回归损失函数。注意力机制的具体实现方式未知,但通常会采用加性注意力或乘性注意力等形式。

📊 实验亮点

该模型在预测未来48小时的温度、太阳辐射和相对湿度方面取得了显著成果,平均绝对误差分别为1.3摄氏度、31 W/m2和6.7个百分点,优于现有的数值天气预报和机器学习基准。通过集成梯度和注意力权重,实现了特征贡献的可视化,增强了模型的可解释性。

🎯 应用场景

该研究成果可应用于智能建筑的暖通空调系统,通过精准的气象预测,实现能源消耗的优化控制,降低运营成本,提高能源利用效率。此外,该方法还可以推广到其他需要短期气象预测的领域,如农业、交通运输和可再生能源管理等。

📄 摘要(原文)

This paper presents a Deep Learning (DL) framework for 48-hour forecasting of temperature, solar irradiance, and relative humidity to support Model Predictive Control (MPC) in smart HVAC systems. The approach employs a stacked Bidirectional Long Short-Term Memory (BiLSTM) network with attention, capturing temporal and cross-feature dependencies by jointly predicting all three variables. Historical meteorological data (2019-2022) with encoded cyclical time features were used for training, while 2023 data evaluated generalization. The model achieved Mean Absolute Errors of 1.3 degrees Celsius (temperature), 31 W/m2 (irradiance), and 6.7 percentage points (humidity), outperforming state-of-the-art numerical weather prediction and machine learning benchmarks. Integrated Gradients quantified feature contributions, and attention weights revealed temporal patterns, enhancing interpretability. By combining multivariate forecasting, attention-based DL, and explainability, this work advances data-driven weather prediction. The demonstrated accuracy and transparency highlight the framework's potential for energy-efficient building control through reliable short-term meteorological forecasting.