Barrier-enforced multi-objective optimization for direct point and sharp interval forecasting
作者: Worachit Amnuaypongsa, Yotsapat Suparanonrat, Pana Wanitchollakit, Jitkomut Songsiri
分类: cs.LG, eess.SY
发布日期: 2026-04-20
备注: 25 pages, 12 figures, 3 tables
💡 一句话要点
提出基于障碍函数的自适应多目标优化方法,用于直接预测点和锐利区间。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多目标优化 概率预测 区间预测 时间序列预测 太阳辐照度预测
📋 核心要点
- 现有概率预测方法依赖手动调整权重平衡点预测和区间预测,缺乏自适应性。
- 提出一种基于多目标优化的框架,利用多梯度下降自适应选择权重,平衡预测精度和覆盖率。
- 实验表明,该方法在太阳辐照度预测中优于现有损失函数,并与先进的LSTM和Transformer模型具有竞争力。
📝 摘要(中文)
本文提出了一种多步概率预测框架,该框架使用单个基于神经网络的模型来同时生成点预测和区间预测(PI)。我们的方法通过模型结构设计确保非交叉预测区间,严格满足目标覆盖概率(PICP),同时最大化锐度。与依赖于手动调整标量化损失函数权重的现有方法不同,我们将点预测和PI预测视为一个多目标优化问题,利用多梯度下降自适应地选择最佳权重。关键创新包括:一种基于扩展对数障碍的新型PI损失函数,具有自适应超参数以保证覆盖率;一种混合架构,具有共享时间模型和特定于horizon的子模型;以及一种训练策略。所提出的损失是尺度独立的,并且普遍适用;结合我们的训练算法,该框架消除了用于平衡多个目标时的试错超参数调整。通过日内太阳辐照度预测应用验证,结果表明,我们提出的损失始终优于当前文献中的损失,通过最窄的PI宽度实现目标覆盖率。此外,与LSTM编码器-解码器和Transformer架构(包括那些使用Chronos基础模型增强的架构)相比,我们的方法仍然具有很强的竞争力,并且可以无缝地适应任何深度学习结构。
🔬 方法详解
问题定义:论文旨在解决多步概率预测问题,即同时生成准确的点预测和锐利的预测区间(PI)。现有方法通常依赖于手动调整标量化损失函数的权重来平衡点预测的准确性和PI的覆盖率,这需要大量的试错,并且难以保证最优性能。此外,确保预测区间不交叉也是一个挑战。
核心思路:论文的核心思路是将点预测和PI预测视为一个多目标优化问题,并利用多梯度下降算法自适应地选择每个目标的权重。通过引入基于扩展对数障碍的PI损失函数,可以严格保证PI的覆盖概率,同时最大化PI的锐度。这种方法避免了手动调整权重的需要,并能够更有效地平衡多个目标。
技术框架:整体框架包括一个共享的时间模型和一个或多个特定于预测horizon的子模型。共享时间模型用于提取输入时间序列的特征,而horizon特定的子模型则用于生成特定horizon的点预测和PI。训练过程使用多梯度下降算法,根据每个目标的梯度方向自适应地更新模型参数。
关键创新:论文的关键创新在于以下几点:1) 提出了一种基于扩展对数障碍的新型PI损失函数,该函数具有自适应超参数,可以严格保证PI的覆盖概率。2) 将点预测和PI预测视为一个多目标优化问题,并利用多梯度下降算法自适应地选择每个目标的权重。3) 提出了一种混合架构,该架构具有共享时间模型和特定于horizon的子模型,可以有效地处理多步预测问题。
关键设计:关键设计包括:1) 扩展对数障碍损失函数:该损失函数包含一个自适应超参数,用于控制覆盖概率的惩罚力度。2) 多梯度下降算法:该算法根据每个目标的梯度方向自适应地更新模型参数,从而平衡多个目标。3) 混合架构:共享时间模型可以使用各种时间序列模型,如LSTM或Transformer。horizon特定的子模型可以使用简单的全连接层。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在日内太阳辐照度预测任务中,能够以最窄的PI宽度实现目标覆盖率,优于现有文献中的损失函数。与LSTM编码器-解码器和Transformer架构相比,该方法具有很强的竞争力,并且可以无缝地适应任何深度学习结构。这表明该方法具有良好的泛化能力和实用价值。
🎯 应用场景
该研究成果可广泛应用于需要同时进行点预测和区间预测的领域,例如能源预测(太阳能、风能)、金融时间序列预测、需求预测等。通过提供准确的概率预测,可以帮助决策者更好地评估风险,制定更有效的策略,并优化资源分配。该方法无需手动调参的特性,也使其更易于部署和应用。
📄 摘要(原文)
This paper proposes a multi-step probabilistic forecasting framework using a single neural-network based model to generate simultaneous point and interval forecasts. Our approach ensures non-crossing prediction intervals (PIs) through a model structure design that strictly satisfy a target coverage probability (PICP) while maximizing sharpness. Unlike existing methods that rely on manual weight tuning for scalarized loss functions, we treat point and PI forecasting as a multi-objective optimization problem, utilizing multi-gradient descent to adaptively select optimal weights. Key innovations include a new PI loss function based on an extended log-barrier with an adaptive hyperparameter to guarantee the coverage, a hybrid architecture featuring a shared temporal model with horizon-specific submodels, and a training strategy. The proposed loss is scale-independent and universally applicable; combined with our training algorithm, the framework eliminates trial-and-error hyperparameter tuning for balancing multiple objectives. Validated by an intra-day solar irradiance forecasting application, results demonstrate that our proposed loss consistently outperforms those in current literature by achieving target coverage with the narrowest PI widths. Furthermore, when compared against LSTM encoder-decoder and Transformer architectures--including those augmented with Chronos foundation models--our method remains highly competitive and can be seamlessly adapted to any deep learning structure.