Foundation Models for Demand Forecasting via Dual-Strategy Ensembling

📄 arXiv: 2507.22053v1 📥 PDF

作者: Wei Yang, Defu Cao, Yan Liu

分类: cs.LG, cs.AI

发布日期: 2025-07-29


💡 一句话要点

提出双策略集成框架,提升基础模型在需求预测中的准确性和泛化性

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 需求预测 基础模型 集成学习 层级集成 架构集成 时间序列预测 供应链管理 销售预测

📋 核心要点

  1. 现有基础模型在需求预测中存在架构僵化和领域泛化能力不足的问题,难以适应复杂多变的实际场景。
  2. 论文提出双策略集成框架,通过层级集成捕获局部模式,利用架构集成降低偏差,提升预测的准确性和稳定性。
  3. 实验结果表明,该方法在多个数据集上优于现有基线,并在层级预测和零样本预测中表现出显著的性能提升。

📝 摘要(中文)

精确的需求预测对于优化供应链至关重要,但由于层级复杂性、领域偏移和不断变化的外部因素,这在实践中仍然很困难。虽然最近的基础模型在时间序列预测方面显示出强大的潜力,但它们通常存在架构僵化和分布变化下鲁棒性有限的问题。本文提出了一个统一的集成框架,以提高基础模型在实际供应链中销售预测的性能。我们的方法结合了两种互补策略:(1)层级集成(HE),它通过语义级别(例如,商店、类别、部门)划分训练和推理,以捕获局部模式;(2)架构集成(AE),它整合来自不同模型主干的预测,以减轻偏差并提高稳定性。我们在M5基准和三个外部销售数据集上进行了广泛的实验,涵盖了领域内和零样本预测。结果表明,我们的方法始终优于强大的基线,提高了跨层级级别的准确性,并提供了一种简单而有效的机制,用于提高复杂预测环境中的泛化能力。

🔬 方法详解

问题定义:论文旨在解决实际供应链中需求预测的准确性和泛化性问题。现有方法,特别是基于基础模型的预测方法,在面对层级复杂性、领域偏移和不断变化的外部因素时,表现出架构僵化和鲁棒性不足的缺点,难以适应真实场景的需求。

核心思路:论文的核心思路是利用集成学习的思想,结合层级集成(HE)和架构集成(AE)两种互补策略,构建一个统一的集成框架。通过HE捕获不同语义级别的局部模式,通过AE整合不同模型主干的预测结果,从而提高预测的准确性和稳定性。

技术框架:该框架包含两个主要模块:层级集成(HE)和架构集成(AE)。HE首先根据语义级别(如商店、类别、部门)对数据进行划分,然后在每个级别上训练和推理模型。AE则集成来自不同模型主干(如Transformer、LSTM等)的预测结果。最终的预测结果通过加权平均或更复杂的集成方法(如Stacking)得到。

关键创新:该方法最重要的创新点在于双策略集成框架的设计,它将层级信息和模型多样性相结合,从而有效地提高了预测的准确性和泛化性。与传统的单一模型或简单的集成方法相比,该框架能够更好地适应复杂多变的实际场景。

关键设计:在HE中,关键在于如何选择合适的语义级别进行划分,以及如何有效地利用不同级别的信息。在AE中,关键在于如何选择具有互补性的模型主干,以及如何设计有效的集成策略。论文中可能涉及加权平均的权重设置,或者Stacking中使用的元学习器的选择等技术细节。

🖼️ 关键图片

fig_0

📊 实验亮点

实验结果表明,该方法在M5基准和三个外部销售数据集上均优于现有基线。在层级预测中,该方法能够提高各个层级的预测准确性。在零样本预测中,该方法也表现出良好的泛化能力,证明了其在复杂预测环境中的有效性。具体的性能提升数据未知,需要在论文中查找。

🎯 应用场景

该研究成果可广泛应用于零售、电商、物流等领域的供应链管理中,帮助企业更准确地预测产品需求,优化库存管理,降低运营成本,提高客户满意度。此外,该方法也可推广到其他时间序列预测任务中,如能源需求预测、金融市场预测等。

📄 摘要(原文)

Accurate demand forecasting is critical for supply chain optimization, yet remains difficult in practice due to hierarchical complexity, domain shifts, and evolving external factors. While recent foundation models offer strong potential for time series forecasting, they often suffer from architectural rigidity and limited robustness under distributional change. In this paper, we propose a unified ensemble framework that enhances the performance of foundation models for sales forecasting in real-world supply chains. Our method combines two complementary strategies: (1) Hierarchical Ensemble (HE), which partitions training and inference by semantic levels (e.g., store, category, department) to capture localized patterns; and (2) Architectural Ensemble (AE), which integrates predictions from diverse model backbones to mitigate bias and improve stability. We conduct extensive experiments on the M5 benchmark and three external sales datasets, covering both in-domain and zero-shot forecasting. Results show that our approach consistently outperforms strong baselines, improves accuracy across hierarchical levels, and provides a simple yet effective mechanism for boosting generalization in complex forecasting environments.