Benchmarking Time Series Forecasting Models: From Statistical Techniques to Foundation Models in Real-World Applications
作者: Issar Arab, Rodrigo Benitez
分类: cs.LG, cs.AI
发布日期: 2025-02-05
💡 一句话要点
评估时间序列预测模型:从统计方法到基础模型在餐饮业的实际应用
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 时间序列预测 基础模型 零样本学习 机器学习 深度学习 PySpark Pandas
📋 核心要点
- 大规模分布式系统中,餐饮业运营智能对时间序列预测提出挑战,现有方法难以兼顾准确性和可扩展性。
- 研究核心在于评估多种时间序列预测模型,包括统计模型、机器学习模型、深度学习模型和新兴的基础模型。
- 实验结果表明,机器学习元模型表现优异,基础模型在零样本推理下也展现出竞争力,混合PySpark-Pandas方法实现了水平扩展。
📝 摘要(中文)
时间序列预测对于酒店行业的运营智能至关重要,尤其是在大规模分布式系统中。本研究评估了统计、机器学习(ML)、深度学习和基础模型在预测每小时销售额方面的性能,预测范围为14天,使用了来自德国数千家餐厅网络的真实数据。该预测解决方案包括天气状况、日历事件和时间模式等特征。结果表明,基于ML的元模型表现出色,并突出了Chronos和TimesFM等基础模型的新兴潜力,它们仅利用预训练模型(零样本推理)即可提供具有竞争力的性能,且特征工程量极小。此外,混合PySpark-Pandas方法被证明是实现大规模部署中水平可扩展性的稳健解决方案。
🔬 方法详解
问题定义:论文旨在解决大规模餐饮网络中,如何准确且高效地预测未来14天每小时的销售额。现有方法在处理海量数据和复杂特征时,面临准确性不足、可扩展性差以及特征工程繁琐等问题。尤其是在需要快速部署和适应新环境时,传统方法的局限性更加明显。
核心思路:论文的核心思路是综合评估多种时间序列预测模型,并探索基础模型在零样本学习场景下的潜力。通过对比统计模型、机器学习模型、深度学习模型和基础模型的性能,找到在准确性、可扩展性和易用性之间取得平衡的最佳方案。同时,利用混合PySpark-Pandas架构实现大规模数据的并行处理。
技术框架:整体框架包括数据预处理、特征工程、模型训练与评估以及部署四个主要阶段。数据预处理阶段清洗和转换原始销售数据,并整合天气、日历等外部数据。特征工程阶段提取时间序列特征、外部特征以及组合特征。模型训练与评估阶段,训练和评估各种时间序列预测模型,包括统计模型(如ARIMA)、机器学习模型(如XGBoost)、深度学习模型(如LSTM)和基础模型(如Chronos和TimesFM)。部署阶段,利用混合PySpark-Pandas架构实现模型的并行推理和预测。
关键创新:论文的关键创新在于对基础模型在零样本时间序列预测中的潜力进行了评估,并验证了其在实际应用中的可行性。此外,混合PySpark-Pandas架构的引入,为大规模时间序列预测提供了可扩展的解决方案。
关键设计:论文的关键设计包括:1) 特征工程方面,考虑了时间序列的自相关性、季节性和趋势性,以及天气、日历等外部因素的影响。2) 模型选择方面,选择了具有代表性的统计模型、机器学习模型、深度学习模型和基础模型,以便进行全面比较。3) 评估指标方面,采用了常用的时间序列预测评估指标,如均方根误差(RMSE)和平均绝对误差(MAE)。4) 混合PySpark-Pandas架构方面,利用PySpark处理大规模数据,利用Pandas进行高效的特征工程和模型推理。
📊 实验亮点
实验结果表明,基于机器学习的元模型(如XGBoost)在预测准确性方面表现出色。更重要的是,基础模型Chronos和TimesFM在零样本推理下,仅使用预训练模型即可达到与传统方法相当的性能,显著减少了特征工程的工作量。此外,混合PySpark-Pandas架构成功实现了大规模数据的并行处理,验证了其在大规模部署中的可行性。
🎯 应用场景
该研究成果可广泛应用于餐饮、零售、物流等行业的销售预测、库存管理和运营优化。通过准确预测未来需求,企业可以更好地规划资源、降低成本、提高效率。此外,基础模型在零样本学习方面的潜力,使得该方法能够快速部署到新的业务场景中,具有重要的实际应用价值和商业前景。
📄 摘要(原文)
Time series forecasting is essential for operational intelligence in the hospitality industry, and particularly challenging in large-scale, distributed systems. This study evaluates the performance of statistical, machine learning (ML), deep learning, and foundation models in forecasting hourly sales over a 14-day horizon using real-world data from a network of thousands of restaurants across Germany. The forecasting solution includes features such as weather conditions, calendar events, and time-of-day patterns. Results demonstrate the strong performance of ML-based meta-models and highlight the emerging potential of foundation models like Chronos and TimesFM, which deliver competitive performance with minimal feature engineering, leveraging only the pre-trained model (zero-shot inference). Additionally, a hybrid PySpark-Pandas approach proves to be a robust solution for achieving horizontal scalability in large-scale deployments.