Timeseries Foundation Models for Mobility: A Benchmark Comparison with Traditional and Deep Learning Models

作者: Anita Graser

分类: cs.LG

发布日期: 2025-03-31

💡 一句话要点

评估时间序列预训练模型在城市出行预测中的性能，对比传统与深度学习方法。

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 时间序列预测 基础模型 零样本学习 移动预测 自行车共享 城市交通 ARIMA ST-ResNet

📋 核心要点

现有移动数据预测方法，如ARIMA和ST-ResNet，在新任务中需要大量重新训练，泛化能力不足。
该研究探索了时间序列基础模型（如TimeGPT）的零样本预测能力，无需针对特定城市或数据集进行微调。
通过在纽约和维也纳自行车共享数据集上的实验，评估了TimeGPT在不同预测范围内的性能，并分析了其优缺点。

📝 摘要（中文）

人群和流量预测是移动数据科学中被广泛研究的问题。传统的预测方法依赖于诸如ARIMA等统计模型，后来又补充了诸如ST-ResNet等深度学习方法。最近，诸如TimeGPT、Chronos和LagLlama等时间序列预测的基础模型开始出现。这些模型的一个关键优势是它们能够生成零样本预测，从而可以直接应用于新任务而无需重新训练。本研究评估了TimeGPT与传统方法在预测纽约市和奥地利维也纳的两个自行车共享数据集的城市范围移动时间序列方面的性能。模型性能在短期（1小时）、中期（12小时）和长期（24小时）预测范围内进行评估。结果突出了基础模型在移动预测方面的潜力，同时也指出了我们实验的局限性。

🔬 方法详解

问题定义：论文旨在解决城市范围内移动时间序列的预测问题，例如自行车共享系统的使用量预测。传统方法（如ARIMA）和深度学习方法（如ST-ResNet）虽然有效，但通常需要针对特定城市和数据集进行训练或微调，泛化能力有限。当应用于新的城市或场景时，需要大量的重新训练，成本较高。

核心思路：论文的核心思路是利用时间序列基础模型（Foundation Models），例如TimeGPT，实现零样本（Zero-Shot）预测。这些模型在大规模时间序列数据上进行预训练，学习到了通用的时间序列模式，因此可以直接应用于新的移动预测任务，而无需或仅需少量微调。这样可以显著降低模型部署的成本和时间。

技术框架：该研究的技术框架主要包括以下几个步骤：1) 数据准备：收集并预处理纽约市和维也纳的自行车共享数据集，构建城市范围的移动时间序列。2) 模型选择：选择TimeGPT作为时间序列基础模型，并选择ARIMA和ST-ResNet作为对比的传统方法和深度学习方法。3) 预测：使用TimeGPT、ARIMA和ST-ResNet对自行车共享时间序列进行短期（1小时）、中期（12小时）和长期（24小时）的预测。4) 评估：使用合适的指标（例如均方根误差RMSE）评估不同模型的预测性能，并进行比较分析。

关键创新：该研究的关键创新在于探索了时间序列基础模型在移动预测领域的应用潜力。与传统的针对特定任务训练的模型不同，时间序列基础模型通过大规模预训练学习到了通用的时间序列模式，从而具备了零样本预测能力。这使得模型可以快速部署到新的城市或场景，而无需大量的重新训练。

关键设计：该研究的关键设计包括：1) 数据集的选择：选择了纽约市和维也纳的自行车共享数据集，这两个城市具有不同的地理环境和交通模式，可以评估模型的泛化能力。2) 预测范围的选择：选择了短期（1小时）、中期（12小时）和长期（24小时）三种不同的预测范围，以评估模型在不同时间尺度上的性能。3) 评估指标的选择：选择了均方根误差（RMSE）作为评估指标，RMSE可以衡量预测值与真实值之间的偏差程度。

🖼️ 关键图片

📊 实验亮点

实验结果表明，TimeGPT在某些预测范围内表现出与传统方法相当甚至更好的性能，尤其是在零样本预测场景下。虽然TimeGPT在所有实验中没有始终优于其他模型，但它展示了时间序列基础模型在移动预测领域的潜力，并为未来的研究方向提供了有价值的参考。该研究也指出了TimeGPT在处理特定类型的时间序列数据时可能存在的局限性。

🎯 应用场景

该研究成果可应用于城市交通管理、公共交通调度、物流优化等领域。通过利用时间序列基础模型的零样本预测能力，可以快速准确地预测城市范围内的交通流量、出行需求等，从而为城市规划者和交通管理者提供决策支持，提高城市交通效率和可持续性。未来，该方法还可以扩展到其他移动预测任务，例如网约车需求预测、共享单车调度等。

📄 摘要（原文）

Crowd and flow predictions have been extensively studied in mobility data science. Traditional forecasting methods have relied on statistical models such as ARIMA, later supplemented by deep learning approaches like ST-ResNet. More recently, foundation models for time series forecasting, such as TimeGPT, Chronos, and LagLlama, have emerged. A key advantage of these models is their ability to generate zero-shot predictions, allowing them to be applied directly to new tasks without retraining. This study evaluates the performance of TimeGPT compared to traditional approaches for predicting city-wide mobility timeseries using two bike-sharing datasets from New York City and Vienna, Austria. Model performance is assessed across short (1-hour), medium (12-hour), and long-term (24-hour) forecasting horizons. The results highlight the potential of foundation models for mobility forecasting while also identifying limitations of our experiments.

Timeseries Foundation Models for Mobility: A Benchmark Comparison with Traditional and Deep Learning Models

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理