Parking Availability Prediction via Fusing Multi-Source Data with A Self-Supervised Learning Enhanced Spatio-Temporal Inverted Transformer

📄 arXiv: 2509.04362v1 📥 PDF

作者: Yin Huang, Yongqi Dong, Youhua Tang, Li Li

分类: cs.LG, cs.AI, stat.ML

发布日期: 2025-09-04

备注: 25 pages, 5 figures, under review for journal publication


💡 一句话要点

提出SST-iTransformer,融合多源数据和自监督学习,提升停车位可用性预测精度。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 停车位预测 时空预测 自监督学习 Transformer 多源数据融合

📋 核心要点

  1. 现有方法在建模时空依赖性和利用多源数据方面存在局限性,难以准确预测停车位可用性。
  2. 提出SST-iTransformer,通过自监督学习增强时空表示,并设计双分支注意力机制建模复杂依赖关系。
  3. 实验结果表明,SST-iTransformer在真实数据集上优于现有模型,显著降低了预测误差。

📝 摘要(中文)

针对城市停车难题,本研究提出一种新颖的SST-iTransformer方法,旨在提升停车位可用性预测的准确性和有效性。该方法利用K-means聚类建立停车集群区域(PCZ),提取并整合来自多种交通模式(地铁、公交、网约车和出租车)的交通需求特征。SST-iTransformer在iTransformer基础上进行升级,集成了基于掩码重建的自监督时空表示学习预训练任务,并采用创新的双分支注意力机制:序列注意力通过分块操作捕获长期时间依赖性,通道注意力通过反转维度建模跨变量交互。在成都真实数据集上的实验表明,SST-iTransformer优于其他深度学习模型,实现了最低的均方误差(MSE)和具有竞争力的平均绝对误差(MAE)。消融研究揭示了不同数据源的相对重要性:网约车数据增益最大,其次是出租车,而固定线路交通特征(公交/地铁)的贡献较小。空间相关性分析进一步证实,排除PCZ内相关停车场的历史数据会导致性能显著下降,突出了建模空间依赖性的重要性。

🔬 方法详解

问题定义:论文旨在解决城市停车位可用性预测问题。现有方法难以有效建模复杂的时空依赖关系,并且对多源异构数据的融合利用不足,导致预测精度不高。

核心思路:论文的核心思路是利用自监督学习增强时空表示能力,并设计一种能够有效捕获长期时间依赖和跨变量交互的Transformer结构。通过融合多种交通模式的数据,更全面地反映停车需求,从而提高预测准确性。

技术框架:整体框架包括以下几个主要步骤:1) 使用K-means聚类将停车场划分为停车集群区域(PCZ);2) 提取并整合来自多种交通模式(地铁、公交、网约车和出租车)的交通需求特征;3) 使用SST-iTransformer模型进行训练和预测。SST-iTransformer模型是基于iTransformer的改进,包含自监督学习模块和双分支注意力机制。

关键创新:论文的关键创新在于:1) 提出了基于掩码重建的自监督学习方法,用于增强时空表示能力;2) 设计了一种双分支注意力机制,包括序列注意力和通道注意力,分别用于捕获长期时间依赖和跨变量交互。这种双分支结构能够更全面地建模复杂的时空关系。

关键设计:自监督学习模块采用掩码重建任务,随机掩盖部分输入数据,然后让模型预测被掩盖的数据。序列注意力通过分块操作处理时间序列,从而捕获长期依赖关系。通道注意力通过反转维度建模跨变量之间的交互。损失函数包括预测损失和自监督学习损失,通过加权求和进行优化。

📊 实验亮点

在成都真实数据集上的实验表明,SST-iTransformer在均方误差(MSE)指标上优于Informer、Autoformer、Crossformer和iTransformer等基线模型,取得了state-of-the-art的性能。消融实验表明,融合网约车数据对性能提升最大,其次是出租车数据。空间相关性分析验证了建模空间依赖性的重要性。

🎯 应用场景

该研究成果可应用于智能交通管理系统,为用户提供实时的停车位可用性预测,缓解城市停车难题。此外,该方法也可扩展到其他时空预测任务,如交通流量预测、电力负荷预测等,具有广泛的应用前景。

📄 摘要(原文)

The rapid growth of private car ownership has worsened the urban parking predicament, underscoring the need for accurate and effective parking availability prediction to support urban planning and management. To address key limitations in modeling spatio-temporal dependencies and exploiting multi-source data for parking availability prediction, this study proposes a novel approach with SST-iTransformer. The methodology leverages K-means clustering to establish parking cluster zones (PCZs), extracting and integrating traffic demand characteristics from various transportation modes (i.e., metro, bus, online ride-hailing, and taxi) associated with the targeted parking lots. Upgraded on vanilla iTransformer, SST-iTransformer integrates masking-reconstruction-based pretext tasks for self-supervised spatio-temporal representation learning, and features an innovative dual-branch attention mechanism: Series Attention captures long-term temporal dependencies via patching operations, while Channel Attention models cross-variate interactions through inverted dimensions. Extensive experiments using real-world data from Chengdu, China, demonstrate that SST-iTransformer outperforms baseline deep learning models (including Informer, Autoformer, Crossformer, and iTransformer), achieving state-of-the-art performance with the lowest mean squared error (MSE) and competitive mean absolute error (MAE). Comprehensive ablation studies quantitatively reveal the relative importance of different data sources: incorporating ride-hailing data provides the largest performance gains, followed by taxi, whereas fixed-route transit features (bus/metro) contribute marginally. Spatial correlation analysis further confirms that excluding historical data from correlated parking lots within PCZs leads to substantial performance degradation, underscoring the importance of modeling spatial dependencies.