Multi-Graph Inductive Representation Learning for Large-Scale Urban Rail Demand Prediction under Disruptions

📄 arXiv: 2408.15619v2 📥 PDF

作者: Dang Viet Anh Nguyen, J. Victor Flensburg, Fabrizio Cerreto, Bianca Pascariu, Paola Pellegrini, Carlos Lima Azevedo, Filipe Rodrigues

分类: cs.LG

发布日期: 2024-08-28 (更新: 2025-05-26)

备注: 23 pages, 3 figures


💡 一句话要点

提出mGraphSAGE模型,用于应对扰动下大规模城市轨道交通需求预测。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 城市轨道交通 需求预测 图神经网络 归纳表示学习 运营扰动

📋 核心要点

  1. 现有方法难以兼顾大规模轨道交通网络的需求预测精度与可扩展性,尤其是在运营扰动下。
  2. mGraphSAGE模型通过构建多图结构,将OD对作为节点,利用图神经网络学习节点表示,从而捕捉OD间的复杂关系。
  3. 实验表明,mGraphSAGE在哥本哈根的URT网络中优于其他机器学习方法,尤其在列车延误和取消等扰动情况下。

📝 摘要(中文)

随着城市扩张,城市轨道交通(URT)网络也显著增长。需求预测在规划、调度、车队管理和运营决策中至关重要。本研究提出一种名为多图归纳表示学习(mGraphSAGE)的OD需求预测模型,用于应对运营不确定性下的大规模URT网络。主要贡献包括:通过同时依赖多个图来增强预测结果并确保大型网络的可扩展性,其中每个OD对都是图上的一个节点,并且具有不同的OD关系,例如时间和空间相关性;展示了在日常运营的需求预测中包含列车延误和取消等运营不确定性作为输入的重要性。该模型在丹麦哥本哈根的三个不同规模的URT网络上进行了验证。实验结果表明,通过利用来自相邻OD的信息并通过采样和聚合学习节点表示,mGraphSAGE特别适用于大规模URT网络中的OD需求预测,优于参考机器学习方法。此外,在列车取消和延误期间,mGraphSAGE与其他方法之间的性能差距相比正常运行条件有所改善,证明了其利用系统可靠性信息来预测不确定性下的OD需求的能力。

🔬 方法详解

问题定义:论文旨在解决大规模城市轨道交通网络中,在运营扰动(如列车延误和取消)下的OD(Origin-Destination)需求预测问题。现有方法在处理大规模网络时,难以兼顾预测精度和可扩展性,并且对运营扰动的鲁棒性不足。

核心思路:核心思路是利用多图归纳表示学习,将每个OD对视为图中的一个节点,并构建多个图来表示不同的OD关系(如时间相关性和空间相关性)。通过图神经网络学习节点的表示,从而捕捉OD对之间的复杂依赖关系,并提高模型对运营扰动的适应性。

技术框架:整体框架包括以下几个主要步骤:1) 数据预处理:收集URT网络的历史OD需求数据以及运营扰动信息(列车延误和取消)。2) 图构建:构建多个图,每个图表示一种OD关系。3) 节点表示学习:使用GraphSAGE算法学习每个OD对的节点表示。4) 需求预测:使用学习到的节点表示作为输入,预测未来的OD需求。

关键创新:关键创新在于使用多图结构来表示OD对之间的多种关系,并利用GraphSAGE算法进行归纳式学习。与传统的基于静态图的方法相比,mGraphSAGE能够更好地捕捉OD对之间的复杂依赖关系,并具有更好的可扩展性。此外,模型考虑了运营扰动信息,提高了模型在实际运营环境中的鲁棒性。

关键设计:论文中关键的设计包括:1) 多图的构建方式,如何选择和表示不同的OD关系。2) GraphSAGE算法的采样和聚合策略,如何有效地学习节点表示。3) 损失函数的设计,如何平衡预测精度和模型复杂度。具体参数设置和网络结构在论文中未详细说明,属于未知信息。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,mGraphSAGE模型在哥本哈根的URT网络中优于其他机器学习方法。尤其是在列车取消和延误等扰动情况下,mGraphSAGE的性能提升更为显著,证明了其能够有效利用系统可靠性信息进行OD需求预测。具体的性能数据和提升幅度在论文中未给出明确的量化指标,属于未知信息。

🎯 应用场景

该研究成果可应用于城市轨道交通的智能运营与管理,例如客流预测、线路优化、应急调度等。通过准确预测客流需求,可以优化列车运行计划,减少乘客等待时间,提高运营效率。在突发事件发生时,可以根据预测结果进行快速响应,调整运力部署,保障乘客出行。

📄 摘要(原文)

With the expansion of cities over time, URT (Urban Rail Transit) networks have also grown significantly. Demand prediction plays an important role in supporting planning, scheduling, fleet management, and other operational decisions. In this study, we propose an Origin-Destination (OD) demand prediction model called Multi-Graph Inductive Representation Learning (mGraphSAGE) for large-scale URT networks under operational uncertainties. Our main contributions are twofold: we enhance prediction results while ensuring scalability for large networks by relying simultaneously on multiple graphs, where each OD pair is a node on a graph and distinct OD relationships, such as temporal and spatial correlations; we show the importance of including operational uncertainties such as train delays and cancellations as inputs in demand prediction for daily operations. The model is validated on three different scales of the URT network in Copenhagen, Denmark. Experimental results show that by leveraging information from neighboring ODs and learning node representations via sampling and aggregation, mGraphSAGE is particularly suitable for OD demand prediction in large-scale URT networks, outperforming reference machine learning methods. Furthermore, during periods with train cancellations and delays, the performance gap between mGraphSAGE and other methods improves compared to normal operating conditions, demonstrating its ability to leverage system reliability information for predicting OD demand under uncertainty.