Traffic-Aware Optimal Taxi Placement Using Graph Neural Network-Based Reinforcement Learning

📄 arXiv: 2601.00607v1 📥 PDF

作者: Sonia Khetarpaul, P Y Sharan

分类: cs.LG

发布日期: 2026-01-02


💡 一句话要点

提出基于图神经网络强化学习的交通感知出租车优化调度方法,提升城市出行效率。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图神经网络 强化学习 出租车调度 智能交通 交通优化

📋 核心要点

  1. 传统出租车热点预测模型仅依赖历史需求,忽略了交通拥堵、道路事件和公共事件等动态影响。
  2. 论文提出一种交通感知的图强化学习框架,利用图神经网络编码时空依赖关系,并使用Q学习代理推荐最佳出租车停靠点。
  3. 在模拟数据集上,该模型相比基线方法,乘客等待时间减少约56%,行驶距离减少约38%,显著提升了出行效率。

📝 摘要(中文)

本文提出了一种基于交通感知的图强化学习框架,用于优化城市环境中的出租车调度。该方法将城市道路网络建模为图,其中交叉口为节点,路段为边,节点属性包括历史需求、事件邻近度和实时拥堵评分(来自实时交通API)。利用图神经网络(GNN)嵌入来编码交通网络中的时空依赖关系,然后由Q学习代理使用这些嵌入来推荐最佳出租车热点区域。奖励机制共同优化乘客等待时间、司机行驶距离和避免拥堵。在模拟的德里出租车数据集上的实验表明,与基线随机选择相比,该模型将乘客等待时间减少了约56%,行驶距离减少了38%。该方法适用于多模式交通系统,并可集成到智能城市平台中,以实现实时城市交通优化。

🔬 方法详解

问题定义:论文旨在解决城市出租车调度中,如何根据实时交通状况和乘客需求,优化出租车位置,从而减少乘客等待时间和司机行驶距离的问题。现有方法主要依赖历史数据,无法有效应对动态变化的交通环境,导致调度效率低下。

核心思路:论文的核心思路是将城市道路网络建模为图,利用图神经网络(GNN)学习交通网络中的时空依赖关系,并结合强化学习(RL)算法,训练一个智能体来推荐最佳的出租车停靠位置。通过综合考虑乘客等待时间、司机行驶距离和交通拥堵情况,设计合适的奖励函数,引导智能体学习最优策略。

技术框架:整体框架包括以下几个主要模块:1) 图构建模块:将城市道路网络建模为图,节点表示交叉口,边表示路段,节点属性包括历史需求、事件邻近度和实时拥堵评分。2) GNN嵌入模块:利用GNN学习节点的嵌入表示,捕捉交通网络中的时空依赖关系。3) 强化学习模块:使用Q学习算法,训练一个智能体来选择最佳的出租车停靠位置。智能体的状态是GNN学习到的节点嵌入,动作是选择哪个节点作为出租车停靠点,奖励函数综合考虑乘客等待时间、司机行驶距离和交通拥堵情况。

关键创新:论文的关键创新在于将图神经网络和强化学习相结合,利用GNN学习交通网络中的复杂时空依赖关系,并将其作为强化学习智能体的状态输入,从而使智能体能够更好地感知交通环境,做出更明智的决策。此外,奖励函数的设计也考虑了多个因素,实现了多目标优化。

关键设计:论文使用Graph Convolutional Network (GCN) 作为GNN模型,用于学习节点嵌入。Q学习算法使用ε-greedy策略进行探索,奖励函数设计为:R = -α * WaitingTime - β * TravelDistance - γ * CongestionScore,其中α、β、γ是权重参数,用于平衡不同目标的重要性。数据集是基于德里市的真实地理边界和历史叫车请求模式生成的模拟数据集。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,与基线随机选择策略相比,该模型在模拟的德里出租车数据集上,将乘客平均等待时间减少了约56%,司机平均行驶距离减少了约38%。这表明该方法能够显著提高出租车调度效率,提升乘客出行体验,并降低交通拥堵。

🎯 应用场景

该研究成果可应用于智能城市交通管理平台,实现出租车、网约车等交通工具的实时优化调度,提高城市出行效率,减少交通拥堵。此外,该方法还可扩展到其他交通模式,如公交车、共享单车等,构建更加智能、高效的城市交通系统。该研究对于提升城市可持续发展能力具有重要意义。

📄 摘要(原文)

In the context of smart city transportation, efficient matching of taxi supply with passenger demand requires real-time integration of urban traffic network data and mobility patterns. Conventional taxi hotspot prediction models often rely solely on historical demand, overlooking dynamic influences such as traffic congestion, road incidents, and public events. This paper presents a traffic-aware, graph-based reinforcement learning (RL) framework for optimal taxi placement in metropolitan environments. The urban road network is modeled as a graph where intersections represent nodes, road segments serve as edges, and node attributes capture historical demand, event proximity, and real-time congestion scores obtained from live traffic APIs. Graph Neural Network (GNN) embeddings are employed to encode spatial-temporal dependencies within the traffic network, which are then used by a Q-learning agent to recommend optimal taxi hotspots. The reward mechanism jointly optimizes passenger waiting time, driver travel distance, and congestion avoidance. Experiments on a simulated Delhi taxi dataset, generated using real geospatial boundaries and historic ride-hailing request patterns, demonstrate that the proposed model reduced passenger waiting time by about 56% and reduced travel distance by 38% compared to baseline stochastic selection. The proposed approach is adaptable to multi-modal transport systems and can be integrated into smart city platforms for real-time urban mobility optimization.