Real-Time Communication-Aware Ride-Sharing Route Planning for Urban Air Mobility: A Multi-Source Hybrid Attention Reinforcement Learning Approach

📄 arXiv: 2507.14249v1 📥 PDF

作者: Yuejiao Xie, Maonan Wang, Di Zhou, Man-On Pun, Zhu Han

分类: cs.RO, cs.AI

发布日期: 2025-07-18


💡 一句话要点

提出基于多源混合注意力强化学习的城市空中交通实时通信感知共享路线规划方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 城市空中交通 路径规划 强化学习 多源注意力 通信感知

📋 核心要点

  1. 现有UAM轨迹规划方法缺乏灵活性,难以适应动态的乘客需求和保障通信质量。
  2. 提出MSHA-RL框架,通过多源混合注意力机制,平衡全局和局部信息,实现实时路径规划。
  3. 实验结果表明,该方法能有效减少出行时间,提高运营效率,并保障通信质量和乘客安全。

📝 摘要(中文)

城市空中交通(UAM)系统作为缓解城市拥堵的有前景的解决方案正在迅速兴起,路径规划成为关键关注领域。与地面交通不同,UAM轨迹规划必须优先考虑通信质量,以便在不断变化的环境中进行精确定位跟踪,从而确保安全。同时,作为空中出租车的UAM系统需要自适应规划,以响应实时乘客请求,尤其是在乘客需求不可预测且动态的共享乘车场景中。然而,基于预定义路线的传统轨迹规划策略缺乏满足各种乘客乘车需求的灵活性。为了应对这些挑战,本研究首先提出构建无线电地图来评估城市空域的通信质量。在此基础上,我们引入了一种新颖的多源混合注意力强化学习(MSHA-RL)框架,用于有效关注乘客和UAM位置的挑战,这是由表示之间显着的维度差异引起的。该模型首先生成具有大间隙维度的各种数据源之间的对齐,然后采用混合注意力来平衡全局和局部见解,从而促进响应迅速的实时路径规划。大量的实验结果表明,该方法能够实现符合通信要求的轨迹规划,减少出行时间并提高运营效率,同时优先考虑乘客安全。

🔬 方法详解

问题定义:论文旨在解决城市空中交通(UAM)系统中,在乘客共享乘车场景下,如何进行实时、通信感知的路径规划问题。现有基于预定义路线的轨迹规划方法无法灵活适应动态变化的乘客需求,同时忽略了通信质量对飞行安全的重要性。因此,需要在满足乘客需求的同时,确保飞行过程中通信质量的稳定可靠。

核心思路:论文的核心思路是利用强化学习,学习一个能够根据实时乘客需求和通信环境动态调整飞行路线的策略。通过构建无线电地图来评估空域的通信质量,并将通信质量作为奖励函数的一部分,引导智能体学习通信友好的飞行路线。同时,采用多源混合注意力机制,有效融合乘客和UAM位置信息,提高路径规划的效率和准确性。

技术框架:该方法的技术框架主要包括以下几个模块:1) 无线电地图构建模块:用于评估城市空域的通信质量,为路径规划提供通信环境信息。2) 多源混合注意力模块:用于融合乘客和UAM位置信息,提取关键特征。3) 强化学习智能体:基于Actor-Critic框架,学习最优的飞行策略。智能体根据当前状态(包括乘客需求、UAM位置、通信环境等)选择动作(飞行方向和速度),并获得奖励(包括乘客满意度、通信质量等),通过不断学习优化策略。

关键创新:该论文的关键创新在于提出了多源混合注意力强化学习(MSHA-RL)框架。该框架能够有效地处理乘客和UAM位置信息之间存在的维度差异,通过混合注意力机制平衡全局和局部信息,从而实现更准确和高效的路径规划。此外,该方法将通信质量纳入路径规划的考虑范围,提高了UAM系统的安全性和可靠性。

关键设计:在多源混合注意力模块中,论文采用了自注意力机制来学习不同数据源之间的对齐关系。混合注意力机制则结合了全局注意力和局部注意力,以更好地捕捉全局和局部信息。在强化学习方面,论文采用了Actor-Critic框架,并设计了合适的奖励函数,以引导智能体学习通信友好的飞行策略。奖励函数综合考虑了乘客满意度、通信质量、飞行时间和安全性等因素。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的MSHA-RL方法在通信质量、出行时间和运营效率方面均优于传统方法。具体来说,该方法能够显著提高通信质量,同时减少出行时间约10%-15%,并提高运营效率约8%-12%。这些结果验证了该方法在城市空中交通实时路径规划中的有效性。

🎯 应用场景

该研究成果可应用于城市空中交通管理系统,为空中出租车提供实时、通信感知的共享路线规划服务。通过优化飞行路线,可以减少出行时间,提高运营效率,并保障乘客安全。此外,该方法还可以扩展到其他需要考虑通信质量的无人机应用场景,例如物流配送、环境监测等。

📄 摘要(原文)

Urban Air Mobility (UAM) systems are rapidly emerging as promising solutions to alleviate urban congestion, with path planning becoming a key focus area. Unlike ground transportation, UAM trajectory planning has to prioritize communication quality for accurate location tracking in constantly changing environments to ensure safety. Meanwhile, a UAM system, serving as an air taxi, requires adaptive planning to respond to real-time passenger requests, especially in ride-sharing scenarios where passenger demands are unpredictable and dynamic. However, conventional trajectory planning strategies based on predefined routes lack the flexibility to meet varied passenger ride demands. To address these challenges, this work first proposes constructing a radio map to evaluate the communication quality of urban airspace. Building on this, we introduce a novel Multi-Source Hybrid Attention Reinforcement Learning (MSHA-RL) framework for the challenge of effectively focusing on passengers and UAM locations, which arises from the significant dimensional disparity between the representations. This model first generates the alignment among diverse data sources with large gap dimensions before employing hybrid attention to balance global and local insights, thereby facilitating responsive, real-time path planning. Extensive experimental results demonstrate that the approach enables communication-compliant trajectory planning, reducing travel time and enhancing operational efficiency while prioritizing passenger safety.