CoMoCAVs: Cohesive Decision-Guided Motion Planning for Connected and Autonomous Vehicles with Multi-Policy Reinforcement Learning

作者: Pan Hu

分类: cs.RO

发布日期: 2025-07-20

备注: 8 pages, 5 figures

💡 一句话要点

提出CoMoCAVs，利用多策略强化学习解决车联网环境下自主驾驶的决策与运动规划问题。

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱二：RL算法与架构 (RL & Architecture)

关键词: 自主驾驶 车联网 决策规划 强化学习 专家混合模型 运动规划 多策略学习

📋 核心要点

现有自主驾驶方法在车联网环境下，难以兼顾灵活安全的车道选择和精确的轨迹执行。
CDGMP框架通过专家混合模型和多策略强化学习，将决策和运动规划紧密结合，实现模块化和专业化。
仿真结果表明，该方法在车道选择和运动规划方面表现出可靠的性能，提升了自主驾驶的适应性和鲁棒性。

📝 摘要（中文）

本文提出了一种名为Cohesive Decision-Guided Motion Planning (CDGMP) 的框架，用于解决车联网自主驾驶车辆（CAVs）中的决策和运动规划问题。该框架紧密结合了决策（高速公路车道选择）和运动规划（生成速度和转向控制命令），采用了一种受专家混合模型（MoE）启发的架构，并结合了多策略强化学习。通过门控机制协调多个专业子网络，将复杂的驾驶任务分解为模块化组件。每个子网络专注于驾驶的特定方面，通过仅激活推理期间最相关的模块来提高效率。这种设计还通过模块化专业化来增强安全性。CDGMP提高了 CAV 在各种交通场景中的适应性和鲁棒性，为现实世界的自主驾驶挑战提供了一种可扩展的解决方案。CDGMP背后的架构原则，特别是 MoE 的使用，也为其他高维决策和控制任务提供了坚实的基础。仿真结果表明，该方法在车道选择和运动规划方面均表现出可靠的性能。

🔬 方法详解

问题定义：论文旨在解决车联网环境下自主驾驶车辆在高速公路场景中的决策（车道选择）和运动规划问题。现有方法难以在保证安全性的前提下，实现灵活的车道选择和精确的轨迹控制，尤其是在复杂交通环境中适应性和鲁棒性不足。

核心思路：论文的核心思路是将复杂的驾驶任务分解为多个模块化的子任务，每个子任务由一个专门的子网络负责。通过专家混合模型（MoE）的门控机制，动态地选择最相关的子网络进行推理，从而提高效率和安全性。同时，采用多策略强化学习来训练这些子网络，使其能够适应不同的驾驶场景。

技术框架：CDGMP框架主要包含以下几个模块：1) 感知模块：负责获取周围环境的信息，例如其他车辆的位置、速度等；2) 决策模块：基于感知信息，选择合适的车道；3) 运动规划模块：根据决策结果，生成控制命令，例如速度和转向；4) 专家混合模型（MoE）：根据输入选择激活哪个或哪些子网络，每个子网络负责特定的驾驶场景或任务；5) 多策略强化学习：用于训练各个子网络，使其能够适应不同的驾驶场景。整体流程是，感知模块获取环境信息，然后输入到决策模块和MoE中，MoE选择合适的子网络，子网络输出控制命令，控制车辆运动。

关键创新：该论文的关键创新在于将专家混合模型（MoE）与多策略强化学习相结合，用于自主驾驶的决策和运动规划。MoE能够将复杂的驾驶任务分解为多个模块化的子任务，每个子任务由一个专门的子网络负责，从而提高效率和安全性。多策略强化学习能够训练这些子网络，使其能够适应不同的驾驶场景。与现有方法相比，该方法能够更好地平衡灵活性、安全性和鲁棒性。

关键设计：论文中MoE的门控网络的设计至关重要，它决定了如何选择激活哪些子网络。损失函数的设计也需要考虑多个方面，例如车道选择的准确性、轨迹跟踪的精度、以及安全性等。具体参数设置和网络结构在论文中未详细说明，属于未知信息。

🖼️ 关键图片

📊 实验亮点

论文通过仿真实验验证了CDGMP框架的有效性，结果表明该方法在车道选择和运动规划方面均表现出可靠的性能。虽然摘要中没有给出具体的性能数据和对比基线，但视频演示（https://youtu.be/_-4OXNHV0UY）展示了其在各种交通场景下的适应性和鲁棒性。

🎯 应用场景

该研究成果可应用于车联网环境下的自动驾驶车辆，提升其在复杂交通场景中的决策能力和运动规划能力，提高驾驶安全性、效率和舒适性。此外，该方法也可推广到其他高维决策和控制任务中，例如机器人控制、智能交通管理等。

📄 摘要（原文）

Autonomous driving demands reliable and efficient solutions to closely related problems such as decision-making and motion planning. In this work, decision-making refers specifically to highway lane selection, while motion planning involves generating control commands (such as speed and steering) to reach the chosen lane. In the context of Connected Autonomous Vehicles (CAVs), achieving both flexible and safe lane selection alongside precise trajectory execution remains a significant challenge. This paper proposes a framework called Cohesive Decision-Guided Motion Planning (CDGMP), which tightly integrates decision-making and motion planning using a Mixture of Experts (MoE) inspired architecture combined with multi-policy reinforcement learning. By coordinating multiple specialized sub-networks through a gating mechanism, the method decomposes the complex driving task into modular components. Each sub-network focuses on a specific aspect of driving, improving efficiency by activating only the most relevant modules during inference. This design also enhances safety through modular specialization. CDGMP improves the adaptability and robustness of CAVs across diverse traffic scenarios, offering a scalable solution to real-world autonomy challenges. The architectural principles behind CDGMP, especially the use of MoE, also provide a strong foundation for other high-dimensional decision and control tasks. Simulation results (available at https://youtu.be/_-4OXNHV0UY) demonstrate reliable performance in both lane selection and motion planning.

CoMoCAVs: Cohesive Decision-Guided Motion Planning for Connected and Autonomous Vehicles with Multi-Policy Reinforcement Learning

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理