Energy Efficient Automated Driving as a GNEP: Vehicle-in-the-loop Experiments
作者: Viranjan Bhattacharyya, Tyler Ard, Rongyao Wang, Ardalan Vahidi, Yunyi Jia, Jihun Han
分类: eess.SY
发布日期: 2024-11-21
💡 一句话要点
提出基于广义纳什均衡的能量高效自动驾驶方法,并在环测试中验证
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 自动驾驶 多智能体系统 运动规划 模型预测控制 广义纳什均衡 能量效率 车辆在环
📋 核心要点
- 现有自动驾驶运动规划方法在多智能体交互场景下,难以兼顾能量效率和行驶时间。
- 论文将多智能体运动规划建模为广义纳什均衡问题,通过车辆间意图共享实现能量优化。
- 通过软件在环和车辆在环实验,验证了该方法在能量效率和行驶时间方面的优势。
📝 摘要(中文)
本文研究了多智能体运动规划问题,旨在最小化互联自动驾驶车辆(CAV)在变道场景中的能量消耗。我们将这种交互式运动规划建模为广义纳什均衡问题(GNEP),并形式化了车辆间意图共享如何使多个CAV之间的博弈能够通过每个智能体的最优控制问题来解决,从而达到广义纳什均衡。该方法通过模型预测控制(MPC)实现,并与利用其他智能体未来状态单方面预测的高级基线MPC进行比较。开发了一个基于ROS的在环测试平台:该方法首先在软件在环中进行评估,然后进行车辆在环实验。实验结果表明,所提出的方法在交互式变道操作中具有能量和行驶时间的优势。
🔬 方法详解
问题定义:论文旨在解决互联自动驾驶车辆在变道等交互场景下的能量消耗问题。现有方法通常侧重于安全性或行驶效率,忽略了能量优化,并且在多智能体交互预测方面存在不足,难以达到全局最优。
核心思路:论文的核心思路是将多智能体运动规划问题建模为广义纳什均衡问题(GNEP)。每个车辆都试图最小化自己的能量消耗,同时考虑到其他车辆的策略。通过车辆间的意图共享,每个车辆可以更好地预测其他车辆的行为,从而找到一个纳什均衡点,使得所有车辆的能量消耗都尽可能地降低。
技术框架:整体框架基于模型预测控制(MPC)。每个车辆都运行一个MPC控制器,该控制器根据车辆的当前状态、环境信息以及其他车辆的意图来规划未来的轨迹。车辆之间通过ROS进行通信,共享彼此的意图。整个过程迭代进行,直到达到一个广义纳什均衡。主要模块包括:状态估计模块、意图共享模块、MPC优化模块和控制执行模块。
关键创新:最重要的创新点在于将多智能体运动规划问题建模为广义纳什均衡问题,并利用车辆间的意图共享来解决该问题。与传统的单方面预测方法相比,该方法能够更好地考虑到其他车辆的行为,从而实现更优的能量效率。
关键设计:论文使用模型预测控制(MPC)作为求解GNEP的工具。每个智能体的目标函数都包含能量消耗项和安全约束项。能量消耗项通常与车辆的加速度和速度有关。安全约束项则用于避免车辆之间的碰撞。关键参数包括MPC的预测时域、控制时域以及目标函数中各项的权重。损失函数的设计需要仔细考虑,以平衡能量效率和安全性。
📊 实验亮点
实验结果表明,所提出的基于广义纳什均衡的MPC方法在交互式变道场景中能够显著降低能量消耗和行驶时间。与高级基线MPC(利用单方面预测)相比,该方法在车辆在环实验中实现了能量消耗的降低和行驶时间的缩短(具体数值未知)。软件在环实验也验证了该方法的有效性。
🎯 应用场景
该研究成果可应用于智能交通系统、自动驾驶车辆队列控制、以及其他需要多智能体协同的场景。通过优化车辆的行驶轨迹,可以显著降低能量消耗,减少碳排放,并提高交通效率。未来,该方法可以进一步扩展到更复杂的交通场景,例如城市道路和高速公路。
📄 摘要(原文)
In this paper, a multi-agent motion planning problem is studied aiming to minimize energy consumption of connected automated vehicles (CAVs) in lane change scenarios. We model this interactive motion planning as a generalized Nash equilibrium problem and formalize how vehicle-to-vehicle intention sharing enables solution of the game between multiple CAVs as an optimal control problem for each agent, to arrive at a generalized Nash equilibrium. The method is implemented via model predictive control (MPC) and compared with an advanced baseline MPC which utilizes unilateral predictions of other agents' future states. A ROS-based in-the-loop testbed is developed: the method is first evaluated in software-in-the-loop and then vehicle-in-the-loop experiments are conducted. Experimental results demonstrate energy and travel time benefits of the presented method in interactive lane change maneuvers.