Integrated Decision Making and Trajectory Planning for Autonomous Driving Under Multimodal Uncertainties: A Bayesian Game Approach

📄 arXiv: 2409.13993v1 📥 PDF

作者: Zhenmin Huang, Tong Li, Shaojie Shen, Jun Ma

分类: cs.RO, cs.GT

发布日期: 2024-09-21


💡 一句话要点

提出基于贝叶斯博弈的决策与轨迹规划框架,解决自动驾驶中多模态不确定性下的交互问题。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自动驾驶 决策制定 轨迹规划 贝叶斯博弈 多模态不确定性

📋 核心要点

  1. 现有自动驾驶方法在处理多模态和行为不确定性时,缺乏有效的交互式规划能力,容易导致安全问题。
  2. 论文提出基于贝叶斯博弈的决策与轨迹规划框架,将人类决策建模为博弈参与者类型,捕捉多模态交互。
  3. 通过无悔学习求解贝叶斯粗略相关均衡,实现决策与轨迹规划的同步优化,并在多种交通场景中验证了有效性。

📝 摘要(中文)

本文提出了一种集成的决策制定和轨迹规划框架,用于解决自动驾驶中多模态不确定性下的交通参与者交互问题。现有方法要么无法进行交互式规划,要么只考虑单模态行为,可能导致灾难性后果。本文基于贝叶斯博弈(即不完全信息博弈)构建框架,将人类决策的离散特性建模为博弈中的参与者类型。引入一种基于无悔学习的通用求解器,以获得相应的贝叶斯粗略相关均衡,从而捕捉多模态背景下交通参与者之间的交互。利用获得的均衡,同时进行决策制定和轨迹规划,所得的交互策略在对手驾驶意图的期望上是最优的。在不同的交通场景中进行了闭环仿真,以说明所提出框架的通用性和有效性。

🔬 方法详解

问题定义:自动驾驶车辆在复杂交通环境中,需要与其他交通参与者(如其他车辆、行人)进行交互。现有方法要么忽略交互,要么假设其他参与者的行为是单一模式的,无法应对真实交通场景中存在的多模态行为不确定性。这种不确定性可能导致自动驾驶车辆做出错误的决策,从而引发事故。因此,如何有效地建模和预测其他交通参与者的多模态行为,并在此基础上进行安全、高效的决策和轨迹规划,是本文要解决的核心问题。

核心思路:论文的核心思路是将交通参与者之间的交互建模为一个贝叶斯博弈。每个参与者(包括自动驾驶车辆和其他交通参与者)都有不同的“类型”,代表其不同的驾驶意图或行为模式。由于自动驾驶车辆无法完全了解其他参与者的类型,因此这是一个不完全信息博弈。通过求解这个博弈的均衡解,可以得到每个参与者在不同类型下的最优策略,从而实现交互式的决策和轨迹规划。

技术框架:该框架主要包含以下几个模块:1) 类型建模:将人类驾驶行为的离散特性建模为博弈中参与者的类型,例如,车辆可能想要变道、直行或减速。2) 博弈构建:将交通场景建模为贝叶斯博弈,其中参与者是交通中的车辆,类型代表其驾驶意图,策略是其轨迹规划。3) 均衡求解:使用基于无悔学习的通用求解器来寻找贝叶斯粗略相关均衡(Bayesian Coarse Correlated Equilibrium, BCCE)。BCCE是一种相对宽松的均衡概念,更易于计算,并且能够捕捉多模态交互。4) 决策与轨迹规划:基于求解得到的均衡,自动驾驶车辆可以同时进行决策制定和轨迹规划,选择在对手意图期望下的最优策略。

关键创新:该论文的关键创新在于:1) 多模态建模:能够显式地建模交通参与者的多模态行为,避免了单模态假设带来的局限性。2) 贝叶斯博弈框架:将交互式决策问题建模为贝叶斯博弈,能够有效地处理不完全信息下的决策问题。3) BCCE均衡求解:采用基于无悔学习的通用求解器,能够有效地求解BCCE,并将其应用于决策和轨迹规划。

关键设计:论文中,类型建模的具体方法未知,但可以推测是基于历史数据或者专家知识进行定义的。无悔学习算法的选择和参数设置对均衡求解的效率和精度有重要影响,具体细节未知。损失函数的设计需要考虑安全性、效率和舒适性等多个因素,具体形式未知。轨迹规划模块可能采用优化方法,如模型预测控制(MPC),具体实现未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文在不同的交通场景中进行了闭环仿真实验,验证了所提出框架的有效性和通用性。虽然没有给出具体的性能数据,但论文强调该框架能够处理多模态不确定性,并实现交互式的决策和轨迹规划。与传统的单模态方法相比,该框架能够更好地应对复杂交通场景,并提高自动驾驶车辆的安全性。

🎯 应用场景

该研究成果可应用于各种自动驾驶场景,例如高速公路巡航、城市道路导航、自动泊车等。通过更准确地预测其他交通参与者的行为,自动驾驶车辆可以做出更安全、更高效的决策,提高交通效率,减少交通事故,并提升乘坐舒适性。该方法还可扩展到其他机器人应用领域,例如人机协作、多机器人协同等。

📄 摘要(原文)

Modeling the interaction between traffic agents is a key issue in designing safe and non-conservative maneuvers in autonomous driving. This problem can be challenging when multi-modality and behavioral uncertainties are engaged. Existing methods either fail to plan interactively or consider unimodal behaviors that could lead to catastrophic results. In this paper, we introduce an integrated decision-making and trajectory planning framework based on Bayesian game (i.e., game of incomplete information). Human decisions inherently exhibit discrete characteristics and therefore are modeled as types of players in the game. A general solver based on no-regret learning is introduced to obtain a corresponding Bayesian Coarse Correlated Equilibrium, which captures the interaction between traffic agents in the multimodal context. With the attained equilibrium, decision-making and trajectory planning are performed simultaneously, and the resulting interactive strategy is shown to be optimal over the expectation of rivals' driving intentions. Closed-loop simulations on different traffic scenarios are performed to illustrate the generalizability and the effectiveness of the proposed framework.