QuAD: Query-based Interpretable Neural Motion Planning for Autonomous Driving
作者: Sourav Biswas, Sergio Casas, Quinlan Sykora, Ben Agro, Abbas Sadat, Raquel Urtasun
分类: cs.RO, cs.AI, cs.CV, cs.LG
发布日期: 2024-04-01
💡 一句话要点
提出基于查询的可解释神经运动规划以解决自动驾驶问题
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 自动驾驶 运动规划 可解释性 环境感知 占用网格 安全性 高效计算
📋 核心要点
- 现有的自动驾驶方法依赖于对象检测,容易在预测未来行为时因不确定性而产生累积误差。
- 本文提出了一种基于查询的运动规划框架,直接在相关时空点查询占用信息,避免了无效计算。
- 实验结果表明,该方法在高速公路驾驶质量上优于现有的最先进技术,提升了安全性和可解释性。
📝 摘要(中文)
自驾车必须理解其环境以确定适当的行动。传统的自主系统依赖于对象检测来识别场景中的代理,但这种方法假设对象是离散的,且在预测未来行为时会丢失不确定性信息。相对而言,密集的占用网格图用于理解自由空间,但预测整个场景的网格是浪费的,因为只有特定的时空区域对自驾车是可达和相关的。本文提出了一种统一的、可解释的、高效的自主框架,改变了传统的感知、预测和规划的级联模块设计,转而让规划器在相关的时空点查询占用信息,从而限制计算在这些感兴趣的区域。利用这种表示,我们围绕碰撞避免、舒适性和进展等关键因素评估候选轨迹,确保安全性和可解释性。我们的方案在高保真闭环仿真中实现了比现有技术更好的高速公路驾驶质量。
🔬 方法详解
问题定义:本文旨在解决传统自动驾驶系统中对象检测的局限性,特别是在处理不确定性和预测未来行为时的误差累积问题。现有方法通常依赖于离散对象的检测,导致信息丢失和计算浪费。
核心思路:论文提出了一种新的运动规划框架,允许规划器在特定的时空点查询占用信息,从而聚焦于与自驾车相关的区域。这种方法有效减少了计算负担,并提高了对环境的理解。
技术框架:整体架构包括三个主要模块:环境感知模块、查询模块和规划模块。环境感知模块负责获取环境信息,查询模块在相关时空点获取占用信息,规划模块则基于这些信息生成安全的行驶轨迹。
关键创新:最重要的创新在于将查询机制引入运动规划中,使得计算更加高效且可解释。这一方法与传统的级联模块设计有本质区别,避免了不必要的计算和信息损失。
关键设计:在设计中,关键参数包括查询的时空点选择策略和轨迹评估标准。损失函数则结合了碰撞避免、舒适性和进展等多个因素,以确保生成的轨迹既安全又符合驾驶舒适性要求。
🖼️ 关键图片
📊 实验亮点
实验结果显示,提出的方法在高速公路驾驶质量上优于现有的最先进技术,具体表现为在高保真闭环仿真中,安全性和可解释性均得到了显著提升,具体性能数据未详细披露。
🎯 应用场景
该研究的潜在应用领域包括自动驾驶汽车、智能交通系统和机器人导航等。通过提高自驾车的环境理解能力和运动规划效率,该方法能够显著提升自动驾驶的安全性和可靠性,具有广泛的实际价值和未来影响。
📄 摘要(原文)
A self-driving vehicle must understand its environment to determine the appropriate action. Traditional autonomy systems rely on object detection to find the agents in the scene. However, object detection assumes a discrete set of objects and loses information about uncertainty, so any errors compound when predicting the future behavior of those agents. Alternatively, dense occupancy grid maps have been utilized to understand free-space. However, predicting a grid for the entire scene is wasteful since only certain spatio-temporal regions are reachable and relevant to the self-driving vehicle. We present a unified, interpretable, and efficient autonomy framework that moves away from cascading modules that first perceive, then predict, and finally plan. Instead, we shift the paradigm to have the planner query occupancy at relevant spatio-temporal points, restricting the computation to those regions of interest. Exploiting this representation, we evaluate candidate trajectories around key factors such as collision avoidance, comfort, and progress for safety and interpretability. Our approach achieves better highway driving quality than the state-of-the-art in high-fidelity closed-loop simulations.