Spatial Envelope MPC: High Performance Driving without a Reference

📄 arXiv: 2509.18506v1 📥 PDF

作者: Siyuan Yu, Congkai Shen, Yufei Xi, James Dallas, Michael Thompson, John Subosits, Hiroshi Yasuda, Tulga Ersal

分类: cs.RO

发布日期: 2025-09-23


💡 一句话要点

提出基于空间包络的MPC框架,无需参考轨迹实现高性能自动驾驶。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 模型预测控制 自动驾驶 空间包络 强化学习 车辆动力学 运动规划 优化控制

📋 核心要点

  1. 现有自动驾驶框架依赖参考轨迹,在动态极限下性能受限,难以应对复杂场景。
  2. 提出基于空间包络的MPC框架,直接优化车辆的可行驶区域,无需预定义参考轨迹。
  3. 通过仿真和实车实验验证,该框架在赛车、避撞和越野导航等任务中表现出色。

📝 摘要(中文)

本文提出了一种新颖的基于包络的模型预测控制(MPC)框架,旨在使自动驾驶车辆能够在各种场景中处理高性能驾驶,而无需预定义的参考轨迹。 在高性能自动驾驶中,在车辆的动态极限下安全运行需要一个实时的规划和控制框架,该框架能够在遵循预定义的参考轨迹并非最优甚至不可行时,考虑关键的车辆动力学和环境约束。 然而,目前最先进的规划和控制框架主要基于参考轨迹,这限制了它们在这种情形下的性能。 为了解决这一差距,这项工作首先引入了一种计算效率高的车辆动力学模型,该模型专为基于优化的控制而设计,以及一种连续可微的数学公式,该公式可以准确地捕获整个可驾驶包络。 这种新颖的模型和公式允许将动态可行性和安全约束直接集成到统一的规划和控制框架中,从而消除了对预定义参考轨迹的需要。 通过将强化学习与优化技术相结合,解决了包络规划的挑战,即最大程度地逼近安全可驾驶区域。 该框架通过仿真和真实世界的实验进行了验证,证明了其在各种任务中的高性能,包括赛车、紧急避撞和越野导航。 这些结果突出了该框架的可扩展性和在各种场景中的广泛适用性。

🔬 方法详解

问题定义:现有自动驾驶系统严重依赖预定义的参考轨迹。然而,在高性能驾驶场景下,例如赛车、紧急避障和越野导航,车辆需要在动态极限下运行,此时预定义的参考轨迹可能并非最优甚至不可行。现有方法难以兼顾车辆动力学约束和环境约束,导致性能瓶颈。

核心思路:该论文的核心思路是放弃预定义的参考轨迹,转而直接优化车辆的可行驶区域,即“空间包络”。通过建立精确的车辆动力学模型和环境约束模型,将安全驾驶问题转化为在空间包络内寻找最优控制策略的问题。这种方法能够充分利用车辆的动态性能,提高自动驾驶系统的灵活性和适应性。

技术框架:该框架包含以下主要模块:1) 车辆动力学建模:建立计算高效且精确的车辆动力学模型,用于预测车辆状态。2) 可行驶包络建模:使用连续可微的数学公式描述车辆的可行驶区域,考虑车辆动力学约束和环境约束。3) 包络规划:结合强化学习和优化技术,寻找最优的空间包络。4) 模型预测控制(MPC):在空间包络内,通过MPC优化控制量,实现车辆的精确控制。

关键创新:该论文的关键创新在于提出了基于空间包络的MPC框架,摆脱了对预定义参考轨迹的依赖。通过直接优化车辆的可行驶区域,能够更好地利用车辆的动态性能,提高自动驾驶系统的鲁棒性和适应性。此外,该论文还提出了一种计算高效的车辆动力学模型和一种连续可微的可行驶包络建模方法,为优化控制提供了基础。

关键设计:在车辆动力学建模方面,论文设计了一种简化的车辆模型,在保证精度的前提下,降低了计算复杂度。在可行驶包络建模方面,论文采用了一种连续可微的数学公式,方便进行优化。在包络规划方面,论文结合了强化学习和优化技术,利用强化学习探索环境,利用优化技术寻找最优解。MPC控制器的设计则采用了标准的二次规划方法。

📊 实验亮点

该框架通过仿真和实车实验验证,在赛车、紧急避撞和越野导航等任务中表现出色。具体性能数据未知,但实验结果表明,该框架能够有效地提高自动驾驶系统的性能和鲁棒性,使其能够在各种复杂场景中安全可靠地运行。与传统的基于参考轨迹的MPC方法相比,该框架具有更高的灵活性和适应性。

🎯 应用场景

该研究成果可应用于多种自动驾驶场景,包括:1) 赛车:提高赛车机器人的性能,实现更快的圈速。2) 紧急避障:在紧急情况下,快速规划安全路径,避免碰撞。3) 越野导航:在复杂地形中,实现安全可靠的导航。此外,该方法还可应用于其他需要高性能运动控制的领域,如无人机、机器人等。

📄 摘要(原文)

This paper presents a novel envelope based model predictive control (MPC) framework designed to enable autonomous vehicles to handle high performance driving across a wide range of scenarios without a predefined reference. In high performance autonomous driving, safe operation at the vehicle's dynamic limits requires a real time planning and control framework capable of accounting for key vehicle dynamics and environmental constraints when following a predefined reference trajectory is suboptimal or even infeasible. State of the art planning and control frameworks, however, are predominantly reference based, which limits their performance in such situations. To address this gap, this work first introduces a computationally efficient vehicle dynamics model tailored for optimization based control and a continuously differentiable mathematical formulation that accurately captures the entire drivable envelope. This novel model and formulation allow for the direct integration of dynamic feasibility and safety constraints into a unified planning and control framework, thereby removing the necessity for predefined references. The challenge of envelope planning, which refers to maximally approximating the safe drivable area, is tackled by combining reinforcement learning with optimization techniques. The framework is validated through both simulations and real world experiments, demonstrating its high performance across a variety of tasks, including racing, emergency collision avoidance and off road navigation. These results highlight the framework's scalability and broad applicability across a diverse set of scenarios.