Biasing the Driving Style of an Artificial Race Driver for Online Time-Optimal Maneuver Planning

📄 arXiv: 2504.12744v1 📥 PDF

作者: Sebastiano Taddei, Mattia Piccinini, Francesco Biral

分类: cs.RO, eess.SY

发布日期: 2025-04-17

期刊: "Biasing the Driving Style of an Artificial Race Driver for Online Time-Optimal Maneuver Planning*," 2025 IEEE Intelligent Vehicles Symposium (IV), Cluj-Napoca, Romania, 2025, pp. 640-647

DOI: 10.1109/IV64158.2025.11097381


💡 一句话要点

提出一种基于MPC的自适应驾驶风格人工赛车手,用于在线时间最优轨迹规划。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 自动驾驶 轨迹规划 驾驶风格 最优控制

📋 核心要点

  1. 现有在线轨迹规划方法难以模拟人类驾驶员的驾驶风格,尤其是在顶点到达时间的选择上。
  2. 论文提出基于MPC的框架,通过设计新的终端代价函数,使人工赛车手能够自适应地调整驾驶风格。
  3. 实验表明,该方法能够实现接近离线最优解的单圈时间,并超越传统的在线最小时间MPC方法。

📝 摘要(中文)

本文提出了一种新颖的方法,用于调整人工赛车手(ARD)的驾驶风格,以实现在线时间最优轨迹规划。该方法利用非线性模型预测控制(MPC)框架,结合了时间最小化和规划范围终点速度最大化。我们引入了一种新的基于先前MPC步骤规划轨迹的MPC终端代价函数,使ARD能够实时调整其驾驶风格,从提前到达顶点(early apex)策略到延迟到达顶点(late apex)策略。该方法计算效率高,允许低重规划时间和长规划范围。通过仿真验证了该方法,并将其结果与离线最小单圈时间(MLT)最优控制和在线最小时间MPC解决方案进行了比较。结果表明,新的终端代价函数使ARD能够调整其驾驶风格,并实现接近MLT解决方案的在线单圈时间,且比最小时间MPC解决方案更快。该方法为更好地理解人类驾驶员选择提前或延迟到达顶点策略的原因铺平了道路。

🔬 方法详解

问题定义:论文旨在解决人工赛车手(ARD)在线轨迹规划中驾驶风格选择的问题。现有方法通常难以模拟人类驾驶员根据赛道情况和自身策略选择提前或延迟到达顶点(apex)的驾驶风格,导致性能受限。传统的最小时间MPC方法往往只关注最快速度,忽略了驾驶风格对整体圈速的影响。

核心思路:论文的核心思路是通过设计一种新的MPC终端代价函数,使ARD能够根据先前规划的轨迹自适应地调整驾驶风格。该代价函数鼓励ARD在规划范围的终点达到较高的速度,并同时考虑与先前轨迹的偏差,从而实现驾驶风格的平滑过渡和优化。

技术框架:该方法基于非线性模型预测控制(MPC)框架。整体流程包括:1)使用车辆动力学模型预测未来轨迹;2)定义包含时间最小化和终端代价的优化目标函数;3)使用优化算法求解最优控制序列;4)将控制序列的第一个控制量作用于车辆;5)重复以上步骤进行在线重规划。关键在于终端代价函数的设计,它基于前一个MPC步骤规划的轨迹。

关键创新:最重要的技术创新点在于新的MPC终端代价函数。与传统的只关注时间最小化的MPC方法不同,该方法将先前轨迹的信息融入到终端代价中,从而引导ARD选择更符合整体最优策略的驾驶风格。这种方法能够更好地模拟人类驾驶员的决策过程,并提高ARD的性能。

关键设计:终端代价函数包含两部分:一部分是终端速度最大化,另一部分是与先前轨迹的偏差最小化。具体形式未知,但可以推断其设计目标是鼓励ARD在规划范围终点达到较高的速度,并同时保持轨迹的平滑性。MPC的规划范围长度和重规划频率是重要的参数,需要根据计算资源和赛道特性进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法能够使人工赛车手实现接近离线最小单圈时间(MLT)最优控制的性能,并且优于传统的在线最小时间MPC解决方案。这表明该方法能够有效地调整驾驶风格,并提高在线轨迹规划的效率和精度。具体的性能提升数据未知,但论文强调了其显著的改进。

🎯 应用场景

该研究成果可应用于自动驾驶赛车、智能车辆控制和驾驶员辅助系统等领域。通过模拟不同驾驶风格,可以提高自动驾驶系统在复杂环境下的适应性和安全性。此外,该方法还可以用于分析人类驾驶员的驾驶行为,为驾驶员培训和个性化驾驶辅助提供支持。

📄 摘要(原文)

In this work, we present a novel approach to bias the driving style of an artificial race driver (ARD) for online time-optimal trajectory planning. Our method leverages a nonlinear model predictive control (MPC) framework that combines time minimization with exit speed maximization at the end of the planning horizon. We introduce a new MPC terminal cost formulation based on the trajectory planned in the previous MPC step, enabling ARD to adapt its driving style from early to late apex maneuvers in real-time. Our approach is computationally efficient, allowing for low replan times and long planning horizons. We validate our method through simulations, comparing the results against offline minimum-lap-time (MLT) optimal control and online minimum-time MPC solutions. The results demonstrate that our new terminal cost enables ARD to bias its driving style, and achieve online lap times close to the MLT solution and faster than the minimum-time MPC solution. Our approach paves the way for a better understanding of the reasons behind human drivers' choice of early or late apex maneuvers.