Safe and Performant Controller Synthesis using Gradient-based Model Predictive Control and Control Barrier Functions
作者: Aditya Singh, Aastha Mishra, Manan Tayal, Shishir Kolathaya, Pushpak Jagtap
分类: eess.SY, cs.RO
发布日期: 2025-07-18
备注: 6 Pages, 2 Figures. The first two authors contributed equally
💡 一句话要点
提出基于梯度MPC与控制障碍函数的安全高性能控制器综合方法
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 模型预测控制 控制障碍函数 安全控制 自主系统 梯度优化
📋 核心要点
- 现有安全滤波器(如CBF)在标称策略不安全时过于保守,而直接求解状态约束最优控制问题在高维系统中计算量巨大。
- 该论文提出一种两阶段框架,首先使用梯度MPC优化性能,然后使用CBF-QP进行安全滤波,从而协同优化安全性和性能。
- 实验表明,该方法能够为复杂高维自主系统合成可扩展、安全且高性能的控制器。
📝 摘要(中文)
在真实环境中运行的自主系统,性能和安全性至关重要。控制障碍函数(CBF)等安全滤波器通过实时修改标称控制器来强制执行约束,但当标称策略缺乏安全意识时,可能会过于保守。相反,通过动态规划解决状态约束最优控制问题(SC-OCP)虽然提供形式化保证,但在高维系统中难以处理。本文提出了一种新颖的两阶段框架,该框架结合了基于梯度的模型预测控制(MPC)与基于CBF的安全滤波,以协同优化安全性和性能。在第一阶段,我们将安全约束放宽为成本函数中的惩罚项,从而可以通过基于梯度的方法进行快速优化。此步骤提高了可扩展性,并避免了与硬约束相关的可行性问题。在第二阶段,我们使用基于CBF的二次规划(CBF-QP)修改生成的控制器,该方法以最小的偏差强制执行硬安全约束。我们的方法产生的控制器既具有高性能,又具有可证明的安全性。我们在两个案例研究中验证了所提出的框架,展示了其为复杂、高维自主系统合成可扩展、安全和高性能控制器的能力。
🔬 方法详解
问题定义:论文旨在解决自主系统在复杂环境中安全和高性能控制的问题。现有方法,如直接使用控制障碍函数(CBF)进行安全滤波,当底层控制器本身不具备安全性时,容易导致过于保守的控制策略。而直接求解状态约束最优控制问题(SC-OCP)虽然能保证安全性,但在高维系统中计算复杂度过高,难以实际应用。
核心思路:论文的核心思路是将性能优化和安全约束解耦,分两个阶段进行处理。首先,通过基于梯度的模型预测控制(MPC)优化性能,允许在一定程度上违反安全约束。然后,利用控制障碍函数(CBF)构建二次规划(QP)问题,对MPC的输出进行修正,强制满足安全约束,同时尽量减小对原始控制策略的改变。
技术框架:该方法包含两个主要阶段: 1. 基于梯度的MPC:将安全约束作为软约束(惩罚项)加入到MPC的成本函数中,使用梯度下降等优化算法快速求解。这种方法可以有效利用系统的动力学模型,优化控制性能。 2. 基于CBF-QP的安全滤波:利用控制障碍函数定义安全区域,构建一个二次规划问题,目标是找到一个对MPC输出的最小修正,使得修正后的控制输入能够保证系统状态始终保持在安全区域内。
关键创新:该方法最重要的创新在于将基于梯度的MPC和基于CBF的安全滤波相结合,实现了性能和安全性的协同优化。与传统方法相比,该方法既能保证系统的安全性,又能避免过于保守的控制策略,从而提高了系统的整体性能。此外,使用梯度MPC避免了求解复杂OCP的难题,提高了算法的可扩展性。
关键设计: * MPC成本函数设计:成本函数通常包含状态误差、控制输入以及安全约束的惩罚项。安全约束的惩罚权重需要仔细调整,以平衡性能和安全性。 * CBF函数选择:CBF函数的选择直接影响安全区域的定义。需要根据具体的系统和任务选择合适的CBF函数。 * CBF-QP问题构建:CBF-QP问题的目标函数通常是最小化对MPC输出的修正量。约束条件包括CBF约束和控制输入约束。
🖼️ 关键图片
📊 实验亮点
论文在两个案例研究中验证了所提出的框架。结果表明,该方法能够有效地合成可扩展、安全和高性能的控制器。具体性能数据和对比基线在论文中给出,展示了该方法在安全性和性能方面的优势。
🎯 应用场景
该研究成果可应用于各种需要安全保障的自主系统,例如自动驾驶汽车、无人机、机器人等。通过该方法,可以提高这些系统在复杂环境中的安全性和性能,使其能够更好地完成各种任务。此外,该方法还可以应用于工业控制、智能交通等领域,提高系统的自动化水平和安全性。
📄 摘要(原文)
Ensuring both performance and safety is critical for autonomous systems operating in real-world environments. While safety filters such as Control Barrier Functions (CBFs) enforce constraints by modifying nominal controllers in real time, they can become overly conservative when the nominal policy lacks safety awareness. Conversely, solving State-Constrained Optimal Control Problems (SC-OCPs) via dynamic programming offers formal guarantees but is intractable in high-dimensional systems. In this work, we propose a novel two-stage framework that combines gradient-based Model Predictive Control (MPC) with CBF-based safety filtering for co-optimizing safety and performance. In the first stage, we relax safety constraints as penalties in the cost function, enabling fast optimization via gradient-based methods. This step improves scalability and avoids feasibility issues associated with hard constraints. In the second stage, we modify the resulting controller using a CBF-based Quadratic Program (CBF-QP), which enforces hard safety constraints with minimal deviation from the reference. Our approach yields controllers that are both performant and provably safe. We validate the proposed framework on two case studies, showcasing its ability to synthesize scalable, safe, and high-performance controllers for complex, high-dimensional autonomous systems.