Learning for Layered Safety-Critical Control with Predictive Control Barrier Functions

📄 arXiv: 2412.04658v1 📥 PDF

作者: William D. Compton, Max H. Cohen, Aaron D. Ames

分类: eess.SY, cs.LG, cs.RO

发布日期: 2024-12-05

备注: Submitted for review to L4DC 2025


💡 一句话要点

提出基于预测控制屏障函数的层级安全控制学习方法,提升复杂系统安全性。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 控制屏障函数 安全控制 预测控制 层级控制 机器人 模型预测 鲁棒控制 领域随机化

📋 核心要点

  1. 现有基于控制屏障函数(CBFs)的安全滤波器在复杂系统上强制安全行为时表现出色,但模型简化可能导致安全问题。
  2. 论文提出预测控制屏障函数,通过全阶模型rollout学习预测鲁棒性项,并将其融入降阶模型的CBF条件中,以保证安全性。
  3. 通过仿真和实验验证,该方法在保证安全性的同时,降低了保守性,并在3D跳跃机器人上成功实现。

📝 摘要(中文)

本文提出了一种基于预测控制屏障函数(CBFs)的层级安全控制方法,用于在复杂系统中强制执行安全行为。通常,为降阶模型(RoM)合成CBFs更容易,并在全阶模型(FoM)上跟踪由此产生的安全行为。然而,RoM和FoM之间的差距可能导致安全违规。为了解决这个问题,本文引入了“预测CBFs”,它利用FoM的rollout来定义一个预测鲁棒性项,并将其添加到RoM CBF条件中。理论上,证明了这种方法保证了层级控制实现中的安全性。在实践中,通过大规模并行模拟和领域随机化来学习预测鲁棒性项。仿真结果表明,该方法能够以最小的保守性实现安全的FoM行为,并在3D跳跃机器人上进行了预测CBFs的实验验证。

🔬 方法详解

问题定义:论文旨在解决在复杂系统中,由于降阶模型(RoM)与全阶模型(FoM)之间的差异,导致使用基于控制屏障函数(CBFs)的安全滤波器时出现安全违规的问题。现有方法依赖于精确的模型,但实际系统中模型简化不可避免,这使得RoM上的安全保证无法直接推广到FoM上,存在潜在的安全风险。

核心思路:论文的核心思路是利用全阶模型(FoM)的预测能力,通过rollout模拟未来状态,从而估计RoM与FoM之间的差异,并将其转化为一个预测鲁棒性项。这个鲁棒性项被添加到RoM的CBF条件中,从而使得RoM的控制决策能够考虑到FoM的动态特性,保证整体系统的安全性。这样设计的目的是为了弥补模型简化带来的不确定性,提高安全控制的鲁棒性。

技术框架:整体框架包含以下几个主要模块:1) 降阶模型(RoM)的CBF设计;2) 全阶模型(FoM)的rollout模拟,用于预测未来状态;3) 预测鲁棒性项的学习,通过大规模并行模拟和领域随机化实现;4) 将预测鲁棒性项融入RoM CBF条件,形成预测CBF;5) 层级控制器的实现,RoM CBF作为安全滤波器,对底层控制器进行修正,保证安全性。

关键创新:最重要的技术创新点在于提出了“预测控制屏障函数”的概念,它将模型的预测能力与传统的CBF方法相结合,从而能够处理模型不确定性带来的安全问题。与现有方法相比,预测CBF不需要精确的模型,而是通过学习的方式来估计模型误差,从而提高了安全控制的鲁棒性和适应性。

关键设计:关键设计包括:1) 预测鲁棒性项的学习:使用大规模并行模拟和领域随机化来生成训练数据,然后使用机器学习方法(例如神经网络)来学习预测鲁棒性项。2) 损失函数的设计:损失函数需要能够反映安全违规的程度,并且能够引导学习过程朝着安全的方向进行。3) Rollout的长度和采样策略:Rollout的长度需要足够长,以便能够捕捉到模型误差的影响,而采样策略需要能够覆盖到各种可能的状态和控制输入。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过仿真和实验验证了预测CBF的有效性。在仿真中,该方法能够以最小的保守性实现安全的FoM行为。在3D跳跃机器人实验中,成功实现了预测CBF,验证了该方法在实际系统中的可行性。实验结果表明,与传统的CBF方法相比,预测CBF能够更好地处理模型不确定性,提高安全控制的鲁棒性。

🎯 应用场景

该研究成果可应用于各种需要高安全性的复杂系统,例如自动驾驶汽车、机器人、航空航天系统等。通过预测控制屏障函数,可以有效地保证这些系统在各种不确定性因素下的安全运行,降低事故发生的风险。未来,该方法有望推广到更多领域,例如医疗机器人、智能制造等,为这些领域的发展提供安全保障。

📄 摘要(原文)

Safety filters leveraging control barrier functions (CBFs) are highly effective for enforcing safe behavior on complex systems. It is often easier to synthesize CBFs for a Reduced order Model (RoM), and track the resulting safe behavior on the Full order Model (FoM) -- yet gaps between the RoM and FoM can result in safety violations. This paper introduces \emph{predictive CBFs} to address this gap by leveraging rollouts of the FoM to define a predictive robustness term added to the RoM CBF condition. Theoretically, we prove that this guarantees safety in a layered control implementation. Practically, we learn the predictive robustness term through massive parallel simulation with domain randomization. We demonstrate in simulation that this yields safe FoM behavior with minimal conservatism, and experimentally realize predictive CBFs on a 3D hopping robot.