Differentiable Predictive Control for Robotics: A Data-Driven Predictive Safety Filter Approach
作者: John Viljoen, Wenceslao Shaw Cortez, Jan Drgona, Sebastian East, Masayoshi Tomizuka, Draguna Vrabie
分类: cs.RO
发布日期: 2024-09-20
备注: 8 Pages, 6 figures
💡 一句话要点
提出基于数据驱动预测安全滤波器的可微预测控制,提升机器人控制效率与安全性
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 可微预测控制 模型预测控制 安全滤波器 机器人控制 数据驱动 四旋翼飞行器
📋 核心要点
- 传统MPC计算复杂度高,难以满足机器人高采样率和有限计算资源的需求,DPC虽然高效,但牺牲了安全性,且依赖可微模型。
- 论文提出一种基于相对阶的系统分解技术,并结合数据驱动的安全集生成和事件触发预测安全滤波器,提升DPC的安全性。
- 实验表明,该方法在四旋翼飞行器上实现了与先进MPC相当的性能,计算时间减少三个数量级,并在未训练场景中保证了安全性。
📝 摘要(中文)
模型预测控制(MPC)在约束场景下能有效生成安全控制策略,但计算复杂度高。对于需要高采样率和计算资源有限的机器人而言尤其如此。可微预测控制(DPC)离线训练神经网络来近似参数化MPC问题,从而实现计算高效的在线控制,但会牺牲安全性保证。DPC需要可微模型,且在病态条件下表现不佳。本文提出一种基于相对阶的系统分解技术来克服这个问题。我们还开发了一种基于DPC训练数据集的新型安全集生成技术,以及一种新型事件触发预测安全滤波器,以促进向安全集的收敛。在四旋翼飞行器上的实验结果表明,DPC控制律具有与最先进的MPC相当的性能,同时计算时间减少了高达三个数量级,并在DPC未训练的场景中满足安全要求。
🔬 方法详解
问题定义:论文旨在解决机器人控制中,传统模型预测控制(MPC)计算复杂度高,难以满足实时性要求的问题。可微预测控制(DPC)虽然能降低计算量,但依赖于精确的可微模型,且缺乏安全性保证,在实际应用中存在局限性。尤其是在模型不准确或存在扰动的情况下,DPC的性能会显著下降。
核心思路:论文的核心思路是结合DPC的高效性和MPC的安全性,通过数据驱动的方式学习一个安全集,并设计一个事件触发的预测安全滤波器,确保控制策略始终在安全集内。此外,论文还提出了一种基于相对阶的系统分解技术,以改善DPC在病态条件下的性能。
技术框架:整体框架包含三个主要模块:1) DPC控制器:离线训练一个神经网络来近似MPC的控制策略,实现高效的在线控制。2) 安全集生成:利用DPC的训练数据集,通过某种算法(具体未知)生成一个安全集,该集合代表了系统状态的安全区域。3) 事件触发预测安全滤波器:当系统状态偏离安全集时,触发该滤波器,对DPC的控制输出进行修正,使其回到安全集内。
关键创新:论文的关键创新在于:1) 提出了一种基于DPC训练数据集的安全集生成方法,避免了手动设计安全集的困难。2) 设计了一种事件触发的预测安全滤波器,能够在保证安全性的前提下,尽可能地利用DPC的高效控制策略。3) 提出了基于相对阶的系统分解技术,提高了DPC在复杂系统中的适用性。
关键设计:关于安全集生成的具体算法和事件触发预测安全滤波器的设计细节,论文摘要中没有详细说明。相对阶的系统分解技术的具体实现方式也未知。这些细节可能在论文正文中给出,需要进一步阅读才能了解。
🖼️ 关键图片
📊 实验亮点
实验结果表明,所提出的DPC控制律在四旋翼飞行器上实现了与最先进的MPC相当的性能,同时计算时间减少了高达三个数量级。更重要的是,该方法在DPC未训练的场景中也能够满足安全要求,验证了其泛化能力和鲁棒性。
🎯 应用场景
该研究成果可应用于各种需要快速、安全控制的机器人系统,例如无人机、自动驾驶汽车、工业机器人等。通过降低计算复杂度和提高安全性,该方法有望推动机器人在资源受限和安全攸关场景中的应用,例如灾难救援、物流配送和智能制造。
📄 摘要(原文)
Model Predictive Control (MPC) is effective at generating safe control strategies in constrained scenarios, at the cost of computational complexity. This is especially the case in robots that require high sampling rates and have limited computing resources. Differentiable Predictive Control (DPC) trains offline a neural network approximation of the parametric MPC problem leading to computationally efficient online control laws at the cost of losing safety guarantees. DPC requires a differentiable model, and performs poorly when poorly conditioned. In this paper we propose a system decomposition technique based on relative degree to overcome this. We also develop a novel safe set generation technique based on the DPC training dataset and a novel event-triggered predictive safety filter which promotes convergence towards the safe set. Our empirical results on a quadcopter demonstrate that the DPC control laws have comparable performance to the state-of-the-art MPC whilst having up to three orders of magnitude reduction in computation time and satisfy safety requirements in a scenario that DPC was not trained on.