Safe Data-Driven Predictive Control
作者: Amin Vahidi-Moghaddam, Kaian Chen, Kaixiang Zhang, Zhaojian Li, Yan Wang, Kai Wu
分类: eess.SY
发布日期: 2025-04-11
备注: arXiv admin note: substantial text overlap with arXiv:2306.17270
💡 一句话要点
提出安全的数据驱动预测控制,解决非线性MPC模型依赖和计算负担问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 数据驱动控制 模型预测控制 非线性系统 鲁棒控制 控制障碍函数 系统辨识 并发学习
📋 核心要点
- 传统MPC依赖精确模型和大量计算资源,限制了其在实时非线性系统中的应用。
- 该方法通过学习系统动力学和控制策略,实现数据驱动的预测控制,并确保系统安全。
- 仿真结果表明,该方法在计算成本显著降低的同时,性能与现有基准相当。
📝 摘要(中文)
本研究提出了一种创新的控制框架,旨在提高模型预测控制(MPC)的实际可行性。该框架通过学习系统动力学和控制策略,实现了高效的数据驱动预测控制,同时确保系统安全性,从而消除了对精确模型的需求,并减轻了非线性MPC(NMPC)的计算负担。该方法采用基于时空滤波器(STF)的并发学习进行系统辨识,利用鲁棒控制障碍函数(RCBF)确保模型不确定性下的系统安全,并采用基于RCBF的NMPC策略逼近。此外,还引入了一种在线策略校正机制,以抵消现有模型不确定性导致的性能下降。通过两个应用场景的仿真实验表明,该方法在显著降低计算成本的同时,提供了与现有基准相当的性能。
🔬 方法详解
问题定义:传统非线性模型预测控制(NMPC)依赖于精确的系统模型,而获取精确模型往往非常困难。此外,NMPC的计算复杂度高,难以在实时性要求高的非线性系统中应用。因此,如何降低对精确模型的依赖,并减轻计算负担,是本研究要解决的核心问题。
核心思路:本研究的核心思路是利用数据驱动的方法,直接从数据中学习系统动力学和控制策略,从而避免对精确模型的依赖。同时,采用鲁棒控制障碍函数(RCBF)来保证系统在模型不确定性下的安全性。此外,还引入在线策略校正机制,以进一步提高控制性能。
技术框架:该方法的技术框架主要包括三个模块:1) 基于时空滤波器(STF)的并发学习模块,用于系统辨识;2) 基于鲁棒控制障碍函数(RCBF)的安全保障模块,用于确保系统安全;3) 基于RCBF的NMPC策略逼近模块,用于学习控制策略。此外,还包含一个在线策略校正模块,用于抵消模型不确定性带来的性能下降。
关键创新:该方法最重要的技术创新点在于将数据驱动的学习方法与安全控制方法相结合,实现了在模型不确定性下的安全预测控制。具体来说,利用STF进行系统辨识,可以有效地从数据中学习系统动力学;利用RCBF可以保证系统在模型不确定性下的安全性;利用在线策略校正机制可以进一步提高控制性能。
关键设计:在系统辨识模块中,STF的设计需要考虑时空相关性,以提高辨识精度。在安全保障模块中,RCBF的设计需要保证控制器的鲁棒性,以应对模型不确定性。在策略逼近模块中,需要选择合适的逼近器(如神经网络),并设计合适的损失函数,以保证逼近精度。在线策略校正机制的设计需要考虑校正速度和稳定性。
🖼️ 关键图片
📊 实验亮点
通过在两个应用场景(具体场景未知)的仿真实验中验证了该方法的有效性。实验结果表明,该方法在显著降低计算成本的同时,提供了与现有基准相当的性能。具体的性能数据和提升幅度未知,但整体而言,该方法在计算效率和控制性能之间取得了良好的平衡。
🎯 应用场景
该研究成果可应用于各种需要实时控制的非线性系统,例如机器人控制、自动驾驶、航空航天等领域。通过降低对精确模型的依赖和减轻计算负担,该方法可以扩展MPC的应用范围,提高控制系统的鲁棒性和安全性,具有重要的实际应用价值和未来发展潜力。
📄 摘要(原文)
In the realm of control systems, model predictive control (MPC) has exhibited remarkable potential; however, its reliance on accurate models and substantial computational resources has hindered its broader application, especially within real-time nonlinear systems. This study presents an innovative control framework to enhance the practical viability of the MPC. The developed safe data-driven predictive control aims to eliminate the requirement for precise models and alleviate computational burdens in the nonlinear MPC (NMPC). This is achieved by learning both the system dynamics and the control policy, enabling efficient data-driven predictive control while ensuring system safety. The methodology involves a spatial temporal filter (STF)-based concurrent learning for system identification, a robust control barrier function (RCBF) to ensure the system safety amid model uncertainties, and a RCBF-based NMPC policy approximation. An online policy correction mechanism is also introduced to counteract performance degradation caused by the existing model uncertainties. Demonstrated through simulations on two applications, the proposed approach offers comparable performance to existing benchmarks with significantly reduced computational costs.