Safety Meets Speed: Accelerated Neural MPC with Safety Guarantees and No Retraining

📄 arXiv: 2509.06404v1 📥 PDF

作者: Kaikai Wang, Tianxun Li, Liang Xu, Qinglei Hu, Keyou You

分类: cs.RO

发布日期: 2025-09-08

备注: 12 pages, 9 figures, accepted to RA-L


💡 一句话要点

提出BAN-MPC框架,加速安全MPC,无需重训练,适用于嵌入式系统。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 神经MPC 控制Barrier函数 嵌入式系统 自主导航

📋 核心要点

  1. 传统MPC虽然能通过约束保证安全性,但实时执行计算量大,难以满足嵌入式系统的算力需求。
  2. BAN-MPC框架结合神经网络的快速计算和MPC的约束处理能力,使用控制Barrier函数确保安全性。
  3. 实验表明,BAN-MPC比传统MPC快200倍,且在模型参数变化时仍能保持较低的控制误差。

📝 摘要(中文)

本文提出了一种集成了Barrier函数的自适应神经模型预测控制(BAN-MPC)框架,该框架将神经网络的快速计算能力与MPC的约束处理能力相结合。为了确保严格的安全性,我们使用控制Barrier函数(CBFs)代替传统的欧几里德距离来进行避碰。我们将离线学习的神经价值函数集成到短时域MPC的优化目标中,从而大大降低了在线计算复杂度。此外,我们使用第二个神经网络来学习价值函数对系统参数的敏感性,并根据这种神经敏感性自适应地调整神经价值函数,从而消除了重训练的需要并降低了离线计算成本。在Jetson Nano上的硬件在环(HIL)实验表明,BAN-MPC的求解速度比传统MPC快200倍,在模型参数变化在15%以内的情况下,能够实现控制误差低于5%的无碰撞导航,使其成为一种有效的嵌入式MPC替代方案。

🔬 方法详解

问题定义:传统模型预测控制(MPC)虽然可以通过约束条件保证系统的安全性,但其在线优化过程计算量大,难以在算力受限的嵌入式系统上实时运行。现有的神经MPC方法虽然可以加速计算,但通常需要大量的离线训练,并且难以保证在模型参数发生变化时的安全性。

核心思路:本文的核心思路是将一个离线学习的神经价值函数集成到短时域MPC的优化目标中,从而减少在线计算量。同时,使用控制Barrier函数(CBFs)来确保系统的安全性,并使用另一个神经网络来学习价值函数对系统参数的敏感性,从而在模型参数发生变化时自适应地调整价值函数,避免重新训练。

技术框架:BAN-MPC框架主要包含以下几个模块:1) 短时域MPC:使用较短的预测时域,降低在线计算复杂度。2) 神经价值函数:离线学习一个神经价值函数,用于估计长期成本,并将其集成到MPC的优化目标中。3) 控制Barrier函数:使用CBFs来定义安全约束,确保避碰。4) 神经敏感性估计器:使用另一个神经网络来学习价值函数对系统参数的敏感性,用于自适应地调整价值函数。

关键创新:本文最重要的技术创新点在于:1) 将控制Barrier函数集成到神经MPC框架中,从而保证了系统的安全性。2) 提出了一个自适应的神经价值函数调整方法,该方法可以根据模型参数的变化自适应地调整价值函数,避免了重新训练的需要。3) 通过结合神经价值函数和神经敏感性估计器,实现了在保证安全性的前提下,显著降低了在线计算复杂度。

关键设计:1) 神经价值函数的网络结构和训练方法:具体网络结构未知,但通过离线训练学习长期成本的估计。2) 控制Barrier函数的具体形式:使用CBFs来定义安全约束,具体形式取决于具体的系统和安全要求。3) 神经敏感性估计器的网络结构和训练方法:具体网络结构未知,但通过训练学习价值函数对系统参数的敏感性。4) MPC的优化目标函数:包含控制成本、终端成本(神经价值函数)和安全约束(CBFs)。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在Jetson Nano上的硬件在环实验表明,BAN-MPC的求解速度比传统MPC快200倍,并且在模型参数变化在15%以内的情况下,能够实现控制误差低于5%的无碰撞导航。这表明BAN-MPC在嵌入式系统上具有很强的实用性。

🎯 应用场景

BAN-MPC框架适用于资源受限的嵌入式系统,例如无人机、移动机器人等,可用于实现快速、安全的自主导航和控制。该方法在机器人导航、自动驾驶、工业自动化等领域具有广泛的应用前景,能够提高系统的实时性和安全性,降低开发和维护成本。

📄 摘要(原文)

While Model Predictive Control (MPC) enforces safety via constraints, its real-time execution can exceed embedded compute budgets. We propose a Barrier-integrated Adaptive Neural Model Predictive Control (BAN-MPC) framework that synergizes neural networks' fast computation with MPC's constraint-handling capability. To ensure strict safety, we replace traditional Euclidean distance with Control Barrier Functions (CBFs) for collision avoidance. We integrate an offline-learned neural value function into the optimization objective of a Short-horizon MPC, substantially reducing online computational complexity. Additionally, we use a second neural network to learn the sensitivity of the value function to system parameters, and adaptively adjust the neural value function based on this neural sensitivity when model parameters change, eliminating the need for retraining and reducing offline computation costs. The hardware in-the-loop (HIL) experiments on Jetson Nano show that BAN-MPC solves 200 times faster than traditional MPC, enabling collision-free navigation with control error below 5\% under model parameter variations within 15\%, making it an effective embedded MPC alternative.