A safety governor for learning explicit MPC controllers from data

📄 arXiv: 2507.19531v1 📥 PDF

作者: Anjie Mao, Zheming Wang, Hao Gu, Bo Chen, Li Yu

分类: eess.SY, stat.ME

发布日期: 2025-07-21


💡 一句话要点

提出一种基于学习的显式MPC安全调控器,确保高维系统中的安全性和计算效率

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 显式MPC 安全调控器 神经网络控制 学习控制

📋 核心要点

  1. 现有方法在高维系统中,基于学习的显式MPC控制器计算复杂度高,难以保证安全约束。
  2. 论文提出一种安全调控器,将学习的显式MPC重构为双模方案,确保系统在可行集内运行,并在原点附近切换为线性反馈。
  3. 通过数值实验验证了所提方法的有效性,即使在高维系统中也能保证安全性和计算效率。

📝 摘要(中文)

本文致力于使用神经网络(NNs)逼近模型预测控制(MPC)律。我们提出了一种新颖的基于学习的显式MPC结构,该结构被重新表述为最大约束可行集上的双模方案。该方案确保了基于学习的显式MPC在进入原点邻域时退化为线性反馈控制。我们构建了一个安全调控器,以确保基于学习的显式MPC满足所有状态和输入约束。与现有方法相比,我们的方法在实现上计算量更小,即使在高维系统中也是如此。给出了安全调控器递归可行性的证明。我们的方法通过数值例子进行了演示。

🔬 方法详解

问题定义:论文旨在解决基于学习的显式模型预测控制(MPC)在高维系统中计算复杂度高,难以保证状态和输入约束的问题。现有的方法通常需要大量的计算资源来求解优化问题,或者难以保证系统的安全性。

核心思路:论文的核心思路是设计一个安全调控器,将学习得到的显式MPC控制器转换为一个双模控制方案。该方案在状态空间的不同区域采用不同的控制策略:在远离原点的区域,使用学习的显式MPC控制器;在接近原点的区域,切换到线性反馈控制器。安全调控器的作用是确保系统始终满足状态和输入约束,并在两种控制模式之间平滑切换。

技术框架:整体框架包含以下几个主要模块:1) 离线学习显式MPC控制器:使用神经网络逼近MPC控制律。2) 构建最大约束可行集:确定系统在约束条件下可以安全运行的状态空间区域。3) 设计安全调控器:根据当前状态,判断是否需要切换到线性反馈控制,并确保切换过程的安全性。4) 在线控制:根据安全调控器的输出,选择使用学习的显式MPC控制器或线性反馈控制器。

关键创新:论文的关键创新在于提出了一种基于学习的显式MPC安全调控器,该调控器能够有效地保证系统在满足约束条件下的安全运行,并且具有较低的计算复杂度。与现有方法相比,该方法不需要在线求解复杂的优化问题,因此更适合于高维系统。此外,该方法通过双模控制方案,在保证安全性的同时,也能够充分利用学习得到的MPC控制器的性能。

关键设计:安全调控器的设计是关键。它需要能够准确地判断当前状态是否需要切换到线性反馈控制,并且确保切换过程的安全性。这通常涉及到对状态空间进行划分,并设计合适的切换规则。此外,线性反馈控制器的设计也需要考虑系统的稳定性和性能。损失函数的设计需要平衡学习的MPC控制器的性能和安全性。网络结构的选择需要考虑计算复杂度和逼近精度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过数值实验验证了所提方法的有效性。实验结果表明,该方法能够有效地保证系统在满足状态和输入约束条件下的安全运行,并且具有较低的计算复杂度。与传统的MPC方法相比,该方法在高维系统中具有明显的优势。具体的性能数据和对比基线在论文中进行了详细的展示。

🎯 应用场景

该研究成果可应用于各种需要高精度控制和安全保障的领域,例如机器人控制、自动驾驶、化工过程控制等。特别是在高维复杂系统中,该方法能够有效地降低计算复杂度,提高控制系统的实时性和可靠性。未来,该方法有望在更多实际工程问题中得到应用,推动智能控制技术的发展。

📄 摘要(原文)

We tackle neural networks (NNs) to approximate model predictive control (MPC) laws. We propose a novel learning-based explicit MPC structure, which is reformulated into a dual-mode scheme over maximal constrained feasible set. The scheme ensuring the learning-based explicit MPC reduces to linear feedback control while entering the neighborhood of origin. We construct a safety governor to ensure that learning-based explicit MPC satisfies all the state and input constraints. Compare to the existing approach, our approach is computationally easier to implement even in high-dimensional system. The proof of recursive feasibility for the safety governor is given. Our approach is demonstrated on numerical examples.