Amortized Nonlinear Model Predictive Control

📄 arXiv: 2606.05840v1 📥 PDF

作者: Francesco Pillitteri, Alberto Bemporad

分类: eess.SY, cs.RO

发布日期: 2026-06-04

备注: 6 pages


💡 一句话要点

提出状态依赖的二次规划以解决非线性模型预测控制问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 非线性模型预测控制 二次规划 机器人控制 实时计算 状态依赖 残差校正 约束优化

📋 核心要点

  1. 非线性模型预测控制在实时求解约束非线性规划时面临计算瓶颈,限制了其在资源受限硬件上的应用。
  2. 提出通过状态依赖的二次规划近似最优控制动作,设计单网络残差校正架构以提高计算效率。
  3. 在三连杆平面机器人手臂的实验中,方法实现了数量级的速度提升,同时保持了跟踪性能的可比性。

📝 摘要(中文)

非线性模型预测控制(NMPC)需要在每个采样时刻实时求解约束非线性规划(NLP),这在资源受限的硬件或高采样率下成为计算瓶颈。本文针对输入仿射非线性系统,提出了一种通过状态依赖的二次规划(QP)来近似最优控制动作的方法。我们设计了一个单网络残差校正架构,利用状态依赖的解析基线提供初始QP参数,网络仅学习与完整NLP解匹配所需的校正。通过可微分的内点层求解QP,确保了首个控制动作的约束满足。我们在三连杆平面机器人手臂的笛卡尔末端执行器跟踪实验中验证了该方法,显示出相较于NLP求解器的速度提升数量级,同时保持了相似的跟踪性能。

🔬 方法详解

问题定义:本文解决的是非线性模型预测控制(NMPC)在实时求解约束非线性规划(NLP)时的计算瓶颈问题。现有方法在资源受限的硬件或高采样率下难以有效部署。

核心思路:论文提出通过状态依赖的二次规划(QP)来近似最优控制动作,利用单网络残差校正架构来减少计算负担,确保实时性。

技术框架:整体架构包括一个状态依赖的解析基线用于提供初始QP参数,网络学习校正以匹配完整NLP解,QP通过可微分的内点层求解以保证约束满足。

关键创新:最重要的创新在于将状态依赖的QP与残差校正结合,显著提升了计算效率,与传统的NLP求解方法相比,减少了实时求解的复杂性。

关键设计:网络训练采用离线生成的数据,结合监督模仿和KKT残差惩罚的混合损失函数,确保网络能够有效学习所需的校正。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在三连杆平面机器人手臂的笛卡尔末端执行器跟踪任务中,相较于传统NLP求解器实现了数量级的速度提升,同时保持了相似的跟踪性能,展示了其在实际应用中的有效性。

🎯 应用场景

该研究的潜在应用领域包括机器人控制、自动驾驶和工业自动化等。通过提高非线性模型预测控制的计算效率,能够在更广泛的实时控制场景中实现高效的决策制定,具有重要的实际价值和未来影响。

📄 摘要(原文)

Nonlinear Model Predictive Control requires solving a constrained nonlinear program (NLP) in real-time at every sampling instant, a computational bottleneck that limits deployment on resource-constrained hardware or at high sampling rates. We address this challenge for the broad class of input-affine nonlinear systems to show that the optimal control move can be approximated by a state-dependent quadratic program (QP) whose cost parameters depend on the current state and reference. We propose a single-network residual-corrector architecture: a state-dependent analytic baseline provides initial QP parameters, and the network learns only the corrections needed to match the full NLP solution; the QP is solved by a differentiable interior-point layer, guaranteeing constraint satisfaction for the first control action. The network is trained offline on data generated by an NLP solver using a hybrid loss that combines supervised imitation and KKT-residual penalties. We validate the approach on a three-link planar robotic arm with Cartesian end-effector tracking, demonstrating orders-of-magnitude speedup over the NLP solver while maintaining comparable tracking performance.