Annealed Ensemble Kalman Inversion for Constrained Nonlinear Model Predictive Control: An ADMM Approach
作者: Ahmed Khalil, Mohamed Safwat, Efstathios Bakolas
分类: math.OC, eess.SY
发布日期: 2025-10-01
💡 一句话要点
提出一种基于ADMM的退火集成卡尔曼反演算法,用于求解约束非线性模型预测控制问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 模型预测控制 非线性优化 集成卡尔曼反演 交替方向乘子法 约束优化 机器人控制 贝叶斯优化
📋 核心要点
- 传统NMPC方法在处理复杂约束时面临挑战,难以保证全局最优解和计算效率。
- 该论文提出基于ADMM的EKI算法,将约束NMPC问题转化为无约束优化,并通过退火策略平衡探索与收敛。
- 实验结果表明,该方法在性能上优于基于MPPI控制的DIAL-MPC,验证了其有效性。
📝 摘要(中文)
本研究提出了一种新颖的基于交替方向乘子法(ADMM)的集成卡尔曼反演(EKI)算法,用于解决约束非线性模型预测控制(NMPC)问题。首先,NMPC问题中的阶段性非线性不等式约束通过带有非负松弛变量的增广拉格朗日函数嵌入。然后,我们证明了NMPC的无约束增广拉格朗日公式具有贝叶斯解释:在高斯观测模型下,其极小值与最大后验(MAP)估计量重合,从而可以通过EKI求解。然而,由于松弛变量的非负约束不能通过高斯噪声强制执行,因此我们提出的算法产生了一个双块ADMM,该算法在以下步骤之间交替:(i)最小化无约束增广拉格朗日函数的原始步骤,(ii)松弛变量的非负性投影,以及(iii)对偶上升步骤。为了平衡探索和收敛,退火策略调整协方差和惩罚权重,从而鼓励早期的全局搜索和后期的精确约束满足。为了证明所提出方法的性能,我们将其与另一种基于模型预测路径积分(MPPI)控制的迭代采样方法(称为DIAL-MPC)进行了比较。
🔬 方法详解
问题定义:论文旨在解决约束非线性模型预测控制(NMPC)问题。现有方法,如直接法或序列二次规划(SQP),在处理复杂非线性约束时,容易陷入局部最优,计算复杂度高,难以满足实时性要求。此外,基于采样的方法,如MPPI,虽然可以处理非线性,但在高维空间中效率较低。
核心思路:论文的核心思路是将约束NMPC问题转化为一个无约束优化问题,然后利用集成卡尔曼反演(EKI)进行求解。通过引入增广拉格朗日函数,将不等式约束转化为目标函数中的惩罚项。同时,利用ADMM框架,将原始变量和对偶变量分离,简化优化过程。EKI方法利用集成的方式逼近后验分布,能够有效地进行全局搜索。
技术框架:整体算法流程如下: 1. 增广拉格朗日函数构建:将NMPC问题中的不等式约束通过增广拉格朗日函数嵌入到目标函数中,引入非负松弛变量。 2. ADMM迭代:使用双块ADMM算法,交替更新原始变量(控制输入和状态)、松弛变量和对偶变量。 3. EKI求解:在原始变量更新步骤中,利用EKI算法最小化无约束增广拉格朗日函数,得到控制输入。 4. 非负性投影:对松弛变量进行非负性投影,保证约束满足。 5. 对偶变量更新:更新对偶变量,加强约束。 6. 退火策略:采用退火策略,逐渐降低协方差和惩罚权重,平衡探索和收敛。
关键创新:该方法的主要创新在于将ADMM和EKI结合,用于求解约束NMPC问题。传统的EKI方法难以直接处理非负约束,而ADMM框架能够有效地分离变量,使得EKI能够应用于增广拉格朗日函数。此外,退火策略的引入,能够更好地平衡全局探索和局部收敛。
关键设计:关键设计包括: 1. 增广拉格朗日函数:选择合适的惩罚参数,保证约束的有效嵌入。 2. EKI参数:选择合适的集成大小和噪声水平,平衡估计精度和计算效率。 3. 退火策略:设计合适的退火schedule,控制协方差和惩罚权重的下降速度。 4. ADMM参数:选择合适的步长,保证ADMM算法的收敛性。
🖼️ 关键图片
📊 实验亮点
论文通过实验验证了所提出方法的有效性。与基于MPPI控制的DIAL-MPC相比,该方法在约束满足度和控制性能上均有提升。具体而言,在相同的计算资源下,该方法能够更精确地满足约束条件,并获得更低的控制成本。实验结果表明,该方法具有良好的性能和潜力。
🎯 应用场景
该方法可应用于机器人运动规划、自动驾驶、过程控制等领域,尤其适用于存在复杂非线性约束的控制问题。例如,在机器人运动规划中,可以避免碰撞、关节限制等约束;在自动驾驶中,可以保证车辆行驶的安全性和舒适性。该方法具有良好的实时性和鲁棒性,有望在实际工程中得到广泛应用。
📄 摘要(原文)
This work proposes a novel Alternating Direction Method of Multipliers (ADMM)-based Ensemble Kalman Inversion (EKI) algorithm for solving constrained nonlinear model predictive control (NMPC) problems. First, the stage-wise nonlinear inequality constraints in the NMPC problem are embedded via an augmented Lagrangian with nonnegative slack variables. We then show that the unconstrained augmented Lagrangian formulation of the NMPC admits a Bayesian interpretation: under a Gaussian observation model, its minimizers coincide with MAP estimators, enabling solution via EKI. However, since the nonnegativity constraint on the slacks cannot be enforced via Gaussian noise, our proposed algorithm results in a two-block ADMM that alternates between (i) a primal step that minimizes the unconstrained augmented Lagrangian, (ii) a nonnegativity projection for the slacks, and (iii) a dual ascent step. To balance exploration and convergence, an annealing schedule tempers covariances and penalty weights, thereby encouraging global search early and precise constraint satisfaction later. To demonstrate the performance of the proposed method, we compare it with another iterative sampling-based approach based on Model Predictive Path Integral (MPPI) control, called DIAL-MPC.