Stochastic MPC with Online-optimized Policies and Closed-loop Guarantees

📄 arXiv: 2502.06469v1 📥 PDF

作者: Marcell Bartos, Alexandre Didier, Jerome Sieber, Johannes Köhler, Melanie N. Zeilinger

分类: eess.SY, math.OC

发布日期: 2025-02-10


💡 一句话要点

提出基于在线优化策略和闭环保证的随机模型预测控制方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 随机模型预测控制 概率约束 在线优化 反馈策略 闭环控制

📋 核心要点

  1. 传统随机MPC方法在处理概率约束时较为保守,限制了其在实际系统中的应用。
  2. 该论文提出一种在线优化反馈策略的随机MPC方法,通过动态调整策略降低保守性。
  3. 数值实验验证了该方法在降低保守性和提高闭环性能方面的有效性。

📝 摘要(中文)

本文提出了一种针对受加性高斯扰动影响的线性系统的随机模型预测控制方法。该方法保证了概率约束的闭环满足性和底层凸优化问题的递归可行性。通过在线优化反馈策略,与固定反馈方法相比,提高了性能并降低了保守性。其核心机制是概率约束的有限确定最大容许集,以及在每个时间步长根据当前知识对预测的概率约束进行重新调整。数值算例表明,所提出的方法降低了保守性,并在实现的闭环成本方面提高了性能。

🔬 方法详解

问题定义:该论文旨在解决线性系统在存在加性高斯扰动下的随机模型预测控制问题。现有方法,特别是基于固定反馈策略的随机MPC,通常过于保守,导致性能下降。这种保守性源于对不确定性的过度估计,以及未能充分利用在线信息来调整控制策略。

核心思路:核心思路是在线优化反馈策略,从而能够根据当前状态和对未来的更准确预测来调整控制动作。通过在每个时间步重新调整预测的概率约束,并利用有限确定最大容许集,该方法能够更有效地处理不确定性,降低保守性,并提高闭环性能。

技术框架:该方法的核心是一个随机模型预测控制框架,它包含以下几个主要阶段:1) 基于线性系统模型和加性高斯扰动进行状态预测;2) 根据当前状态和预测的不确定性,在线优化反馈策略;3) 利用有限确定最大容许集来保证概率约束的满足;4) 在每个时间步,根据新的观测信息重新调整预测的概率约束。整个框架通过凸优化问题求解来实现。

关键创新:最重要的技术创新点是在线优化反馈策略和概率约束的动态调整。与传统的固定反馈策略相比,在线优化能够更好地适应系统的动态变化和不确定性,从而降低保守性。概率约束的动态调整则允许系统利用最新的信息来改进预测,进一步提高性能。

关键设计:关键设计包括:1) 采用凸优化方法来求解在线优化问题,保证了计算效率和全局最优性;2) 使用有限确定最大容许集来显式地处理概率约束,避免了复杂的数值积分或采样方法;3) 设计合适的反馈策略参数化形式,以便于在线优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

数值实验表明,所提出的方法在降低保守性和提高闭环性能方面优于传统的固定反馈策略。具体而言,该方法能够显著降低实现的闭环成本,并在满足概率约束的同时,实现更积极的控制目标。实验结果验证了在线优化反馈策略和概率约束动态调整的有效性。

🎯 应用场景

该研究成果可应用于各种受不确定性影响的线性系统控制,例如自动驾驶、机器人导航、过程控制等。通过降低保守性,该方法能够提高系统的性能和安全性,使其在实际应用中更具竞争力。未来,该方法可以扩展到非线性系统和更复杂的扰动模型。

📄 摘要(原文)

This paper proposes a stochastic model predictive control method for linear systems affected by additive Gaussian disturbances. Closed-loop satisfaction of probabilistic constraints and recursive feasibility of the underlying convex optimization problem is guaranteed. Optimization over feedback policies online increases performance and reduces conservatism compared to fixed-feedback approaches. The central mechanism is a finitely determined maximal admissible set for probabilistic constraints, together with the reconditioning of the predicted probabilistic constraints on the current knowledge at every time step. The proposed method's reduced conservatism and improved performance in terms of the achieved closed-loop cost is demonstrated in a numerical example.