Distributionally robust two-stage model predictive control: adaptive constraint tightening with stability guarantee
作者: Weijiang Zheng, Jiayi Huang, Bing Zhu
分类: eess.SY
发布日期: 2026-03-10
💡 一句话要点
提出基于Wasserstein分布鲁棒优化的两阶段模型预测控制,解决未知分布扰动下的自适应约束收紧问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 模型预测控制 分布鲁棒优化 Wasserstein距离 自适应约束收紧 两阶段优化
📋 核心要点
- 传统鲁棒MPC在处理未知分布扰动时过于保守,而随机MPC依赖于精确的扰动分布知识,实际应用受限。
- 论文提出TSDR-MPC,利用两阶段分布鲁棒优化,实现针对未知时变均值和协方差扰动的自适应约束收紧。
- 通过数值模拟验证,该框架在各种扰动场景下表现出良好的适应性和鲁棒性,并提供了理论保证。
📝 摘要(中文)
本文针对模型预测控制(MPC)在处理具有未知分布扰动时的挑战,提出了一种新颖的两阶段分布鲁棒MPC(TSDR-MPC)方案。该方案将约束违反惩罚建模为第二阶段优化问题,与第一阶段的二次成本相结合,构成了一个两阶段分布鲁棒程序。这种结构能够针对具有未知时变均值和协方差的扰动进行自适应约束收紧。利用Wasserstein模糊集,通过强对偶性推导出易于处理的重构,并开发了一种在有限次迭代中收敛的切割平面算法,适用于实时实现。为了确保即使在非零均值扰动下也能实现闭环稳定性,引入了一个仅应用于标称系统的终端约束,该约束与当前状态成比例,且独立于分布不确定性,从而保持了整体可行性。提供了严格的理论保证,包括递归可行性、有限时间算法终止以及平均闭环成本的渐近性能界限。数值模拟验证了所提出的框架在各种扰动场景下的适应性和鲁棒性。
🔬 方法详解
问题定义:传统模型预测控制(MPC)在实际应用中,系统状态经常受到具有未知分布的扰动影响。鲁棒MPC虽然能保证约束满足,但过于保守;随机MPC虽然平衡了保守性和性能,但依赖于精确的扰动分布知识,而这在实际中往往难以获得。因此,如何在未知扰动分布的情况下,设计一种既能保证系统安全,又能兼顾性能的MPC方法是一个关键问题。
核心思路:本文的核心思路是将分布鲁棒优化(DRO)引入MPC框架,通过构建一个两阶段优化问题,实现对未知分布扰动的自适应约束收紧。第一阶段优化控制输入,第二阶段优化约束违反惩罚,从而在保证鲁棒性的同时,降低保守性。利用Wasserstein模糊集来描述扰动分布的不确定性,并利用强对偶性将问题转化为易于求解的形式。
技术框架:TSDR-MPC的整体框架包含以下几个主要步骤: 1. 状态估计:利用传感器数据估计当前系统状态。 2. 两阶段优化:求解两阶段分布鲁棒优化问题,得到最优控制输入序列。 3. 控制应用:将最优控制输入序列的第一个元素应用到实际系统中。 4. 状态更新:根据系统动力学模型和实际扰动,更新系统状态。 5. 循环迭代:重复以上步骤,实现闭环控制。
关键创新:该论文的关键创新在于: 1. 两阶段分布鲁棒优化:将约束违反惩罚建模为第二阶段优化问题,能够自适应地调整约束收紧程度,降低保守性。 2. Wasserstein模糊集:利用Wasserstein模糊集来描述扰动分布的不确定性,避免了对扰动分布的精确建模。 3. 切割平面算法:开发了一种在有限次迭代中收敛的切割平面算法,适用于实时实现。 4. 终端约束设计:为了保证闭环稳定性,引入了一个仅应用于标称系统的终端约束,该约束与当前状态成比例,且独立于分布不确定性。
关键设计: 1. Wasserstein半径:Wasserstein半径的选择会影响控制器的保守性。较大的半径对应于更大的不确定性集合,从而导致更保守的控制策略。 2. 惩罚函数:第二阶段优化问题中的惩罚函数用于衡量约束违反的程度。合适的惩罚函数可以平衡约束满足和性能之间的关系。 3. 终端约束系数:终端约束的系数需要仔细选择,以保证闭环稳定性,同时避免过度约束系统。
🖼️ 关键图片
📊 实验亮点
数值模拟结果表明,所提出的TSDR-MPC方法在各种扰动场景下都表现出良好的适应性和鲁棒性。与传统的鲁棒MPC相比,TSDR-MPC能够显著降低保守性,提高系统性能。此外,切割平面算法能够在有限次迭代中收敛,保证了算法的实时性。
🎯 应用场景
该研究成果可应用于各种受不确定扰动影响的控制系统,例如机器人导航、自动驾驶、电力系统控制和过程控制等。通过自适应地调整约束,该方法可以在保证系统安全性的前提下,提高系统的性能和效率,具有重要的实际应用价值和广阔的应用前景。
📄 摘要(原文)
Model Predictive Control (MPC) is widely recognized for its ability to explicitly handle system constraints. In practice, system states are often affected by disturbances with unknown distributions. While robust MPC guarantees constraint satisfaction under worst-case scenarios, it tends to be overly conservative. Stochastic MPC balances conservatism and performance but relies on precise knowledge of the disturbance distribution, which is often unavailable. To address this challenge, this paper introduces Distributionally Robust Optimization (DRO) into the MPC framework and proposes a novel Two-Stage Distributionally Robust MPC (TSDR-MPC) scheme. The key innovation lies in formulating constraint violation penalties as a second-stage optimization problem, which, combined with the first-stage quadratic cost, constitutes a two-stage distributionally robust program. This structure enables adaptive constraint tightening against disturbances with unknown time-varying means and covariances. Utilizing a Wasserstein ambiguity set, we derive a tractable reformulation via strong duality and develop a cutting-plane algorithm that converges in a finite number of iterations, suitable for real-time implementation. To ensure closed-loop stability even under non-zero mean disturbances, we introduce a terminal constraint applied solely to the nominal system; this constraint is proportional to the current state and independent of distributional uncertainty, thus preserving overall feasibility. We provide rigorous theoretical guarantees, including recursive feasibility, finite-time algorithm termination, and an asymptotic performance bound on the average closed-loop cost. Numerical simulations validate the adaptability and robustness of the proposed framework under various disturbance scenarios.