Varying Horizon Learning Economic MPC With Unknown Costs of Disturbed Nonlinear Systems
作者: Weiliang Xiong, Defeng He, Haiping Du, Jianbin Mu
分类: eess.SY
发布日期: 2025-09-15
备注: Submitted to a journal of Elsevier (under review, 15 Sep 2025)
💡 一句话要点
针对未知成本扰动非线性系统,提出变时域学习经济模型预测控制方法
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 经济模型预测控制 非线性系统 自适应控制 回归学习 时域调整
📋 核心要点
- 传统EMPC方法在处理具有未知经济成本和扰动的非线性系统时面临挑战,难以保证系统稳定性和经济性。
- 该论文提出一种变时域EMPC方案,利用回归学习重构未知成本,并自适应调整预测时域,同时设计收缩约束以保证系统收敛。
- 仿真结果表明,该方法在连续搅拌釜反应器和四罐系统中表现出良好的鲁棒性、经济性能和可接受的在线计算负担。
📝 摘要(中文)
本文提出了一种新颖的变时域经济模型预测控制(EMPC)方案,该方案无需终端约束,适用于具有加性扰动和未知经济成本的约束非线性系统。首先,采用混合核的一般回归学习框架来重构未知的成本函数。然后,开发了一种在线迭代过程来自适应地调整预测时域。此外,设计了一种优雅的、依赖于时域的收缩约束,以确保闭环系统收敛到期望稳态的邻域。最后,为EMPC下的闭环系统建立了保证递归可行性和输入-状态稳定性的充分条件。通过连续搅拌釜反应器和四罐系统的仿真验证了该方案在鲁棒性、经济性能和在线计算负担方面的优点。
🔬 方法详解
问题定义:论文旨在解决具有加性扰动和未知经济成本的约束非线性系统的经济模型预测控制(EMPC)问题。现有方法通常需要精确的成本函数模型,并且难以保证在存在扰动的情况下系统的稳定性和经济性。此外,固定时域的EMPC可能导致次优的性能或计算负担过重。
核心思路:论文的核心思路是利用数据驱动的方法学习未知的成本函数,并自适应地调整预测时域,以在经济性和稳定性之间取得平衡。通过在线迭代调整时域长度,并设计时域相关的收缩约束,确保闭环系统的收敛性。
技术框架:该方法包含以下几个主要模块:1) 使用混合核的一般回归学习框架重构未知成本函数;2) 在线迭代过程,自适应调整预测时域长度;3) 设计时域相关的收缩约束,保证系统收敛到期望稳态的邻域;4) 建立递归可行性和输入-状态稳定性的充分条件。整体流程为:首先利用历史数据学习成本函数,然后在每个控制周期,根据当前状态和学习到的成本函数,通过优化求解器计算控制输入和更新预测时域。
关键创新:该方法的主要创新点在于:1) 提出了一种基于回归学习的未知成本函数重构方法,避免了对精确成本函数模型的依赖;2) 设计了一种自适应调整预测时域的在线迭代过程,能够在经济性和计算负担之间进行权衡;3) 引入了时域相关的收缩约束,保证了闭环系统的稳定性和收敛性。
关键设计:在回归学习中,使用了混合核函数,以提高模型的泛化能力。在线迭代过程中,时域长度的调整基于成本函数的梯度信息,以实现更快的收敛速度。收缩约束的设计依赖于李雅普诺夫稳定性理论,确保系统状态能够逐渐收缩到期望稳态的邻域。具体的参数设置需要根据具体的系统特性进行调整。
📊 实验亮点
通过连续搅拌釜反应器和四罐系统的仿真实验,验证了所提出方案的有效性。实验结果表明,该方法能够在保证系统稳定性的前提下,显著提高系统的经济性能,并降低在线计算负担。与传统的固定时域EMPC相比,该方法在鲁棒性和经济性方面均有明显提升。
🎯 应用场景
该研究成果可应用于化工过程控制、电力系统调度、机器人控制等领域,尤其适用于那些经济成本难以精确建模且存在扰动的复杂非线性系统。通过自适应地学习成本函数和调整预测时域,可以提高系统的经济性能和鲁棒性,降低对系统模型的依赖,具有重要的实际应用价值。
📄 摘要(原文)
This paper proposes a novel varying horizon economic model predictive control (EMPC) scheme without terminal constraints for constrained nonlinear systems with additive disturbances and unknown economic costs. The general regression learning framework with mixed kernels is first used to reconstruct the unknown cost. Then an online iterative procedure is developed to adjust the horizon adaptively. Again, an elegant horizon-dependent contraction constraint is designed to ensure the convergence of the closed-loop system to a neighborhood of the desired steady state. Moreover, sufficient conditions ensuring recursive feasibility and input-to-state stability are established for the system in closed-loop with the EMPC. The merits of the proposed scheme are verified by the simulations of a continuous stirred tank reactor and a four-tank system in terms of robustness, economic performance and online computational burden.