Varying Horizon Learning Economic MPC With Unknown Costs of Disturbed Nonlinear Systems

📄 arXiv: 2509.11823v1 📥 PDF

作者: Weiliang Xiong, Defeng He, Haiping Du, Jianbin Mu

分类: eess.SY

发布日期: 2025-09-15

备注: Submitted to a journal of Elsevier (under review, 15 Sep 2025)


💡 一句话要点

针对未知成本扰动非线性系统,提出变时域学习经济模型预测控制方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 经济模型预测控制 非线性系统 未知成本 扰动抑制 自适应时域 机器学习 回归学习

📋 核心要点

  1. 传统EMPC方法在处理具有未知经济成本和扰动的非线性系统时面临挑战,难以保证系统稳定性和经济性。
  2. 该论文提出了一种变时域EMPC方案,通过学习未知成本函数和自适应调整预测时域,实现对扰动非线性系统的有效控制。
  3. 仿真结果表明,该方案在鲁棒性、经济性能和在线计算负担方面均优于传统方法,适用于实际工业过程控制。

📝 摘要(中文)

本文提出了一种新颖的变时域经济模型预测控制(EMPC)方案,该方案无需终端约束,适用于具有加性扰动和未知经济成本的约束非线性系统。首先,采用混合核的一般回归学习框架来重构未知的成本函数。然后,开发了一种在线迭代过程来自适应地调整预测时域。此外,设计了一种优雅的、依赖于时域的收缩约束,以确保闭环系统收敛到期望稳态的邻域。最后,为EMPC下的闭环系统建立了确保递归可行性和输入-状态稳定性的充分条件。通过连续搅拌釜反应器和四罐系统的仿真验证了所提出方案在鲁棒性、经济性能和在线计算负担方面的优点。

🔬 方法详解

问题定义:论文旨在解决具有加性扰动和未知经济成本的约束非线性系统的经济模型预测控制(EMPC)问题。传统EMPC方法通常需要精确的系统模型和已知的成本函数,但在实际应用中,这些条件往往难以满足。此外,扰动的存在也会影响系统的稳定性和性能。因此,如何在未知成本和扰动下设计鲁棒且经济的EMPC策略是一个重要的挑战。

核心思路:论文的核心思路是结合机器学习和模型预测控制,利用一般回归学习框架重构未知的成本函数,并通过在线迭代过程自适应地调整预测时域。同时,设计一种依赖于时域的收缩约束,以保证闭环系统的稳定性和收敛性。这种方法能够在不依赖精确模型和已知成本函数的情况下,实现对扰动非线性系统的有效控制。

技术框架:该方法主要包含以下几个模块:1) 成本函数学习模块:使用混合核的一般回归学习框架,根据系统历史数据学习未知的经济成本函数。2) 时域自适应调整模块:通过在线迭代过程,根据系统的状态和性能指标,自适应地调整预测时域的长度。3) 模型预测控制模块:基于学习到的成本函数和自适应调整的时域,求解最优控制序列。4) 收缩约束设计模块:设计一种依赖于时域的收缩约束,以保证闭环系统的稳定性和收敛性。

关键创新:该论文的关键创新在于:1) 提出了一种基于一般回归学习框架的未知成本函数重构方法,无需精确的成本函数模型。2) 设计了一种在线迭代的时域自适应调整策略,能够根据系统的状态和性能指标动态调整预测时域,提高控制性能。3) 提出了一种依赖于时域的收缩约束,能够保证闭环系统的稳定性和收敛性。

关键设计:在成本函数学习模块中,混合核的选择和参数调整是关键。在时域自适应调整模块中,迭代过程的收敛速度和稳定性需要仔细考虑。在收缩约束设计模块中,收缩率的选择需要权衡系统的稳定性和性能。此外,在线优化的计算效率也是一个重要的考虑因素。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

通过连续搅拌釜反应器和四罐系统的仿真实验,验证了所提出方案的有效性。实验结果表明,与传统EMPC方法相比,该方案在鲁棒性方面表现更佳,能够更好地应对系统扰动;在经济性能方面,能够实现更低的运行成本;在在线计算负担方面,计算量适中,能够满足实时控制的需求。具体性能提升数据未知。

🎯 应用场景

该研究成果可广泛应用于化工、电力、交通等领域的复杂工业过程控制。例如,在连续搅拌釜反应器(CSTR)的控制中,可以利用该方法优化反应温度和物料流量,提高产品质量和降低生产成本。在智能交通系统中,可以利用该方法优化车辆行驶轨迹,减少交通拥堵和降低能源消耗。该方法具有很高的实际应用价值和推广前景。

📄 摘要(原文)

This paper proposes a novel varying horizon economic model predictive control (EMPC) scheme without terminal constraints for constrained nonlinear systems with additive disturbances and unknown economic costs. The general regression learning framework with mixed kernels is first used to reconstruct the unknown cost. Then an online iterative procedure is developed to adjust the horizon adaptively. Again, an elegant horizon-dependent contraction constraint is designed to ensure the convergence of the closed-loop system to a neighborhood of the desired steady state. Moreover, sufficient conditions ensuring recursive feasibility and input-to-state stability are established for the system in closed-loop with the EMPC. The merits of the proposed scheme are verified by the simulations of a continuous stirred tank reactor and a four-tank system in terms of robustness, economic performance and online computational burden.