Integrated Online Monitoring and Adaption of Process Model Predictive Controllers
作者: Samuel Mallick, Laura Boca de de Giuli, Alessio La Bella, Azita Dabiri, Bart De Schutter, Riccardo Scattolini
分类: eess.SY
发布日期: 2026-03-12
备注: 6 pages, 3 figures, submitted to IEEE L-CSS
💡 一句话要点
提出一种基于事件触发的自适应MPC方法,用于解决过程控制中模型失配问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 模型预测控制 自适应控制 事件触发控制 强化学习 系统辨识
📋 核心要点
- 现有MPC方法持续更新模型参数,易导致灾难性遗忘和不必要的控制修改。
- 提出基于闭环性能指标统计监控的事件触发自适应方法,仅在性能下降时更新。
- 通过强化学习和辨识技术进行控制器自适应,并在区域供热系统仿真中验证有效性。
📝 摘要(中文)
本文提出了一种基于事件触发、数据驱动和性能导向的模型预测控制(MPC)自适应方法。该策略的性能高度依赖于预测模型的准确性,因此可能需要在线自适应以防止在运行条件变化时性能下降。与持续从数据更新模型和控制参数的现有方法不同(这可能导致灾难性遗忘和不必要的控制修改),我们提出了一种基于闭环性能指标统计监控的新方法。该框架能够检测性能下降,并在需要时通过强化学习和辨识技术执行控制器自适应。所提出的策略在一个高保真区域供热系统基准的仿真中得到了验证。
🔬 方法详解
问题定义:模型预测控制(MPC)的性能依赖于预测模型的准确性。在实际应用中,由于运行条件的变化,模型可能会失配,导致控制性能下降。现有方法通常采用持续在线更新模型和控制参数的方式来应对模型失配,但这种方式容易导致灾难性遗忘,并且可能引入不必要的控制修改,影响系统的稳定性。
核心思路:本文的核心思路是采用一种事件触发的自适应策略,仅在检测到控制性能下降时才进行模型和控制器的更新。通过统计监控闭环性能指标,可以及时发现性能下降的情况,避免频繁的模型更新,从而提高系统的鲁棒性和稳定性。
技术框架:该方法主要包含以下几个模块:1) 闭环性能监控模块:该模块负责实时监控系统的闭环性能指标,例如跟踪误差、控制输入的变化等。2) 事件触发模块:该模块基于统计监控的结果,判断是否触发模型和控制器的自适应过程。3) 模型辨识模块:当触发自适应过程时,该模块利用在线数据辨识新的预测模型。4) 控制器自适应模块:该模块基于新的预测模型,利用强化学习等技术调整MPC控制器的参数。
关键创新:该方法最重要的创新点在于引入了事件触发机制,避免了不必要的模型更新,提高了系统的鲁棒性和稳定性。与现有方法相比,该方法能够更加智能地进行模型和控制器的自适应,从而在保证控制性能的同时,降低了计算负担和潜在的风险。
关键设计:性能监控模块采用统计过程控制(SPC)方法,例如CUSUM或EWMA图,来检测性能指标的显著变化。事件触发阈值的设定需要权衡检测灵敏度和误报率。模型辨识模块可以采用递推最小二乘(RLS)等在线辨识算法。控制器自适应模块可以采用Q-learning等强化学习算法,以优化控制器的性能指标。
📊 实验亮点
论文通过高保真区域供热系统仿真验证了所提出方法的有效性。实验结果表明,该方法能够在系统性能下降时及时进行自适应调整,恢复控制性能,并且避免了频繁的模型更新,提高了系统的鲁棒性。具体的性能提升数据(例如跟踪误差的降低幅度、能源消耗的减少量等)需要在论文中查找。
🎯 应用场景
该研究成果可应用于各种需要高精度控制的工业过程,例如化工过程、电力系统、智能建筑等。通过在线监测和自适应调整控制策略,可以提高系统的运行效率、降低能源消耗、并保证系统的安全稳定运行。该方法对于应对过程工业中常见的模型不确定性和时变性问题具有重要意义。
📄 摘要(原文)
This paper addresses the design of an event-triggered, data-based, and performance-oriented adaption method for model predictive control (MPC). The performance of such a strategy strongly depends on the accuracy of the prediction model, which may require online adaption to prevent performance degradation under changing operating conditions. Unlike existing methods that continuously update model and control parameters from data, potentially leading to catastrophic forgetting and unnecessary control modifications, we propose a novel approach based on statistical monitoring of closed-loop performance indicators. This framework enables the detection of performance degradation, and, when required, controller adaption is performed via reinforcement learning and identification techniques. The proposed strategy is validated on a high-fidelity simulation of a district heating system benchmark.