Efficient model predictive control for nonlinear systems modelled by deep neural networks

📄 arXiv: 2405.10372v1 📥 PDF

作者: Jianglin Lan

分类: eess.SY, cs.LG, math.OC

发布日期: 2024-05-16

备注: 8 pages, 5 figures


💡 一句话要点

针对深度神经网络建模的非线性系统,提出高效模型预测控制方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 深度神经网络 非线性系统 混合整数规划 线性松弛 倒立摆 实时控制

📋 核心要点

  1. 传统MPC方法难以处理由深度神经网络建模的复杂非线性动态系统,实时性面临挑战。
  2. 论文提出混合整数规划(MIP)和线性松弛(LR)两种方法,求解非线性MPC问题,平衡精度和计算效率。
  3. 在ReLU神经网络建模的倒立摆系统上进行了实验,验证了MIP和LR方法的性能,并进行了对比分析。

📝 摘要(中文)

本文提出了一种模型预测控制(MPC)方法,用于控制由深度神经网络(NNs)建模的动态系统,该系统具有非线性和不确定性,并受到输入和状态约束。由于神经网络的输出包含系统状态和控制输入的高阶复杂非线性,MPC问题是非线性的,难以求解以进行实时控制。本文提出了两种解决MPC问题的方法:混合整数规划(MIP)方法,该方法可以为非线性MPC生成精确解;以及线性松弛(LR)方法,该方法通常提供次优解,但计算成本要低得多。通过对各种大小的ReLU神经网络建模的倒立摆系统进行广泛的数值模拟,以演示和比较MIP和LR方法的性能。

🔬 方法详解

问题定义:论文旨在解决由深度神经网络建模的非线性动态系统的模型预测控制问题。现有方法在处理此类问题时,由于神经网络引入的高阶非线性,导致MPC问题求解复杂度高,难以满足实时控制的需求。尤其是在存在输入和状态约束的情况下,问题变得更加复杂。

核心思路:论文的核心思路是利用混合整数规划(MIP)和线性松弛(LR)两种方法来求解非线性MPC问题。MIP方法旨在找到精确解,但计算成本较高;LR方法则通过牺牲一定的精度来降低计算复杂度,从而实现更快的求解速度。通过这两种方法的结合,可以在精度和计算效率之间进行权衡。

技术框架:整体框架包括以下几个主要步骤:1) 使用深度神经网络对非线性动态系统进行建模;2) 基于神经网络模型构建非线性MPC问题,包括目标函数和约束条件;3) 使用MIP或LR方法求解MPC问题,得到最优控制序列;4) 将控制序列应用于实际系统,并重复上述过程。

关键创新:论文的关键创新在于提出了两种不同的方法来解决基于神经网络的非线性MPC问题。MIP方法能够保证解的精确性,而LR方法则通过线性化神经网络的输出,显著降低了计算复杂度。这种双管齐下的策略为解决实际问题提供了更大的灵活性。

关键设计:论文使用了ReLU激活函数的神经网络进行系统建模。对于MIP方法,需要将ReLU函数转化为混合整数约束。对于LR方法,则需要设计合适的线性松弛策略,例如分段线性逼近。此外,目标函数的设计也需要考虑控制性能和计算复杂度之间的平衡。具体的参数设置和网络结构的选择会影响最终的控制效果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过对ReLU神经网络建模的倒立摆系统进行数值模拟,验证了所提出方法的有效性。实验结果表明,MIP方法能够获得精确的控制效果,但计算时间较长;LR方法虽然精度略有下降,但计算速度显著提升,更适合实时控制应用。通过调整线性松弛的程度,可以在精度和计算效率之间进行权衡。

🎯 应用场景

该研究成果可应用于各种需要精确控制的非线性动态系统,例如机器人控制、自动驾驶、过程控制等。通过使用深度神经网络进行系统建模,可以更好地处理系统的不确定性和复杂性。高效的MPC求解方法则可以保证控制系统的实时性和稳定性,具有重要的实际应用价值和广阔的应用前景。

📄 摘要(原文)

This paper presents a model predictive control (MPC) for dynamic systems whose nonlinearity and uncertainty are modelled by deep neural networks (NNs), under input and state constraints. Since the NN output contains a high-order complex nonlinearity of the system state and control input, the MPC problem is nonlinear and challenging to solve for real-time control. This paper proposes two types of methods for solving the MPC problem: the mixed integer programming (MIP) method which produces an exact solution to the nonlinear MPC, and linear relaxation (LR) methods which generally give suboptimal solutions but are much computationally cheaper. Extensive numerical simulation for an inverted pendulum system modelled by ReLU NNs of various sizes is used to demonstrate and compare performance of the MIP and LR methods.