Incorporating ESO into Deep Koopman Operator Modelling for Control of Autonomous Vehicles

📄 arXiv: 2405.10157v1 📥 PDF

作者: Hao Chen, Chen Lv

分类: eess.SY

发布日期: 2024-05-16


💡 一句话要点

提出基于扩展状态观测器的深度Koopman算子模型,用于自动驾驶车辆控制。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 深度Koopman算子 扩展状态观测器 模型预测控制 自动驾驶 车辆控制

📋 核心要点

  1. 传统基于物理的车辆建模方法难以准确捕捉非线性特性,而无限维Koopman算子在实际应用中无法直接实现。
  2. 利用深度神经网络离线学习Koopman算子的基函数,将非线性车辆动力学映射到线性空间,并引入扩展状态观测器在线估计扰动。
  3. 在CarSim/Simulink平台上,ESO-DKMPC在双车道变换场景下,相较于LMPC和NMPC,展现出更好的轨迹跟踪性能。

📝 摘要(中文)

Koopman算子理论是一种数据驱动的建模方法,能够准确捕捉车辆等机电系统的非线性特性,优于基于物理的方法。然而,无限维的Koopman算子在实际应用中无法实现。为了通过数据集而非手动试错来近似无限维Koopman算子,我们采用深度神经网络(DNN)通过离线训练提取基函数,并将车辆平面动力学的非线性映射到提升空间中的线性形式。此外,还探讨了基函数维度对模型精度的影响。进一步地,引入扩展状态观测器(ESO)来在线估计提升空间中的总扰动,并补偿学习到的深度Koopman算子(DK)的建模误差和残差,同时提高其泛化能力。然后,将所提出的模型应用于预测车辆在预测范围内的状态,并由此构建模型预测控制(MPC)的约束有限时间优化问题,即ESO-DKMPC。在自动驾驶车辆的轨迹跟踪方面,ESO-DKMPC生成车轮转向角,以基于解耦控制结构控制横向运动。在CarSim/Simulink联合仿真平台上建立了双车道变换场景下的各种工况,并与基于物理模型的线性MPC(LMPC)和非线性MPC(NMPC)进行了广泛的比较。结果表明,所提出的ESO-DKMPC在线性和非线性区域都具有更好的跟踪性能和适度的有效性。

🔬 方法详解

问题定义:论文旨在解决自动驾驶车辆控制中,传统基于物理模型的控制方法难以精确建模车辆非线性动力学,以及无限维Koopman算子难以直接应用于实际控制的问题。现有方法要么模型精度不足,要么计算复杂度过高,难以满足实时性要求。

核心思路:论文的核心思路是利用深度学习方法近似Koopman算子,将非线性系统映射到线性空间,从而简化控制器的设计。同时,引入扩展状态观测器(ESO)来估计和补偿模型误差和外部扰动,提高控制器的鲁棒性和泛化能力。这种方法结合了数据驱动的建模能力和观测器的抗干扰能力。

技术框架:整体框架包括三个主要模块:1) 离线深度Koopman算子学习:使用深度神经网络学习车辆动力学的Koopman算子,将状态空间映射到高维线性空间。2) 在线扩展状态观测器:利用ESO估计提升空间中的总扰动。3) 模型预测控制:基于学习到的Koopman算子和ESO的扰动估计,设计模型预测控制器(MPC)进行车辆轨迹跟踪。

关键创新:论文的关键创新在于将深度Koopman算子建模与扩展状态观测器相结合,用于自动驾驶车辆控制。深度Koopman算子提供了一种数据驱动的非线性系统线性化方法,而ESO则能够有效地补偿模型误差和外部扰动,从而提高控制器的鲁棒性和泛化能力。

关键设计:在深度Koopman算子学习中,使用了深度神经网络来近似Koopman算子的基函数。损失函数的设计需要考虑预测精度和模型复杂度。扩展状态观测器的设计需要合理选择观测器的增益,以保证观测器的稳定性和快速性。模型预测控制器的设计需要考虑车辆的运动学约束和动力学约束,以及控制器的实时性要求。

📊 实验亮点

在CarSim/Simulink联合仿真平台上,与LMPC和NMPC相比,所提出的ESO-DKMPC在双车道变换场景下表现出更好的轨迹跟踪性能。具体而言,ESO-DKMPC能够更准确地跟踪目标轨迹,并具有更小的跟踪误差。实验结果表明,该方法在线性和非线性区域都具有良好的控制效果。

🎯 应用场景

该研究成果可应用于自动驾驶车辆的轨迹跟踪、路径规划和运动控制等领域。通过数据驱动的方式学习车辆动力学模型,并利用扩展状态观测器提高控制器的鲁棒性,有望提升自动驾驶系统的安全性和可靠性。未来,该方法还可以扩展到其他类型的机器人和控制系统。

📄 摘要(原文)

Koopman operator theory is a kind of data-driven modelling approach that accurately captures the nonlinearities of mechatronic systems such as vehicles against physics-based methods. However, the infinite-dimensional Koopman operator is impossible to implement in real-world applications. To approximate the infinite-dimensional Koopman operator through collection dataset rather than manual trial and error, we adopt deep neural networks (DNNs) to extract basis functions by offline training and map the nonlinearities of vehicle planar dynamics into a linear form in the lifted space. Besides, the effects of the dimensions of basis functions on the model accuracy are explored. Further, the extended state observer (ESO) is introduced to online estimate the total disturbance in the lifted space and compensate for the modelling errors and residuals of the learned deep Koopman operator (DK) while also improving its generalization. Then, the proposed model is applied to predict vehicle states within prediction horizons and later formulates the constrained finite-time optimization problem of model predictive control (MPC), i.e., ESO-DKMPC. In terms of the trajectory tracking of autonomous vehicles, the ESO-DKMPC generates the wheel steering angle to govern lateral motions based on the decoupling control structure. The various conditions under the double-lane change scenarios are built on the CarSim/Simulink co-simulation platform, and extensive comparisons are conducted with the linear MPC (LMPC) and nonlinear MPC (NMPC) informed by the physics-based model. The results indicate that the proposed ESO-DKMPC has better tracking performance and moderate efficacy both within linear and nonlinear regions.