Synthesis and SOS-based Stability Verification of a Neural-Network-Based Controller for a Two-wheeled Inverted Pendulum
作者: Alvaro Detailleur, Dalim Wahby, Guillaume Ducard, Christopher Onder
分类: eess.SY
发布日期: 2025-08-21
备注: Submitted to the IEEE for possible publication, 16 pages, 10 figures
💡 一句话要点
提出基于神经网络控制器的两轮倒立摆稳定性SOS验证方法
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 神经网络控制 平方和(SOS)验证 两轮倒立摆 模型预测控制(MPC) 稳定性分析
📋 核心要点
- 现有基于模型预测控制的倒立摆控制方法计算量大,难以在嵌入式硬件上实时运行。
- 提出一种基于神经网络的控制器,通过模仿模型预测控制器的行为,降低计算复杂度。
- 通过SOS稳定性验证方法,验证了神经网络控制器的局部渐近稳定性,并在实际倒立摆上验证了其有效性。
📝 摘要(中文)
本文首次确立了基于平方和(SOS)的稳定性验证程序在利用神经网络控制器(NNC)的应用控制问题中的可行性和实用价值。成功验证了使用通用程序合成的NNC的闭环稳定性,该NNC模仿了用于两轮倒立摆演示系统的鲁棒的基于管道的模型预测控制器(MPC)。这是通过首先为两轮倒立摆开发状态估计器和面向控制的模型来实现的。接下来,该面向控制的模型用于合成基线线性二次调节器(LQR)和鲁棒的基于管道的MPC,但MPC的计算量对于在演示系统的嵌入式硬件上进行实时执行来说太大了。通用合成程序生成模仿鲁棒的基于管道的MPC的NNC。通过基于SOS的稳定性验证程序,获得了局部渐近稳定性的证书和闭环系统(包含此NNC)的吸引域(RoA)的相关内部估计。最后,在物理两轮倒立摆上的实验结果表明,与基线LQR相比,NNC既能稳定系统,又能提高在调节和参考跟踪任务中的控制性能。
🔬 方法详解
问题定义:论文旨在解决两轮倒立摆的实时稳定控制问题。传统的模型预测控制(MPC)虽然性能优异,但计算复杂度高,难以在嵌入式系统上实时运行。因此,需要一种计算效率更高,同时又能保证系统稳定性的控制方法。
核心思路:论文的核心思路是利用神经网络(NNC)来模仿鲁棒的基于管道的MPC的控制策略。通过训练神经网络学习MPC的输入输出映射关系,从而在运行时使用神经网络替代MPC,降低计算负担。同时,采用基于平方和(SOS)的稳定性验证方法,对神经网络控制器的闭环系统进行稳定性分析,确保控制器的安全性。
技术框架:整体流程包括以下几个阶段:1) 建立两轮倒立摆的状态估计器和面向控制的模型;2) 基于该模型设计基线LQR控制器和鲁棒的基于管道的MPC;3) 使用MPC的输入输出数据训练神经网络控制器;4) 使用SOS方法验证神经网络控制器的局部渐近稳定性,并估计吸引域;5) 在实际两轮倒立摆系统上进行实验验证。
关键创新:该论文的关键创新在于将神经网络控制器与SOS稳定性验证方法相结合,为复杂控制系统的设计提供了一种新的思路。通过神经网络模仿MPC,降低了计算复杂度,使其能够在嵌入式系统上实时运行。同时,SOS稳定性验证方法为神经网络控制器的安全性提供了理论保障。
关键设计:论文中,神经网络控制器的具体网络结构和训练方法未知,但强调了使用鲁棒的基于管道的MPC生成训练数据。SOS稳定性验证方法的具体实现细节也未详细描述,但指出其用于验证局部渐近稳定性和估计吸引域。
🖼️ 关键图片
📊 实验亮点
实验结果表明,与基线LQR控制器相比,神经网络控制器在两轮倒立摆的稳定控制和参考跟踪任务中均表现出更好的性能。神经网络控制器不仅能够稳定系统,还能提高控制精度和响应速度。此外,通过SOS稳定性验证,获得了局部渐近稳定性的证书和吸引域的估计,为控制器的安全性提供了保障。
🎯 应用场景
该研究成果可应用于各种需要实时稳定控制的场景,例如机器人、无人机、自动驾驶车辆等。通过神经网络模仿复杂的控制策略,可以降低计算成本,提高控制系统的响应速度和鲁棒性。同时,SOS稳定性验证方法可以为控制系统的安全性提供保障,使其能够安全可靠地运行。
📄 摘要(原文)
This work newly establishes the feasibility and practical value of a sum of squares (SOS)-based stability verification procedure for applied control problems utilizing neural-network-based controllers (NNCs). It successfully verifies closed-loop stability properties of a NNC synthesized using a generalizable procedure to imitate a robust, tube-based model predictive controller (MPC) for a two-wheeled inverted pendulum demonstrator system. This is achieved by first developing a state estimator and control-oriented model for the two-wheeled inverted pendulum. Next, this control-oriented model is used to synthesize a baseline linear-quadratic regulator (LQR) and a robust, tube-based MPC, which is computationally too demanding for real-time execution on the demonstrator system's embedded hardware. The generalizable synthesis procedure generates an NNC imitating the robust, tube-based MPC. Via an SOS-based stability verification procedure, a certificate of local asymptotic stability and a relevant inner estimate of the region of attraction (RoA) are obtained for the closed-loop system incorporating this NNC. Finally, experimental results on the physical two-wheeled inverted pendulum demonstrate that the NNC both stabilizes the system, and improves the control performance compared to the baseline LQR in both regulation and reference-tracking tasks.