Data-Driven Controlled Invariant Sets for Gaussian Process State Space Models
作者: Paul Griffioen, Bingzhuo Zhong, Murat Arcak, Majid Zamani, Marco Caccamo
分类: eess.SY
发布日期: 2024-07-15
💡 一句话要点
提出基于高斯过程状态空间模型的数据驱动控制不变集方法
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 高斯过程 状态空间模型 控制不变集 数据驱动控制 非线性系统 鲁棒控制 半定规划
📋 核心要点
- 传统非线性系统控制方法难以处理未建模动态和不确定性,导致控制性能下降甚至系统不稳定。
- 利用高斯过程状态空间模型的数据驱动特性,学习系统动态,并设计概率控制不变集,保证系统安全性。
- 通过仿真和物理实验验证了所提方法的有效性,在四旋翼飞行器上实现了安全可靠的控制。
📝 摘要(中文)
本文提出了一种使用高斯过程状态空间模型计算非线性系统概率控制不变集的方法。高斯过程状态空间模型是一种数据驱动模型,可以解释未建模和未知的非线性动力学。我们研究了鲁棒不变性和概率不变性之间的关系,并利用这种关系设计状态反馈控制器,以最大化系统保持在概率控制不变集内的概率。我们提出了一种基于半定规划的优化方案,用于设计受输入约束的状态反馈控制器。我们的结果在四旋翼飞行器上进行了演示和验证,包括仿真和物理平台实验。
🔬 方法详解
问题定义:论文旨在解决非线性系统在存在未建模动态和不确定性时,如何设计控制器以保证系统状态维持在一个安全区域内的问题。现有方法通常依赖于精确的系统模型,对模型误差敏感,难以保证实际应用中的鲁棒性和安全性。
核心思路:论文的核心思路是利用高斯过程状态空间模型(GP-SSM)来学习系统的动态特性,并基于学习到的模型计算概率控制不变集。通过最大化系统状态保持在不变集内的概率,设计状态反馈控制器,从而保证系统的安全性。GP-SSM能够捕捉未建模的非线性动态,提高控制器的鲁棒性。
技术框架:整体框架包括以下几个主要阶段:1) 数据采集:通过实验或仿真获取系统的输入输出数据。2) GP-SSM学习:利用采集到的数据训练GP-SSM,学习系统的动态模型。3) 概率控制不变集计算:基于学习到的GP-SSM,计算概率控制不变集,该集合表示系统状态以一定概率保持在内的安全区域。4) 控制器设计:设计状态反馈控制器,目标是最大化系统状态保持在概率控制不变集内的概率,同时满足输入约束。5) 实验验证:在仿真和实际平台上验证所设计控制器的性能。
关键创新:论文的关键创新在于将高斯过程状态空间模型与概率控制不变集理论相结合,提出了一种数据驱动的非线性系统安全控制方法。与传统的基于模型的控制方法相比,该方法能够更好地处理未建模动态和不确定性,提高控制器的鲁棒性和安全性。此外,论文还提出了一种基于半定规划的优化方案,用于设计满足输入约束的状态反馈控制器。
关键设计:关键设计包括:1) GP-SSM的核函数选择和参数优化,影响模型学习的精度。2) 概率控制不变集的定义和计算方法,需要平衡计算复杂度和保守性。3) 基于半定规划的控制器设计,需要选择合适的优化目标和约束条件,以保证控制器的性能和稳定性。4) 概率阈值的选取,影响控制不变集的保守程度和控制器的性能。
🖼️ 关键图片
📊 实验亮点
论文在四旋翼飞行器上进行了仿真和物理平台实验,验证了所提方法的有效性。实验结果表明,所设计的控制器能够有效地保证四旋翼飞行器的状态维持在概率控制不变集内,提高了系统的安全性。与传统的基于模型的控制方法相比,该方法能够更好地处理未建模动态和不确定性,提高了控制器的鲁棒性。具体性能数据未知。
🎯 应用场景
该研究成果可应用于各种需要安全可靠控制的非线性系统,例如无人机、机器人、自动驾驶车辆等。通过数据驱动的方式学习系统动态,并设计概率控制不变集,可以提高系统在复杂环境下的鲁棒性和安全性,降低事故发生的风险。未来可进一步扩展到更复杂的系统和环境,例如多智能体系统和动态环境。
📄 摘要(原文)
We compute probabilistic controlled invariant sets for nonlinear systems using Gaussian process state space models, which are data-driven models that account for unmodeled and unknown nonlinear dynamics. We investigate the relationship between robust and probabilistic invariance, leveraging this relationship to design state-feedback controllers that maximize the probability of the system staying within the probabilistic controlled invariant set. We propose a semi-definite-programming-based optimization scheme for designing the state-feedback controllers subject to input constraints. The effectiveness of our results are demonstrated and validated on a quadrotor, both in simulation and on a physical platform.