Finite-Sample-Based Reachability for Safe Control with Gaussian Process Dynamics

📄 arXiv: 2505.07594v1 📥 PDF

作者: Manish Prajapat, Johannes Köhler, Amon Lahr, Andreas Krause, Melanie N. Zeilinger

分类: eess.SY, cs.LG, math.OC

发布日期: 2025-05-12


💡 一句话要点

提出基于有限样本的可达性方法以实现安全控制

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 高斯过程 模型预测控制 安全控制 动态系统 不确定性传播 采样方法 闭环控制

📋 核心要点

  1. 现有的GP-MPC方法要么依赖于近似,缺乏安全性保证,要么过于保守,限制了实际应用。
  2. 本文提出了一种基于采样的框架,有效传播模型的不确定性,避免了保守性问题。
  3. 通过数值示例验证了方法的有效性,展示了准确的可达集近似和安全的闭环控制性能。

📝 摘要(中文)

本文展示了高斯过程(GP)回归在学习未知动态方面的有效性,能够在多种应用中实现高效且安全的控制策略。然而,现有的基于GP的模型预测控制(GP-MPC)方法要么依赖于近似,缺乏保证,要么过于保守,限制了其实用性。为了解决这一问题,本文提出了一种基于采样的框架,有效传播模型的认知不确定性,同时避免保守性。我们建立了一种新的样本复杂度结果,利用从GP后验中采样的有限数量的动态函数构建可达集。基于此,我们设计了一种递归可行的采样基于GP-MPC方案,确保闭环安全性和稳定性具有高概率。最后,我们通过两个数值示例展示了该方法的有效性,突出了准确的可达集过度近似和安全的闭环性能。

🔬 方法详解

问题定义:本文旨在解决现有GP-MPC方法在安全控制中的不足,尤其是缺乏保证和过于保守的问题。

核心思路:提出了一种基于采样的框架,通过有效传播模型的不确定性,构建可达集,确保控制策略的安全性和稳定性。

技术框架:整体架构包括动态函数的采样、可达集的构建和基于GP的模型预测控制。主要模块包括样本采集、动态传播和控制策略优化。

关键创新:建立了新的样本复杂度结果,允许使用有限数量的动态函数构建可达集,显著提高了控制的安全性和效率。

关键设计:在参数设置上,采用了高斯过程的后验分布进行动态函数的采样,设计了递归可行的控制策略,确保闭环系统的安全性和稳定性。

📊 实验亮点

实验结果表明,所提出的方法在可达集的准确性上显著优于传统方法,能够在高概率下保证闭环安全性和稳定性。具体而言,方法在两个数值示例中展示了较高的性能提升,验证了其有效性。

🎯 应用场景

该研究的潜在应用领域包括自动驾驶、机器人控制和无人机飞行等安全关键系统。通过提供有效的控制策略,该方法能够在动态环境中实现安全操作,具有重要的实际价值和广泛的未来影响。

📄 摘要(原文)

Gaussian Process (GP) regression is shown to be effective for learning unknown dynamics, enabling efficient and safety-aware control strategies across diverse applications. However, existing GP-based model predictive control (GP-MPC) methods either rely on approximations, thus lacking guarantees, or are overly conservative, which limits their practical utility. To close this gap, we present a sampling-based framework that efficiently propagates the model's epistemic uncertainty while avoiding conservatism. We establish a novel sample complexity result that enables the construction of a reachable set using a finite number of dynamics functions sampled from the GP posterior. Building on this, we design a sampling-based GP-MPC scheme that is recursively feasible and guarantees closed-loop safety and stability with high probability. Finally, we showcase the effectiveness of our method on two numerical examples, highlighting accurate reachable set over-approximation and safe closed-loop performance.