Learning-Based Shrinking Disturbance-Invariant Tubes for State- and Input-Dependent Uncertainty
作者: Abdelrahman Ramadan, Sidney Givigi
分类: eess.SY, cs.RO, math.OC
发布日期: 2026-01-16
期刊: IEEE Control Systems Letters, vol. 9, pp. 2699-2704, Dec. 2025
DOI: 10.1109/LCSYS.2025.3641128
💡 一句话要点
提出基于学习的收缩干扰不变管道以解决状态和输入依赖的不确定性问题
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 管道模型预测控制 高斯过程 不确定性建模 收缩干扰不变管道 安全性验证 动态系统控制
📋 核心要点
- 现有方法在处理状态和输入依赖的不确定性时,难以有效构建收缩干扰不变管道,导致安全性验证的复杂性增加。
- 论文提出了一种基于学习的框架,通过高斯过程后验生成可信椭球体,并采用双时间尺度方案优化收缩管道的构建。
- 实验结果表明,所提方法在数据丰富区域能够有效收缩管道横截面,同时保持不变性,提升了安全性验证的效率。
📝 摘要(中文)
本文开发了一种基于学习的框架,用于构建在状态和输入依赖的不确定性下的收缩干扰不变管道,旨在作为管道模型预测控制(MPC)的基础构件,并通过提升的、单调的(保持顺序)不动点映射来认证安全性。高斯过程(GP)后验变为$(1-α)$可信椭球体,随后为确定性集合运算提供多面体外集。采用双时间尺度方案将学习周期与收敛至紧凑不动点$Z^igstarigsubseteqigoldmath{G}$的内外迭代分开;其状态投影是植物的RPI。随着数据的积累,干扰多面体收紧,相关管道单调嵌套,解决了待验证集合与干扰模型之间的循环依赖,同时保持硬约束。通过双积分器研究展示了在数据丰富区域收缩管道横截面,同时保持不变性。
🔬 方法详解
问题定义:本文旨在解决在状态和输入依赖的不确定性下构建收缩干扰不变管道的问题。现有方法在处理此类不确定性时,往往无法有效地进行安全性验证,导致系统性能下降。
核心思路:论文的核心思路是利用高斯过程后验生成$(1-α)$可信椭球体,并通过多面体外集进行确定性集合运算,从而构建收缩干扰不变管道。采用双时间尺度方案将学习和收敛过程分开,以提高效率和准确性。
技术框架:整体架构包括两个主要模块:第一模块为学习阶段,生成干扰多面体并进行数据积累;第二模块为收敛阶段,通过内外迭代优化管道的构建,确保其收缩和不变性。
关键创新:最重要的技术创新在于通过提升的单调不动点映射认证安全性,并解决了待验证集合与干扰模型之间的循环依赖问题。这一设计使得收缩管道的构建更加高效和可靠。
关键设计:关键设计包括高斯过程后验的使用、$(1-α)$可信椭球体的生成、以及双时间尺度的学习和收敛方案。这些设计确保了干扰多面体的收紧和管道的单调嵌套。
🖼️ 关键图片
📊 实验亮点
实验结果显示,所提方法在双积分器的研究中,能够在数据丰富区域有效收缩管道横截面,且保持不变性。与基线方法相比,收缩幅度显著提升,验证了该方法在安全性和效率上的优势。
🎯 应用场景
该研究的潜在应用领域包括自动驾驶、机器人控制和工业自动化等领域,能够有效提升系统在不确定环境下的安全性和可靠性。未来,该方法有望在更复杂的动态系统中得到应用,推动智能控制技术的发展。
📄 摘要(原文)
We develop a learning-based framework for constructing shrinking disturbance-invariant tubes under state- and input-dependent uncertainty, intended as a building block for tube Model Predictive Control (MPC), and certify safety via a lifted, isotone (order-preserving) fixed-point map. Gaussian Process (GP) posteriors become $(1-α)$ credible ellipsoids, then polytopic outer sets for deterministic set operations. A two-time-scale scheme separates learning epochs, where these polytopes are frozen, from an inner, outside-in iteration that converges to a compact fixed point $Z^\star!\subseteq!\mathcal G$; its state projection is RPI for the plant. As data accumulate, disturbance polytopes tighten, and the associated tubes nest monotonically, resolving the circular dependence between the set to be verified and the disturbance model while preserving hard constraints. A double-integrator study illustrates shrinking tube cross-sections in data-rich regions while maintaining invariance.