Adaptive Tracking Control with Binary-Valued Output Observations

📄 arXiv: 2411.05975v1 📥 PDF

作者: Lantian Zhang, Lei Guo

分类: eess.SY

发布日期: 2024-11-08


💡 一句话要点

针对二值输出观测,提出线性系统自适应跟踪控制方法

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 自适应控制 二值观测 线性系统 双数组鞅 全局收敛 最优控制 IIR系统 参数估计

📋 核心要点

  1. 传统自适应控制算法依赖精确的回归向量,但在二值输出观测下难以应用。
  2. 论文提出基于双数组鞅理论的自适应估计方法,克服了二值观测带来的困难。
  3. 证明了闭环自适应控制系统的最优性,即长期平均跟踪误差最小化。

📝 摘要(中文)

本文研究了有限维线性系统在二值且随机扰动输出观测下的实时控制和学习问题。由于只能获得二值输出信息,传统自适应算法中回归向量的精确值不可用,该问题长期以来被认为是开放性难题。为了克服这一困难,我们考虑了相应无限脉冲响应(IIR)动态系统的自适应估计问题,并应用了先前未在自适应控制中使用的双数组鞅理论。这使得我们能够建立自适应预测遗憾和参数估计误差的全局收敛结果,而无需像几乎所有现有相关文献那样,依赖于持续激励和有界系统信号等严格的数据条件。在此基础上,设计了一种能够有效结合自适应学习和反馈控制的自适应控制律。最后,我们证明了闭环自适应控制系统是最优的,因为对于任何给定的有界参考信号,长期平均跟踪误差几乎肯定会被最小化。据我们所知,这似乎是第一个针对具有通用二值传感器和任意给定有界参考信号的通用线性系统的自适应控制结果。

🔬 方法详解

问题定义:论文旨在解决有限维线性系统在二值输出观测下的自适应跟踪控制问题。现有方法通常依赖于精确的系统输出信息,但在实际应用中,传感器可能只能提供二值化的输出,例如“是/否”、“高/低”等。这使得传统的基于回归向量的自适应控制算法失效,因为无法获得精确的回归向量值。此外,现有方法通常需要持续激励等严格的数据条件,限制了其应用范围。

核心思路:论文的核心思路是将二值输出观测下的自适应控制问题转化为相应无限脉冲响应(IIR)动态系统的自适应估计问题。通过估计IIR系统的参数,可以间接获得对原始线性系统的控制能力。此外,论文利用双数组鞅理论来分析算法的收敛性,避免了对系统信号的有界性和持续激励等苛刻条件的要求。

技术框架:论文的整体技术框架包括以下几个主要步骤:1) 将二值输出观测下的线性系统控制问题转化为IIR系统的自适应估计问题;2) 设计基于双数组鞅理论的自适应估计算法,用于估计IIR系统的参数;3) 基于估计的IIR系统参数,设计自适应控制律,将自适应学习和反馈控制相结合;4) 利用鞅理论证明闭环系统的全局收敛性和最优性,即长期平均跟踪误差最小化。

关键创新:论文的关键创新在于:1) 将双数组鞅理论引入到二值输出观测下的自适应控制问题中,为解决该问题提供了一种新的理论工具;2) 提出了基于IIR系统自适应估计的控制策略,克服了二值输出观测带来的困难;3) 证明了闭环系统的全局收敛性和最优性,无需依赖持续激励等严格的数据条件。

关键设计:论文的关键设计包括:1) 基于双数组鞅理论的自适应估计算法,具体形式未知;2) 将自适应学习和反馈控制相结合的自适应控制律,具体形式未知;3) 闭环系统的稳定性分析和收敛性证明,利用了鞅理论的相关结论。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文证明了闭环自适应控制系统是最优的,即对于任何给定的有界参考信号,长期平均跟踪误差几乎肯定会被最小化。该结果在理论上保证了算法的性能,并且无需依赖持续激励等严格的数据条件,具有更广泛的适用性。具体性能数据和对比基线未知。

🎯 应用场景

该研究成果可应用于各种需要低成本、低功耗传感器的控制系统,例如机器人、无人机、智能家居等。在这些应用中,使用二值传感器可以降低成本和功耗,但同时也带来了控制上的挑战。该论文提出的自适应控制方法可以有效地解决这些挑战,提高系统的性能和鲁棒性。此外,该方法还可以应用于医疗设备、环境监测等领域。

📄 摘要(原文)

This paper considers real-time control and learning problems for finite-dimensional linear systems under binary-valued and randomly disturbed output observations. This has long been regarded as an open problem because the exact values of the traditional regression vectors used in the construction of adaptive algorithms are unavailable, as one only has binary-valued output information. To overcome this difficulty, we consider the adaptive estimation problem of the corresponding infinite-impulse-response (IIR) dynamical systems, and apply the double array martingale theory that has not been previously used in adaptive control. This enables us to establish global convergence results for both the adaptive prediction regret and the parameter estimation error, without resorting to such stringent data conditions as persistent excitation and bounded system signals that have been used in almost all existing related literature. Based on this, an adaptive control law will be designed that can effectively combine adaptive learning and feedback control. Finally, we are able to show that the closed-loop adaptive control system is optimal in the sense that the long-run average tracking error is minimized almost surely for any given bounded reference signals. To the best of the authors' knowledge, this appears to be the first adaptive control result for general linear systems with general binary sensors and arbitrarily given bounded reference signals.