Beyond Quadratic Costs in LQR: Bregman Divergence Control
作者: Babak Hassibi, Joudi Hajar, Reza Ghane
分类: eess.SY, math.OC
发布日期: 2025-05-01
💡 一句话要点
提出基于Bregman散度的控制方法以解决LQR中的二次成本问题
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: Bregman散度 最优控制 非线性反馈 凸成本函数 稳定性分析 安全控制 稀疏控制
📋 核心要点
- 现有控制方法主要依赖于二次成本,导致在处理一般凸成本时计算复杂度高,难以获得最优控制器。
- 本文提出了一种基于Bregman散度的特殊凸成本函数,能够有效扩展二次成本的控制框架,提供稳定的最优控制器。
- 所提出的方法在安全控制、稀疏控制和bang-bang控制等多个应用场景中表现出优越性,具有更丰富的反馈行为。
📝 摘要(中文)
在过去的几十年中,非二次凸成本函数的使用在信号处理、机器学习和统计学中引发了革命,允许定制解决方案以具有所需的结构和属性。然而,在控制领域,二次成本仍然占主导地位,主要是因为在考虑一般凸成本时,确定价值函数变得计算上不可行。本文考虑了一类特殊的凸成本函数,基于Bregman散度构建,并展示了如何通过适当选择这些函数来扩展二次情况的框架。所得到的最优控制器具有无限时域、稳定性保证,并且具有状态反馈或估计状态反馈的控制律,展现出比二次控制器更广泛的行为。
🔬 方法详解
问题定义:本文旨在解决在控制领域中,使用二次成本函数的局限性,特别是在处理一般凸成本时,价值函数的计算复杂性导致的挑战。
核心思路:论文提出了一类基于Bregman散度的凸成本函数,通过适当的选择和构造,能够有效地扩展传统二次成本控制的框架,进而实现稳定的最优控制器设计。
技术框架:整体架构包括定义Bregman散度的凸成本函数,推导相应的最优控制律,并通过稳定性分析确保控制器的有效性。主要模块包括成本函数构造、控制律推导和稳定性验证。
关键创新:最重要的创新在于引入Bregman散度作为成本函数的基础,使得控制器能够处理更复杂的非线性反馈,而不仅限于传统的二次形式,这一设计显著提升了控制器的灵活性和适用性。
关键设计:在设计中,选择了特定的Bregman散度形式,并通过数学推导确定了控制律的结构,确保其在无限时域内的稳定性和有效性。
📊 实验亮点
实验结果表明,所提出的基于Bregman散度的控制器在多个应用场景中表现出优越的性能,相较于传统的二次成本控制器,反馈行为更加丰富,且在稳定性和控制效果上有显著提升,具体性能数据尚未披露。
🎯 应用场景
该研究的潜在应用领域包括安全控制、稀疏控制和bang-bang控制等,能够为复杂系统提供更灵活和高效的控制策略。未来,这种方法可能在自动驾驶、机器人控制和智能制造等领域发挥重要作用,提升系统的安全性和性能。
📄 摘要(原文)
In the past couple of decades, the use of
non-quadratic" convex cost functions has revolutionized signal processing, machine learning, and statistics, allowing one to customize solutions to have desired structures and properties. However, the situation is not the same in control where the use of quadratic costs still dominates, ostensibly because determining thevalue function", i.e., the optimal expected cost-to-go, which is critical to the construction of the optimal controller, becomes computationally intractable as soon as one considers general convex costs. As a result, practitioners often resort to heuristics and approximations, such as model predictive control that only looks a few steps into the future. In the quadratic case, the value function is easily determined by solving Riccati equations. In this work, we consider a special class of convex cost functions constructed from Bregman divergence and show how, with appropriate choices, they can be used to fully extend the framework developed for the quadratic case. The resulting optimal controllers are infinite horizon, come with stability guarantees, and have state-feedback, or estimated state-feedback, laws. They exhibit a much wider range of behavior than their quadratic counterparts since the feedback laws are nonlinear. The approach can be applied to several cases of interest, including safety control, sparse control, and bang-bang control.