Dual Control of Linear Systems from Bilinear Observations with Belief Space Model Predictive Control

📄 arXiv: 2604.24663v1 📥 PDF

作者: Daniel Cao, Beixi Du, Andrew Lowitt, Sunmook Choi, Sarah Dean, Yahya Sattar

分类: math.OC, cs.LG, eess.SY

发布日期: 2026-04-27


💡 一句话要点

提出基于信念空间模型预测控制的双线性观测线性系统双重控制方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 信念空间 卡尔曼滤波 双线性观测 线性系统 状态估计 最优控制

📋 核心要点

  1. 传统分离原则在控制输入影响观测质量的线性系统中失效,导致次优控制。
  2. 提出信念空间模型预测控制(B-MPC),直接在估计状态和误差协方差上进行规划,优化控制策略。
  3. 数值实验表明,B-MPC在特定场景下优于分离原则控制器及其MPC变体,降低了估计协方差。

📝 摘要(中文)

本文研究了具有双线性观测的线性系统的有限时域二次控制问题,其中控制输入不仅影响状态动态,还影响状态的部分观测。在这种情况下,分离原则可能失效,因为控制输入会影响未来状态估计的质量。状态估计需要一个输入相关的卡尔曼滤波器,其增益和误差协方差随控制输入而变化。为了解决这个挑战,我们提出了一种信念空间模型预测控制(B-MPC)方法,该方法直接在估计状态及其误差协方差上进行规划。特别地,B-MPC使用由输入相关的卡尔曼滤波器定义的信念演化的确定性替代模型进行规划。通过在两个合成环境中的数值实验,我们表明B-MPC在有利的条件下可以优于分离原则控制器及其MPC变体,并且这些增益伴随着更低的估计协方差和更具不确定性意识的动作选择。

🔬 方法详解

问题定义:论文旨在解决线性系统在双线性观测下的有限时域二次控制问题。传统方法,如基于分离原则的控制器,在控制输入会影响未来状态估计质量的情况下表现不佳,因为它们没有考虑到控制输入对观测的影响。现有方法无法有效处理由于控制输入导致的观测质量变化,从而导致次优的控制策略。

核心思路:论文的核心思路是直接在信念空间(belief space)中进行规划,即同时考虑估计状态和其误差协方差。通过使用模型预测控制(MPC)框架,B-MPC能够预测控制输入对未来状态估计的影响,并优化控制策略以最小化成本函数,同时降低状态估计的不确定性。这种方法避免了分离原则的局限性,能够做出更明智的控制决策。

技术框架:B-MPC的整体框架包括以下几个主要模块:1) 输入相关的卡尔曼滤波器:用于根据控制输入更新状态估计和误差协方差。2) 信念演化模型:使用卡尔曼滤波器定义的信念演化的确定性替代模型,预测未来状态估计和误差协方差。3) 模型预测控制器:基于信念演化模型,优化控制输入序列,以最小化成本函数。4) 优化器:使用数值优化方法求解MPC问题,得到最优控制输入。

关键创新:该论文的关键创新在于将模型预测控制应用于信念空间,从而能够显式地考虑控制输入对状态估计质量的影响。与传统的基于分离原则的控制器相比,B-MPC能够更好地处理控制输入和观测之间的耦合关系,从而实现更优的控制性能。此外,使用确定性替代模型简化了信念演化过程,降低了计算复杂度。

关键设计:B-MPC的关键设计包括:1) 输入相关的卡尔曼滤波器设计,确保状态估计的准确性。2) 成本函数的设计,通常包括状态误差和控制输入的惩罚项,用于平衡控制性能和控制成本。3) 优化算法的选择,例如序列二次规划(SQP)等,用于高效地求解MPC问题。4) 预测时域的长度,需要根据具体问题进行调整,以平衡计算复杂度和控制性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

数值实验表明,在特定的合成环境中,B-MPC的性能优于基于分离原则的控制器及其MPC变体。具体而言,B-MPC能够显著降低状态估计的协方差,并做出更具不确定性意识的动作选择。实验结果验证了B-MPC在处理控制输入影响观测质量的线性系统控制问题上的有效性。

🎯 应用场景

该研究成果可应用于机器人导航、自动驾驶、传感器网络等领域,尤其是在控制输入会显著影响观测质量的场景下。例如,在机器人主动感知中,机器人可以通过控制自身的运动来优化传感器获取的信息,从而提高定位和建图的精度。此外,该方法还可以应用于资源受限的控制系统,通过优化控制策略来降低状态估计的不确定性,提高系统的鲁棒性。

📄 摘要(原文)

We study finite-horizon quadratic control of linear systems with bilinear observations, in which the control input affects not only the state dynamics but also the partial observations of the state. In this setting, the separation principle can fail because control inputs influence the future quality of state estimates. State estimation requires an input-dependent Kalman filter whose gain and error covariance evolve as functions of the control inputs. To address this challenge, we propose a belief-space model predictive control ($\texttt{B-MPC}$) method that plans directly over both the estimated state and its error covariance. In particular, $\texttt{B-MPC}$ plans with a deterministic surrogate of the belief evolution defined by the input-dependent Kalman filter. Through numerical experiments in two synthetic settings, we show that $\texttt{B-MPC}$ can outperform both the separation-principle controller and its MPC variant in favorable regimes, and that these gains are accompanied by lower estimation covariance and more uncertainty-aware action choices.