Smooth Sampling-Based Model Predictive Control Using Deterministic Samples

📄 arXiv: 2601.03893v1 📥 PDF

作者: Markus Walker, Marcel Reith-Braun, Tai Hoang, Gerhard Neumann, Uwe D. Hanebeck

分类: eess.SY

发布日期: 2026-01-07


💡 一句话要点

提出基于确定性采样的MPPI控制,解决非线性系统控制输入非光滑问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 确定性采样 非线性系统 路径积分 机器人控制

📋 核心要点

  1. 基于采样的MPC在非线性系统中应用广泛,但随机采样导致控制输入不平滑,影响系统性能。
  2. 论文提出dsMPPI,结合MPPI的指数加权和确定性采样的效率,以获得更平滑的控制轨迹。
  3. 实验结果表明,dsMPPI相较于现有方法,能够生成更加平滑的轨迹,提升控制效果。

📝 摘要(中文)

基于采样的模型预测控制(MPC)对于非线性系统是有效的,但由于随机采样,通常会产生非光滑的控制输入。为了解决这个问题,我们扩展了模型预测路径积分(MPPI)框架,采用确定性采样,并结合了交叉熵方法(CEM)-MPC的改进,例如迭代优化,提出了确定性采样MPPI (dsMPPI)。这种结合利用了MPPI的指数加权以及确定性采样的效率。实验表明,与最先进的方法相比,dsMPPI实现了更平滑的轨迹。

🔬 方法详解

问题定义:论文旨在解决基于采样的模型预测控制(MPC)在非线性系统控制中,由于随机采样导致的控制输入非光滑问题。现有方法依赖随机采样,导致控制轨迹不稳定,影响控制精度和系统平稳性。

核心思路:论文的核心思路是将模型预测路径积分(MPPI)框架与确定性采样相结合,并借鉴交叉熵方法(CEM)-MPC的优点。通过确定性采样替代随机采样,减少控制输入的不确定性,同时利用MPPI的指数加权机制,优化控制策略。

技术框架:dsMPPI的整体框架包括以下几个主要步骤:1. 使用确定性采样生成一组候选控制序列。2. 使用系统模型预测每个控制序列对应的未来状态轨迹。3. 根据预测的轨迹和定义的成本函数,计算每个控制序列的权重,采用MPPI的指数加权方式。4. 使用加权平均的控制序列作为最终的控制输入。5. 借鉴CEM-MPC的迭代优化思想,重复上述步骤,进一步优化控制策略。

关键创新:最重要的创新点在于将确定性采样引入MPPI框架。传统MPPI依赖随机采样,导致控制输入噪声较大。通过确定性采样,可以更有效地探索控制空间,减少不必要的随机性,从而获得更平滑的控制轨迹。

关键设计:关键设计包括:1. 确定性采样的具体方法,例如使用均匀采样或低差异序列。2. 成本函数的选择,需要根据具体的控制任务进行设计,通常包括状态误差和控制输入惩罚项。3. MPPI的温度参数,用于控制指数加权的强度,影响控制策略的探索和利用。4. 迭代优化的次数,需要在计算复杂度和控制性能之间进行权衡。

📊 实验亮点

实验结果表明,dsMPPI在控制轨迹的平滑性方面优于现有的基于采样的MPC方法。具体而言,dsMPPI能够显著降低控制输入的抖动,生成更加平滑的状态轨迹。与传统的MPPI和CEM-MPC相比,dsMPPI在保证控制性能的同时,显著提升了控制轨迹的平滑度。

🎯 应用场景

该研究成果可应用于机器人控制、自动驾驶、航空航天等领域,尤其适用于对控制平滑性要求较高的场景。例如,在机器人操作中,平滑的控制轨迹可以减少机械磨损,提高操作精度。在自动驾驶中,平滑的控制可以提升乘客的舒适度,并减少车辆的能量消耗。未来,该方法可以进一步扩展到更复杂的非线性系统控制问题。

📄 摘要(原文)

Sampling-based model predictive control (MPC) is effective for nonlinear systems but often produces non-smooth control inputs due to random sampling. To address this issue, we extend the model predictive path integral (MPPI) framework with deterministic sampling and improvements from cross-entropy method (CEM)--MPC, such as iterative optimization, proposing deterministic sampling MPPI (dsMPPI). This combination leverages the exponential weighting of MPPI alongside the efficiency of deterministic samples. Experiments demonstrate that dsMPPI achieves smoother trajectories compared to state-of-the-art methods.