Iterative Tuning of Nonlinear Model Predictive Control for Robotic Manufacturing Tasks
作者: Deepak Ingole, Valentin Bhend, Shiva Ganesh Murali, Oliver Dobrich, Alisa Rupenyan
分类: cs.RO, cs.LG, eess.SY, math.OC
发布日期: 2025-12-15 (更新: 2026-01-02)
💡 一句话要点
提出一种基于任务级反馈的非线性模型预测控制迭代调优框架,用于机器人制造任务。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 非线性模型预测控制 迭代学习控制 机器人制造 自适应控制 权重调优
📋 核心要点
- 重复性制造过程易受环境漂移和系统磨损的影响,即使在重复操作中也需要重新调整控制。
- 提出一种基于任务级性能反馈的NMPC权重迭代学习框架,通过经验灵敏度矩阵实现权重更新,无需解析导数。
- 在UR10e机器人碳纤维缠绕任务中,仅需4次在线重复即可达到接近离线贝叶斯优化(100次评估)的性能。
📝 摘要(中文)
本文提出了一种迭代学习框架,用于自动调整非线性模型预测控制(NMPC)的权重矩阵,该调整基于任务级性能反馈。受范数最优迭代学习控制(ILC)的启发,该方法自适应地调整NMPC的权重Q和R,通过多次任务重复来最小化与跟踪精度、控制努力和饱和度相关的关键性能指标(KPI)。与需要对NMPC求解器进行微分的基于梯度的方法不同,我们构建了一个经验灵敏度矩阵,从而无需解析导数即可进行结构化的权重更新。该框架通过在UR10e机器人上执行四面体核心碳纤维缠绕的仿真进行了验证。结果表明,所提出的方法在仅4次在线重复中收敛到接近最优的跟踪性能(RMSE在离线贝叶斯优化(BO)的0.3%以内),而BO算法需要100次离线评估。该方法为重复性机器人任务中的自适应NMPC调整提供了一种实用的解决方案,它结合了精心优化的控制器的精度和在线自适应的灵活性。
🔬 方法详解
问题定义:论文旨在解决重复性机器人制造任务中,由于环境变化和系统损耗导致的NMPC控制器性能下降问题。现有方法,如基于梯度的方法,需要对NMPC求解器进行微分,计算复杂度高,难以在线应用。离线优化方法,如贝叶斯优化,需要大量的离线评估,效率低下,且无法适应在线变化。
核心思路:论文的核心思路是借鉴迭代学习控制(ILC)的思想,通过任务重复过程中的性能反馈,迭代地调整NMPC的权重矩阵Q和R,以优化控制器的性能。关键在于构建一个经验灵敏度矩阵,用于描述权重变化对性能指标的影响,从而实现无需解析导数的权重更新。
技术框架:该框架包含以下主要阶段:1) 初始化NMPC控制器及其权重矩阵Q和R;2) 执行机器人制造任务;3) 收集任务执行过程中的性能指标(如跟踪误差、控制量);4) 构建经验灵敏度矩阵,该矩阵描述了权重变化对性能指标的影响;5) 基于灵敏度矩阵,更新权重矩阵Q和R;6) 重复步骤2-5,直到性能收敛。
关键创新:最重要的技术创新点在于使用经验灵敏度矩阵来近似权重变化对性能指标的影响,避免了对NMPC求解器进行微分的需要。这使得该方法能够在线应用,并具有较低的计算复杂度。与传统的ILC方法不同,该方法直接调整NMPC的权重,而不是直接调整控制输入,从而更好地利用了NMPC的模型预测能力。
关键设计:经验灵敏度矩阵的构建是关键。论文通过在权重空间中进行小扰动,观察性能指标的变化,来估计灵敏度矩阵。权重的更新策略基于范数最优的ILC方法,旨在最小化性能指标的加权范数。性能指标的选择需要根据具体的任务需求进行调整,例如,可以包括跟踪误差、控制量、饱和度等。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在UR10e机器人碳纤维缠绕任务中,仅需4次在线重复即可达到接近离线贝叶斯优化(100次评估)的跟踪性能,RMSE在离线贝叶斯优化的0.3%以内。这表明该方法具有快速收敛和高效优化的能力,能够显著减少在线调整所需的时间和成本。
🎯 应用场景
该研究成果可应用于各种重复性机器人制造任务,例如装配、焊接、喷涂、打磨等。通过在线自适应地调整NMPC控制器,可以提高机器人的控制精度和鲁棒性,减少人工干预,提高生产效率和产品质量。该方法尤其适用于环境变化频繁或系统损耗较大的场景。
📄 摘要(原文)
Manufacturing processes are often perturbed by drifts in the environment and wear in the system, requiring control re-tuning even in the presence of repetitive operations. This paper presents an iterative learning framework for automatic tuning of Nonlinear Model Predictive Control (NMPC) weighting matrices based on task-level performance feedback. Inspired by norm-optimal Iterative Learning Control (ILC), the proposed method adaptively adjusts NMPC weights Q and R across task repetitions to minimize key performance indicators (KPIs) related to tracking accuracy, control effort, and saturation. Unlike gradient-based approaches that require differentiating through the NMPC solver, we construct an empirical sensitivity matrix, enabling structured weight updates without analytic derivatives. The framework is validated through simulation on a UR10e robot performing carbon fiber winding on a tetrahedral core. Results demonstrate that the proposed approach converges to near-optimal tracking performance (RMSE within 0.3% of offline Bayesian Optimization (BO)) in just 4 online repetitions, compared to 100 offline evaluations required by BO algorithm. The method offers a practical solution for adaptive NMPC tuning in repetitive robotic tasks, combining the precision of carefully optimized controllers with the flexibility of online adaptation.