Learning-based Approximate Model Predictive Control for an Impact Wrench Tool

📄 arXiv: 2512.16624v1 📥 PDF

作者: Mark Benazet, Francesco Ricca, Dario Bralla, Melanie N. Zeilinger, Andrea Carron

分类: eess.SY

发布日期: 2025-12-18


💡 一句话要点

提出基于学习的近似模型预测控制,用于冲击扳手的实时扭矩控制

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 模型预测控制 高斯过程回归 神经网络 实时控制 嵌入式系统 冲击扳手 扭矩控制

📋 核心要点

  1. 现有冲击扳手控制方法难以在资源受限的嵌入式系统中实现高频、安全的实时扭矩控制。
  2. 结合高斯过程回归增强模型和神经网络近似控制策略,实现资源受限平台上的预测控制。
  3. 实验表明,该方法在满足约束的同时,实现了微秒级推理,并提高了扭矩跟踪精度。

📝 摘要(中文)

本文提出了一种基于学习的模型预测控制方法,用于解决机电系统中复杂动力学问题,通过数据驱动的方式提升性能并满足安全约束。针对电池供电工具等资源受限的嵌入式处理器,现有方法难以满足实时性要求。本文聚焦冲击扳手的实时扭矩控制,需要高频控制更新以精确跟踪周期性冲击事件中的快速瞬变,同时保持高性能的安全控制,减轻有害振动和部件磨损。该方法的核心创新在于结合了高斯过程回归的数据驱动模型增强和神经网络对控制策略的近似。这种结合使得在资源受限的嵌入式平台上部署预测控制成为可能,同时保证了约束满足和微秒级的推理时间。通过数值模拟和定制冲击扳手测试平台的硬件实验验证了所提出框架的有效性,结果表明该方法成功实现了适用于高频操作的实时控制,同时保持了约束满足,并相比基线PID控制提高了跟踪精度。

🔬 方法详解

问题定义:论文旨在解决冲击扳手在资源受限的嵌入式系统中进行实时扭矩控制的问题。现有的控制方法,如PID控制,难以在高频冲击事件中精确跟踪扭矩变化,并且难以保证安全约束,容易导致有害振动和部件磨损。传统的模型预测控制(MPC)方法计算复杂度高,难以在资源受限的嵌入式平台上实现实时控制。

核心思路:论文的核心思路是将数据驱动的模型增强与控制策略的近似相结合。首先,利用高斯过程回归(GPR)学习冲击扳手的动态模型,从而提高模型精度。然后,使用神经网络(NN)近似MPC的控制策略,从而降低计算复杂度,实现实时控制。这种结合既利用了数据驱动的优势,又降低了计算负担。

技术框架:整体框架包括以下几个主要模块:1) 数据采集:通过实验或仿真收集冲击扳手的工作数据。2) 模型学习:使用高斯过程回归(GPR)学习冲击扳手的动态模型,增强模型精度。3) 控制策略近似:使用神经网络(NN)学习近似的MPC控制策略。4) 实时控制:在嵌入式平台上部署训练好的神经网络,实现实时扭矩控制。

关键创新:论文的关键创新在于将高斯过程回归和神经网络相结合,用于近似模型预测控制。与传统的MPC方法相比,该方法降低了计算复杂度,使其能够在资源受限的嵌入式平台上实现实时控制。与传统的PID控制相比,该方法能够更好地跟踪扭矩变化,并保证安全约束。

关键设计:论文中,高斯过程回归用于学习冲击扳手的动态模型,其核函数和超参数需要根据具体问题进行选择和优化。神经网络的结构(如层数、神经元数量)和激活函数需要根据控制任务的复杂程度进行设计。损失函数的设计需要考虑扭矩跟踪精度和安全约束。此外,还需要考虑如何在嵌入式平台上高效地部署神经网络,例如使用模型压缩和量化技术。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

硬件实验结果表明,所提出的方法成功实现了适用于高频操作的实时控制,同时保持了约束满足,并相比基线PID控制提高了扭矩跟踪精度。具体而言,该方法实现了微秒级的推理时间,满足了实时性要求。此外,该方法在扭矩跟踪精度方面优于PID控制,并且能够有效地抑制有害振动和部件磨损。

🎯 应用场景

该研究成果可应用于各种需要高精度、实时控制的电动工具,例如电动螺丝刀、电动扳手等。通过提高控制精度和实时性,可以提高工具的工作效率和安全性,延长工具的使用寿命,并降低维护成本。此外,该方法还可以推广到其他资源受限的嵌入式控制系统,例如机器人、无人机等。

📄 摘要(原文)

Learning-based model predictive control has emerged as a powerful approach for handling complex dynamics in mechatronic systems, enabling data-driven performance improvements while respecting safety constraints. However, when computational resources are severely limited, as in battery-powered tools with embedded processors, existing approaches struggle to meet real-time requirements. In this paper, we address the problem of real-time torque control for impact wrenches, where high-frequency control updates are necessary to accurately track the fast transients occurring during periodic impact events, while maintaining high-performance safety-critical control that mitigates harmful vibrations and component wear. The key novelty of the approach is that we combine data-driven model augmentation through Gaussian process regression with neural network approximation of the resulting control policy. This insight allows us to deploy predictive control on resource-constrained embedded platforms while maintaining both constraint satisfaction and microsecond-level inference times. The proposed framework is evaluated through numerical simulations and hardware experiments on a custom impact wrench testbed. The results show that our approach successfully achieves real-time control suitable for high-frequency operation while maintaining constraint satisfaction and improving tracking accuracy compared to baseline PID control.