Learning-based Nonlinear Model Predictive Control of Articulated Soft Robots using Recurrent Neural Networks
作者: Hendrik Schäfke, Tim-Lukas Habich, Christian Muhmann, Simon F. G. Ehlers, Thomas Seel, Moritz Schappler
分类: cs.RO
发布日期: 2024-11-08
备注: Accepted for publication in IEEE Robotics and Automation Letters (RA-L) 2024
💡 一句话要点
提出基于RNN的非线性模型预测控制方法,用于解决软体机器人的轨迹跟踪问题。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 软体机器人 循环神经网络 模型预测控制 非线性控制 机器学习
📋 核心要点
- 软体机器人控制面临高维度和非线性挑战,传统模型难以准确描述其动态特性,限制了控制性能。
- 利用循环神经网络(RNN)学习软体机器人的动态模型,特别是GRU网络,以捕捉软体机器人固有的滞后效应。
- 将学习到的RNN模型集成到非线性模型预测控制(NMPC)框架中,实现对五自由度软体机器人的精确轨迹跟踪,平均误差为1.2度。
📝 摘要(中文)
软体机器人在控制方面面临挑战,需要新的策略来有效操纵其柔顺结构。基于模型的方法由于高维度和非线性(如滞后效应)而面临挑战。相比之下,基于学习的方法仅基于测量数据提供不同软体机器人的非线性模型。本文中,循环神经网络(RNN)预测具有五个自由度(DoF)的铰接式软体机器人(ASR)的行为。基于门控循环单元(GRU)的RNN与更常用的长短期记忆(LSTM)网络进行了比较,结果表明GRU具有更好的准确性。循环结构能够捕获软体机器人由于粘弹性或摩擦而固有的滞后效应,而简单的前馈网络无法捕获这些效应。数据驱动模型用于非线性模型预测控制(NMPC)中,重点在于正确处理RNN的隐藏状态。提出了一种训练方法,该方法允许在每个控制周期中使用测量值。这使得能够基于传感器数据准确预测短期范围,这对于闭环NMPC至关重要。所提出的基于学习的NMPC能够在具有气动五自由度ASR的实验中实现轨迹跟踪,平均误差为1.2度。
🔬 方法详解
问题定义:论文旨在解决铰接式软体机器人的精确轨迹跟踪问题。现有基于模型的控制方法难以处理软体机器人固有的高维度、非线性(如滞后效应)以及模型参数难以精确辨识等问题,导致控制性能不佳。
核心思路:论文的核心思路是利用数据驱动的机器学习方法,特别是循环神经网络(RNN),来学习软体机器人的动态模型。RNN能够捕捉软体机器人由于粘弹性或摩擦引起的滞后效应,从而更准确地预测其行为。然后,将学习到的RNN模型嵌入到非线性模型预测控制(NMPC)框架中,实现对软体机器人的精确控制。
技术框架:整体框架包括数据采集、RNN模型训练和NMPC控制三个主要阶段。首先,通过实验采集软体机器人的输入(例如气压)和输出(例如关节角度)数据。然后,使用采集到的数据训练RNN模型,使其能够预测软体机器人在给定输入下的行为。最后,将训练好的RNN模型作为NMPC的预测模型,用于计算最优控制序列,从而实现对软体机器人的轨迹跟踪。
关键创新:论文的关键创新在于:1) 使用RNN(特别是GRU)来建模软体机器人的动态特性,能够有效捕捉滞后效应;2) 提出了一种训练方法,允许在每个控制周期中使用测量值,从而提高短期预测的准确性,这对闭环NMPC至关重要;3) 将学习到的RNN模型成功应用于五自由度软体机器人的NMPC控制,实现了精确的轨迹跟踪。
关键设计:论文中,RNN模型基于GRU单元,并与LSTM进行了比较,实验表明GRU具有更好的准确性。训练过程中,采用了一种特殊的训练方法,允许在每个控制周期中使用测量值来更新RNN的隐藏状态,从而提高短期预测的准确性。NMPC的优化目标是最小化轨迹跟踪误差,并考虑了控制输入的约束。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于RNN的NMPC能够有效地控制五自由度软体机器人,实现精确的轨迹跟踪。使用GRU的RNN模型表现优于LSTM模型。通过提出的训练方法,NMPC能够基于传感器数据准确预测短期范围,从而实现闭环控制。实验中,轨迹跟踪的平均误差为1.2度,验证了该方法的有效性。
🎯 应用场景
该研究成果可应用于医疗机器人、康复机器人、柔性夹爪等领域。例如,在微创手术中,软体机器人可以利用其柔顺性进入人体狭窄区域,执行精确的操作。在康复训练中,软体机器人可以提供安全、舒适的辅助,帮助患者恢复运动能力。此外,该方法还可以推广到其他类型的软体机器人控制问题。
📄 摘要(原文)
Soft robots pose difficulties in terms of control, requiring novel strategies to effectively manipulate their compliant structures. Model-based approaches face challenges due to the high dimensionality and nonlinearities such as hysteresis effects. In contrast, learning-based approaches provide nonlinear models of different soft robots based only on measured data. In this paper, recurrent neural networks (RNNs) predict the behavior of an articulated soft robot (ASR) with five degrees of freedom (DoF). RNNs based on gated recurrent units (GRUs) are compared to the more commonly used long short-term memory (LSTM) networks and show better accuracy. The recurrence enables the capture of hysteresis effects that are inherent in soft robots due to viscoelasticity or friction but cannot be captured by simple feedforward networks. The data-driven model is used within a nonlinear model predictive control (NMPC), whereby the correct handling of the RNN's hidden states is focused. A training approach is presented that allows measured values to be utilized in each control cycle. This enables accurate predictions of short horizons based on sensor data, which is crucial for closed-loop NMPC. The proposed learning-based NMPC enables trajectory tracking with an average error of 1.2deg in experiments with the pneumatic five-DoF ASR.