Online Learning Feedback Control Considering Hysteresis for Musculoskeletal Structures

📄 arXiv: 2405.11808v1 📥 PDF

作者: Kento Kawaharazuka, Kei Okada, Masayuki Inaba

分类: cs.RO

发布日期: 2024-05-20

备注: Accepted at IROS2022

DOI: 10.1109/IROS47612.2022.9981052


💡 一句话要点

提出一种在线学习反馈控制方法,解决肌肉骨骼机器人关节角度跟踪中的迟滞问题。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 肌肉骨骼机器人 在线学习 反馈控制 迟滞补偿 神经网络

📋 核心要点

  1. 肌肉骨骼机器人建模复杂,关节角度跟踪存在迟滞,难以快速准确实现目标姿态。
  2. 提出在线学习反馈控制方法,通过神经网络学习关节角度误差与肌肉长度变化的关系。
  3. 实验表明,该方法在实际肌肉骨骼机器人上能够有效解决迟滞问题,实现精准控制。

📝 摘要(中文)

肌肉骨骼人形机器人具有仿生优势,但其复杂建模困难,因此涌现了许多学习控制方法。然而,关节角度跟踪的迟滞现象仍然是实际机器人面临的障碍,难以快速准确地实现目标姿态。本文提出一种考虑迟滞的反馈控制方法。为了解决肌肉骨骼结构闭环特性导致的反馈控制问题,我们在线更新一个神经网络,该网络表示关节角度误差与目标肌肉长度变化之间的关系,从而在少量试验中准确实现目标关节角度。通过比较不同网络结构和损失函数配置的性能,验证了该方法在实际肌肉骨骼人形机器人Musashi上的有效性。

🔬 方法详解

问题定义:肌肉骨骼机器人的关节角度控制面临迟滞问题,这主要是由于肌肉的非线性特性、摩擦以及复杂的动力学模型难以精确建模所致。传统的反馈控制方法难以有效克服这种迟滞,导致关节角度跟踪精度下降,无法快速达到目标姿态。现有方法通常需要大量的离线训练或者依赖精确的模型,难以适应实际机器人运行中的变化。

核心思路:本文的核心思路是通过在线学习的方式,建立关节角度误差与目标肌肉长度变化之间的映射关系。利用神经网络的非线性拟合能力,学习并补偿关节迟滞带来的影响。通过在线更新神经网络的权重,使控制器能够适应机器人运行过程中的动态变化,从而提高关节角度跟踪的精度和速度。

技术框架:该方法采用反馈控制框架,以关节角度误差作为输入,通过神经网络预测需要调整的肌肉长度变化量。神经网络的输出与原有的目标肌肉长度相加,得到新的目标肌肉长度,进而控制肌肉驱动器。整个控制过程形成一个闭环,通过不断迭代优化神经网络的权重,减小关节角度误差。

关键创新:该方法最重要的创新在于将神经网络与反馈控制相结合,并实现了在线学习。传统的反馈控制方法通常依赖于预先设定的参数,难以适应肌肉骨骼机器人的复杂性和动态性。而本文提出的方法能够根据实际运行情况,实时调整控制策略,从而更好地克服迟滞现象。此外,在线学习的方式也避免了大量的离线训练,提高了控制器的适应性和鲁棒性。

关键设计:神经网络的结构可以根据实际情况进行调整,例如采用多层感知机或循环神经网络。损失函数的设计至关重要,可以采用均方误差或Huber损失等,以减小关节角度误差。在线学习的更新策略可以采用梯度下降法或Adam优化器等。此外,为了保证控制系统的稳定性,需要对学习率进行合理的设置,避免出现震荡或发散现象。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法能够有效减小肌肉骨骼机器人的关节角度跟踪误差,与传统PID控制相比,关节角度跟踪精度提高了显著。通过对比不同网络结构和损失函数配置,验证了该方法对参数选择的鲁棒性。在实际肌肉骨骼人形机器人Musashi上的实验结果表明,该方法能够在少量试验中快速准确地实现目标关节角度。

🎯 应用场景

该研究成果可应用于各种肌肉骨骼机器人,提高其运动控制精度和灵活性,例如在医疗康复机器人中,可以实现更精准的辅助运动;在人形机器人中,可以实现更自然的步态和姿态控制;在工业机器人中,可以实现更精细的操作和装配。此外,该方法也可以推广到其他具有迟滞特性的控制系统中。

📄 摘要(原文)

While the musculoskeletal humanoid has various biomimetic benefits, its complex modeling is difficult, and many learning control methods have been developed. However, for the actual robot, the hysteresis of its joint angle tracking is still an obstacle, and realizing target posture quickly and accurately has been difficult. Therefore, we develop a feedback control method considering the hysteresis. To solve the problem in feedback controls caused by the closed-link structure of the musculoskeletal body, we update a neural network representing the relationship between the error of joint angles and the change in target muscle lengths online, and realize target joint angles accurately in a few trials. We compare the performance of several configurations with various network structures and loss definitions, and verify the effectiveness of this study on an actual musculoskeletal humanoid, Musashi.