Stable Tool-Use with Flexible Musculoskeletal Hands by Learning the Predictive Model of Sensor State Transition

📄 arXiv: 2406.17136v1 📥 PDF

作者: Kento Kawaharazuka, Kei Tsuzuki, Moritaka Onitsuka, Yuki Asano, Kei Okada, Koji Kawasaki, Masayuki Inaba

分类: cs.RO

发布日期: 2024-06-24

备注: Accepted at ICRA2020

DOI: 10.1109/ICRA40945.2020.9197188


💡 一句话要点

提出基于传感器状态转移预测模型的柔性肌腱手工具使用稳定控制方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 柔性手 肌腱驱动 工具使用 传感器状态预测 反馈控制

📋 核心要点

  1. 柔性肌腱手控制难点在于传感器与执行器关系不确定,传统方法依赖前馈控制,难以应对工具使用过程中的接触状态变化。
  2. 论文提出利用机器人实际传感器数据训练传感器状态转移预测网络,通过该网络进行反馈控制,以维持初始接触状态。
  3. 通过锤击、吸尘和扫地等工具使用实验,验证了所提出方法的有效性,表明其能够提升柔性手工具使用的稳定性。

📝 摘要(中文)

柔性欠驱动肌腱手在适应性和抗冲击性方面表现出色。然而,由于传感器和执行器之间的关系无法唯一确定,其控制几乎都基于前馈控制。当抓取和使用工具时,由于工具的惯性或动作的冲击,手的接触状态会逐渐改变,难以保持初始接触状态。本研究提出了一种系统,该系统利用实际机器人传感器信息训练传感器状态转移的预测网络,并通过使用该网络的反馈控制来保持初始接触状态。我们进行了锤击、吸尘和扫地实验,验证了本研究的有效性。

🔬 方法详解

问题定义:柔性欠驱动肌腱手在工具使用过程中,由于工具惯性和动作冲击,手与工具的接触状态会发生变化,导致难以维持稳定的工具使用。现有方法主要依赖前馈控制,无法有效应对这种接触状态变化,从而影响工具使用的精度和稳定性。

核心思路:论文的核心思路是学习一个传感器状态转移的预测模型,该模型能够预测在给定当前传感器状态和执行动作的情况下,下一个时刻的传感器状态。通过将预测的传感器状态与期望的传感器状态进行比较,可以设计反馈控制器来调整执行动作,从而维持手与工具的初始接触状态。

技术框架:该系统主要包含以下几个模块:1) 数据采集模块:通过机器人手上的传感器采集实际的传感器数据,包括力传感器、位置传感器等。2) 预测模型训练模块:使用采集到的传感器数据训练传感器状态转移预测网络。3) 反馈控制模块:根据预测网络预测的下一个时刻的传感器状态,计算控制量,调整执行器的动作,以维持初始接触状态。整体流程是,首先采集数据训练预测模型,然后在实际工具使用过程中,利用预测模型和反馈控制来稳定手的姿态。

关键创新:该方法最重要的创新点在于利用深度学习方法学习传感器状态转移模型,并将其应用于柔性手的反馈控制中。与传统方法相比,该方法能够更好地适应柔性手复杂的非线性特性,并能够有效地应对工具使用过程中的接触状态变化。

关键设计:预测网络可以使用各种神经网络结构,例如循环神经网络(RNN)或Transformer。损失函数可以选择均方误差(MSE)或交叉熵损失函数,具体取决于传感器数据的类型。反馈控制器的设计可以使用PID控制器或其他先进的控制算法。关键参数包括学习率、网络层数、隐藏层大小、PID参数等。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的方法能够有效地提高柔性手工具使用的稳定性。例如,在锤击实验中,使用该方法可以显著减少锤击位置的偏差;在吸尘和扫地实验中,使用该方法可以提高清洁效率和覆盖率。与传统的前馈控制方法相比,该方法在工具使用过程中能够更好地维持初始接触状态,从而提高操作的精度和稳定性。

🎯 应用场景

该研究成果可应用于各种需要灵巧操作的机器人应用场景,例如:家庭服务机器人可以使用该技术进行清洁、烹饪等任务;工业机器人可以使用该技术进行装配、喷涂等任务;医疗机器人可以使用该技术进行手术辅助等任务。该技术能够提高机器人在复杂环境下的适应性和操作精度,具有重要的实际应用价值。

📄 摘要(原文)

The flexible under-actuated musculoskeletal hand is superior in its adaptability and impact resistance. On the other hand, since the relationship between sensors and actuators cannot be uniquely determined, almost all its controls are based on feedforward controls. When grasping and using a tool, the contact state of the hand gradually changes due to the inertia of the tool or impact of action, and the initial contact state is hardly kept. In this study, we propose a system that trains the predictive network of sensor state transition using the actual robot sensor information, and keeps the initial contact state by a feedback control using the network. We conduct experiments of hammer hitting, vacuuming, and brooming, and verify the effectiveness of this study.