Tilde: Teleoperation for Dexterous In-Hand Manipulation Learning with a DeltaHand

📄 arXiv: 2405.18804v2 📥 PDF

作者: Zilin Si, Kevin Lee Zhang, Zeynep Temel, Oliver Kroemer

分类: cs.RO

发布日期: 2024-05-29 (更新: 2024-08-21)


💡 一句话要点

Tilde:利用DeltaHand进行灵巧手内操作学习的遥操作系统

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 灵巧操作 遥操作 模仿学习 扩散策略 机器人手

📋 核心要点

  1. 灵巧操作学习面临高维度和复杂任务的挑战,现有方法难以高效学习自适应控制策略。
  2. Tilde系统通过DeltaHand、TeleHand和扩散策略模仿学习,实现了高效的灵巧手内操作学习。
  3. 实验表明,Tilde系统在七个灵巧操作任务中,学习到的策略平均成功率达到90%。

📝 摘要(中文)

灵巧机器人操作因其对硬件和软件的精度和鲁棒性有严格要求而仍然是一个具有挑战性的领域。虽然灵巧机器人手已经在复杂的任务中展示了卓越的能力,但由于手和任务的高维度,为手高效地学习自适应控制策略仍然是一个巨大的障碍。为了弥合这一差距,我们提出了Tilde,一个基于模仿学习的灵巧手内操作系统,它使用DeltaHand。它利用了1) 低成本、可配置、易于控制的软灵巧机器人手DeltaHand,2) 用户友好、精确、实时的遥操作界面TeleHand,以及3) 一种高效且通用的基于扩散策略的模仿学习方法。我们提出的TeleHand具有与DeltaHand的运动学孪生设计,可以在遥操作期间实现对DeltaHand的精确一对一关节控制。这有助于在现实世界中高效地收集高质量的人类演示数据。为了评估我们系统的有效性,我们展示了从七个灵巧操作任务的演示中学习到的扩散策略的完全自主闭环部署,平均成功率为90%。

🔬 方法详解

问题定义:论文旨在解决灵巧机器人手在手内操作学习中,由于高维度和复杂任务导致的控制策略学习效率低下的问题。现有方法难以高效地从人类演示中学习到鲁棒且泛化性强的控制策略,尤其是在真实环境中。

核心思路:论文的核心思路是利用遥操作技术TeleHand,高效收集高质量的人类演示数据,然后使用模仿学习方法,特别是扩散策略,从这些数据中学习控制策略。TeleHand的设计与DeltaHand的运动学结构相同,实现精确的关节控制,从而提高数据质量。扩散策略能够有效地处理高维数据,并学习到更鲁棒的策略。

技术框架:Tilde系统的整体框架包括三个主要模块:DeltaHand灵巧手、TeleHand遥操作界面和基于扩散策略的模仿学习算法。首先,人类操作员使用TeleHand控制DeltaHand执行任务,记录关节角度和物体状态等数据。然后,这些数据被用于训练扩散策略模型。最后,训练好的策略被部署到DeltaHand上,实现自主的灵巧手内操作。

关键创新:该论文的关键创新在于TeleHand的设计和扩散策略的应用。TeleHand通过运动学孪生设计,实现了精确的关节控制,显著提高了演示数据的质量。扩散策略能够有效地处理高维数据,并学习到更鲁棒的策略,从而提高了系统的泛化能力。

关键设计:TeleHand的关键设计在于其与DeltaHand的运动学结构相同,这保证了操作员可以直观地控制DeltaHand的每个关节。扩散策略的具体实现细节未知,但通常包括一个前向扩散过程和一个反向去噪过程。损失函数的设计目标是最小化预测轨迹与真实轨迹之间的差异。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,Tilde系统在七个不同的灵巧手内操作任务中取得了平均90%的成功率。这表明该系统能够有效地从人类演示中学习到鲁棒且泛化性强的控制策略。具体的基线对比未知,但90%的成功率表明该系统具有很高的实用价值。

🎯 应用场景

该研究成果可应用于各种需要灵巧手操作的场景,例如:医疗手术机器人、精密装配、家庭服务机器人等。通过高效的遥操作数据收集和模仿学习,可以快速训练出适应不同任务的灵巧操作策略,降低开发成本,提高机器人应用的灵活性和智能化水平。

📄 摘要(原文)

Dexterous robotic manipulation remains a challenging domain due to its strict demands for precision and robustness on both hardware and software. While dexterous robotic hands have demonstrated remarkable capabilities in complex tasks, efficiently learning adaptive control policies for hands still presents a significant hurdle given the high dimensionalities of hands and tasks. To bridge this gap, we propose Tilde, an imitation learning-based in-hand manipulation system on a dexterous DeltaHand. It leverages 1) a low-cost, configurable, simple-to-control, soft dexterous robotic hand, DeltaHand, 2) a user-friendly, precise, real-time teleoperation interface, TeleHand, and 3) an efficient and generalizable imitation learning approach with diffusion policies. Our proposed TeleHand has a kinematic twin design to the DeltaHand that enables precise one-to-one joint control of the DeltaHand during teleoperation. This facilitates efficient high-quality data collection of human demonstrations in the real world. To evaluate the effectiveness of our system, we demonstrate the fully autonomous closed-loop deployment of diffusion policies learned from demonstrations across seven dexterous manipulation tasks with an average 90% success rate.