ForceMimic: Force-Centric Imitation Learning with Force-Motion Capture System for Contact-Rich Manipulation
作者: Wenhai Liu, Junbo Wang, Yiming Wang, Weiming Wang, Cewu Lu
分类: cs.RO
发布日期: 2024-10-10 (更新: 2025-03-03)
备注: 8 pages, 7 figures, accepted by 2025 IEEE International Conference on Robotics and Automation (ICRA 2025), the first three authors contribute equally, project website at https://forcemimic.github.io
💡 一句话要点
ForceMimic:提出力觉引导的模仿学习框架,用于接触丰富的操作任务。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 力觉模仿学习 接触操作 机器人学习 力/位混合控制 机器人技能学习
📋 核心要点
- 现有机器人学习算法主要关注基于轨迹的策略,忽略了在接触操作中至关重要的力觉信息。
- ForceMimic系统通过力觉捕捉系统和混合模仿学习算法,实现了力觉引导的机器人技能学习。
- 实验表明,该方法在蔬菜剥皮等任务中显著提升了成功率,优于纯视觉模仿学习方法。
📝 摘要(中文)
本文提出ForceMimic,一个力觉中心的机器人学习系统,旨在解决机器人学习算法在接触丰富的操作任务中对力相关技能关注不足的问题。该系统提供了一个自然、力觉感知且无需机器人的机器人演示收集系统,以及一种混合力-运动模仿学习算法,用于鲁棒的接触丰富的操作。通过提出的ForceCapture系统,操作员可以在5分钟内剥一个西葫芦,而力反馈遥操作需要超过13分钟并且难以完成任务。利用收集的数据,我们提出HybridIL来训练一个力觉中心的模仿学习模型,该模型配备了混合力-位置控制原语,以适应机器人在执行过程中预测的力-位置参数。实验表明,我们的方法使模型能够在蔬菜剥皮这一接触丰富的任务中学习到更鲁棒的策略,与最先进的纯视觉模仿学习相比,成功率相对提高了54.5%。
🔬 方法详解
问题定义:现有机器人学习方法在接触丰富的操作任务中,主要依赖视觉引导的轨迹学习,忽略了力在补偿轨迹误差和实现精细操作中的重要作用。这导致机器人难以应对任务中的不确定性和扰动,例如蔬菜剥皮过程中遇到的阻力变化。现有方法缺乏对力觉信息的有效利用,限制了机器人在复杂操作任务中的泛化能力和鲁棒性。
核心思路:ForceMimic的核心思路是建立一个力觉中心的模仿学习框架,通过力觉捕捉系统获取高质量的力-运动数据,并利用混合模仿学习算法训练机器人策略。该方法强调力在接触操作中的作用,将力作为控制策略的关键输入,从而提高机器人在接触任务中的鲁棒性和适应性。通过模仿人类操作员的力觉反馈,机器人可以学习到更自然的控制策略。
技术框架:ForceMimic系统主要包含两个部分:ForceCapture系统和HybridIL算法。ForceCapture系统用于收集人类操作员在执行任务时的力-运动数据。该系统允许操作员以自然的方式进行演示,无需直接控制机器人。HybridIL算法则利用收集到的数据训练一个力觉中心的模仿学习模型。该模型使用混合力-位置控制原语,在机器人执行过程中根据预测的力-位置参数进行控制。
关键创新:ForceMimic的关键创新在于其力觉中心的模仿学习方法。与传统的基于视觉的模仿学习方法不同,ForceMimic强调力在接触操作中的作用,将力作为控制策略的关键输入。此外,ForceCapture系统提供了一种自然、力觉感知且无需机器人的机器人演示收集系统,降低了数据收集的难度。HybridIL算法则通过混合力-位置控制原语,实现了对力-位置参数的精确控制。
关键设计:ForceCapture系统采用力/力矩传感器来测量操作员施加的力。HybridIL算法使用深度神经网络来预测力-位置参数。损失函数包括力误差、位置误差和姿态误差。网络结构采用编码器-解码器结构,编码器用于提取输入数据的特征,解码器用于预测力-位置参数。具体参数设置未知。
🖼️ 关键图片
📊 实验亮点
实验结果表明,ForceMimic在蔬菜剥皮任务中取得了显著的性能提升。与最先进的纯视觉模仿学习方法相比,ForceMimic的成功率相对提高了54.5%。此外,ForceMimic系统能够在5分钟内完成西葫芦剥皮任务,而力反馈遥操作则需要超过13分钟,并且难以完成任务。这些结果表明,ForceMimic能够有效地学习力觉引导的机器人技能,并在接触丰富的操作任务中表现出优越的性能。
🎯 应用场景
ForceMimic技术可应用于各种接触丰富的操作任务,例如装配、打磨、抛光、医疗手术等。该技术能够提高机器人在复杂环境中的操作精度和鲁棒性,降低人工干预的需求,实现自动化操作。未来,该技术有望在工业制造、医疗健康等领域得到广泛应用,提升生产效率和服务质量。
📄 摘要(原文)
In most contact-rich manipulation tasks, humans apply time-varying forces to the target object, compensating for inaccuracies in the vision-guided hand trajectory. However, current robot learning algorithms primarily focus on trajectory-based policy, with limited attention given to learning force-related skills. To address this limitation, we introduce ForceMimic, a force-centric robot learning system, providing a natural, force-aware and robot-free robotic demonstration collection system, along with a hybrid force-motion imitation learning algorithm for robust contact-rich manipulation. Using the proposed ForceCapture system, an operator can peel a zucchini in 5 minutes, while force-feedback teleoperation takes over 13 minutes and struggles with task completion. With the collected data, we propose HybridIL to train a force-centric imitation learning model, equipped with hybrid force-position control primitive to fit the predicted wrench-position parameters during robot execution. Experiments demonstrate that our approach enables the model to learn a more robust policy under the contact-rich task of vegetable peeling, increasing the success rates by 54.5% relatively compared to state-ofthe-art pure-vision-based imitation learning. Hardware, code, data and more results can be found on the project website at https://forcemimic.github.io.