From Reach to Insert: Tactile-Augmented Precision Assembly under Sub-Millimeter Tolerances
作者: Xinpan Meng, Siyao Huang, JingPu Yang, Muyuan Ma, Zhenghua Ma, Lijun Han, Gao Yuan, Houcheng Li, Long Cheng
分类: cs.RO
发布日期: 2026-05-06
备注: 8 pages, 9 figures
💡 一句话要点
提出触觉增强的模仿学习与强化学习结合方法,解决亚毫米级公差下的精密装配问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 精密装配 模仿学习 强化学习 触觉反馈 机器人操作
📋 核心要点
- 现有高精度装配方法难以应对微小误差导致的卡滞和过大交互力,缺乏鲁棒性和安全性。
- 提出结合模仿学习和强化学习的两阶段方法,利用触觉反馈提升插入性能并降低接触力。
- 实验表明,该方法在0.05mm间隙下成功率达67%,交互力和扭矩分别降低60%和44%。
📝 摘要(中文)
高精度装配常涉及紧公差的插入操作,即使微小的姿态误差也可能导致卡滞或过大的交互力,使得鲁棒且安全的插入策略难以获得。本文提出了一种触觉增强的两阶段方法,结合模仿学习(IL)和强化学习(RL)用于精密插入任务。第一阶段,IL学习具有位置泛化能力的到达策略,抓取工件并将其带到目标区域附近。第二阶段,RL执行插入操作,并能从接触交互过程中的失败中恢复。为了更好地利用触觉反馈,我们引入了触觉组采样,以增加训练期间关键接触段的覆盖率,并设计了触觉评论器,以更准确地评估策略值,从而提高插入性能,同时保持较低的接触力。我们在五种孔几何形状和三种间隙设置下进行了系统实验。结果表明,我们的方法在所有设置下都显著提高了插入性能;在最具挑战性的0.05毫米间隙下,该方法实现了67%的成功率,同时保持较低的接触力,最大交互力和扭矩分别降低了60%和44%,从而验证了精密装配的有效性和安全性。
🔬 方法详解
问题定义:论文旨在解决高精度装配中,由于亚毫米级公差导致的插入任务难题。现有方法难以在存在微小姿态误差的情况下,保证插入的成功率和安全性,容易出现卡滞和过大的交互力。因此,需要一种能够鲁棒地处理接触交互,并能从失败中恢复的插入策略。
核心思路:论文的核心思路是将插入任务分解为两个阶段:首先使用模仿学习(IL)学习一个到达策略,将工件移动到目标区域附近;然后使用强化学习(RL)学习一个插入策略,利用触觉反馈进行精细调整和错误恢复。这种分阶段的方法可以有效地利用不同学习方法的优势,提高整体的插入性能。
技术框架:该方法包含两个主要阶段:1) 到达阶段:使用模仿学习训练一个到达策略,该策略以工件的当前位置和目标位置作为输入,输出机械臂的动作,将工件移动到目标区域附近。2) 插入阶段:使用强化学习训练一个插入策略,该策略以工件的当前位置、姿态和触觉反馈作为输入,输出机械臂的动作,执行插入操作。为了更好地利用触觉反馈,论文还引入了触觉组采样和触觉评论器。
关键创新:该论文的关键创新在于:1) 触觉组采样:通过对关键接触段进行过采样,增加训练数据中关键信息的覆盖率,从而提高策略的鲁棒性。2) 触觉评论器:设计了一个专门用于评估触觉反馈的评论器,可以更准确地评估策略的价值,从而提高强化学习的性能。
关键设计:1) 触觉组采样:根据触觉反馈的强度,对训练数据进行分组,并对触觉反馈强度较高的组进行过采样。2) 触觉评论器:使用一个卷积神经网络来处理触觉反馈,并将其与状态信息结合,用于评估策略的价值。3) 奖励函数:在强化学习中,奖励函数的设计考虑了插入的成功率、接触力和时间步数等因素,以鼓励策略在保证安全性的前提下,尽快完成插入任务。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在五种孔几何形状和三种间隙设置下均显著提高了插入性能。在最具挑战性的0.05毫米间隙下,该方法实现了67%的成功率,同时最大交互力降低了60%,扭矩降低了44%。与传统的基于力/力矩控制的方法相比,该方法在精度和安全性方面均有显著提升。
🎯 应用场景
该研究成果可应用于各种需要高精度装配的领域,例如电子元件组装、医疗器械制造、航空航天部件装配等。通过提高装配的自动化程度和鲁棒性,可以降低生产成本,提高产品质量,并减少人工操作带来的风险。未来,该方法有望扩展到更复杂的装配任务,并与其他传感器信息融合,实现更智能化的装配系统。
📄 摘要(原文)
High-precision assembly frequently involves tight-tolerance insertions, where even slight pose errors can cause jamming or excessive interaction forces, making robust and safe insertion policies difficult to obtain. This paper proposes a tactile-augmented two-stage method that combines Imitation Learning (IL) and Reinforcement Learning (RL) for precision insertion tasks. In the first stage, IL learns a reaching policy with position generalization that grasps the peg and brings it to the vicinity of the target region. In the second stage, RL executes the insertion and enables recovery from failures during contact-rich interactions. To better exploit tactile feedback, we introduce tactile group sampling to increase coverage of critical contact segments during training, and design a tactile critic to more accurately evaluate policy values, improving insertion performance while maintaining low contact forces. We conduct systematic experiments across five hole geometries and three clearance settings. Results show that our method substantially improves insertion performance across all settings; under the most challenging 0.05\,mm clearance, it achieves a 67\% success rate while keeping contact forces low, reducing the maximum interaction force by 60\% and torque by 44\%, thereby validating both effectiveness and safety for precision assembly.