Behavioral Cloning for Robotic Connector Assembly: An Empirical Study

📄 arXiv: 2602.22100v1 📥 PDF

作者: Andreas Kernbach, Daniel Bargmann, Werner Kraus, Marco F. Huber

分类: cs.RO

发布日期: 2026-02-25

备注: 8 pages


💡 一句话要点

提出基于行为克隆的机器人连接器装配方法,解决线束自动化难题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 行为克隆 机器人装配 连接器插入 力/扭矩传感 视觉伺服

📋 核心要点

  1. 线束装配自动化面临电缆易变形、连接器几何差异大以及需限制插入力等挑战。
  2. 利用行为克隆学习动作预测模型,融合力/扭矩传感和视觉信息,模仿人类操作。
  3. 实验结果表明,该方法在不同连接器几何形状和姿态下,实现了超过90%的插入成功率。

📝 摘要(中文)

本文研究了行为克隆在机器人连接器装配中的适用性,旨在解决汽车、电气柜和飞机生产中线束自动化的难题。由于电缆易变形和连接器几何形状差异大,连接器装配具有挑战性。此外,连接器插入时必须限制力以避免损坏,同时其姿态变化很大。本文提出了一种动作预测模型,该模型融合了力/扭矩传感和固定位置摄像头,用于学习连接器插入动作。通过远程操作UR5e机器人,利用SpaceMouse收集了多达300个成功的人工演示数据集,数据集涵盖不同的连接器姿态。比较了几种网络架构和其他设计选择。最终系统在五种不同的连接器几何形状和不同的连接器姿态下进行了评估,总体插入成功率超过90%。

🔬 方法详解

问题定义:论文旨在解决机器人自动化连接器装配问题,尤其是在线束生产中。现有方法难以适应电缆的形变、连接器几何形状的多样性以及对插入力的精确控制。人工编程难以应对这些变化,缺乏通用性和适应性。

核心思路:论文的核心思路是利用行为克隆,通过模仿人类专家的操作来学习连接器插入策略。通过观察人类操作员的动作、力/扭矩反馈和视觉信息,训练一个模型来预测机器人的动作,从而实现自动化装配。这种方法避免了显式编程,使机器人能够适应不同的连接器类型和姿态。

技术框架:整体框架包括数据采集和模型训练两个主要阶段。在数据采集阶段,人类操作员通过SpaceMouse远程操作UR5e机器人进行连接器插入,同时记录机器人的位姿、力/扭矩传感器数据和摄像头图像。在模型训练阶段,使用收集到的数据训练一个动作预测模型,该模型以力/扭矩数据和视觉信息作为输入,输出机器人的动作指令。

关键创新:最重要的技术创新在于将行为克隆应用于连接器装配任务,并融合了力/扭矩传感和视觉信息。这种融合使得模型能够更好地理解连接器插入过程中的物理交互,并做出更精确的动作预测。此外,通过大量的人工演示数据,模型能够学习到人类操作员的经验和技巧,从而提高装配的成功率。

关键设计:论文比较了多种网络架构,包括不同的卷积神经网络和循环神经网络。损失函数采用均方误差(MSE)来衡量预测动作和真实动作之间的差异。在数据预处理方面,对力/扭矩数据和视觉信息进行了归一化处理,以提高模型的训练效果。此外,还探索了不同的数据增强方法,以增加模型的泛化能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在五种不同的连接器几何形状和不同的连接器姿态下进行了评估,总体插入成功率超过90%。这表明基于行为克隆的方法能够有效地学习连接器插入策略,并具有良好的泛化能力。该方法无需人工编程,即可实现高精度的自动化装配。

🎯 应用场景

该研究成果可应用于汽车、电气柜和飞机等行业的线束自动化装配,降低人工成本,提高生产效率和产品质量。通过行为克隆,机器人能够快速适应新的连接器类型和装配环境,具有广泛的应用前景。未来,该技术还可扩展到其他需要精细操作和力控制的装配任务中。

📄 摘要(原文)

Automating the assembly of wire harnesses is challenging in automotive, electrical cabinet, and aircraft production, particularly due to deformable cables and a high variance in connector geometries. In addition, connectors must be inserted with limited force to avoid damage, while their poses can vary significantly. While humans can do this task intuitively by combining visual and haptic feedback, programming an industrial robot for such a task in an adaptable manner remains difficult. This work presents an empirical study investigating the suitability of behavioral cloning for learning an action prediction model for connector insertion that fuses force-torque sensing with a fixed position camera. We compare several network architectures and other design choices using a dataset of up to 300 successful human demonstrations collected via teleoperation of a UR5e robot with a SpaceMouse under varying connector poses. The resulting system is then evaluated against five different connector geometries under varying connector poses, achieving an overall insertion success rate of over 90 %.