Learning Diffusion Policies for Robotic Manipulation of Timber Joinery under Fabrication Uncertainty

📄 arXiv: 2511.17774v1 📥 PDF

作者: Salma Mozaffari, Daniel Ruan, William van den Bogert, Nima Fazeli, Sigrid Adriaenssens, Arash Adel

分类: cs.RO

发布日期: 2025-11-21


💡 一句话要点

提出基于扩散策略学习的木材榫卯结构机器人操作方法,解决装配不确定性问题

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 扩散策略学习 机器人操作 接触式装配 不确定性建模 木材榫卯结构

📋 核心要点

  1. 现有机器人装配方法难以应对建筑行业中普遍存在的制造误差和材料不确定性,导致装配精度和鲁棒性不足。
  2. 论文提出一种基于扩散策略学习的机器人操作方法,通过学习感觉-运动策略,使机器人能够适应装配过程中的不确定性。
  3. 实验结果表明,该方法在存在高达10毫米扰动的情况下,仍能保持较高的装配成功率,验证了其鲁棒性和泛化能力。

📝 摘要(中文)

本文研究了扩散策略学习在接触式机器人操作中的性能和鲁棒性,旨在解决制造误差和材料缺陷等不确定性给精确装配带来的挑战。以木材榫卯结构为例,进行了两阶段研究:首先评估策略的性能和适用性;其次评估策略在处理制造不确定性时的鲁棒性,不确定性通过随机扰动榫眼位置来模拟。最佳策略在高达10毫米的扰动下,平均成功率达到75%,未扰动情况下成功率为100%。结果表明,感觉-运动扩散策略有潜力推广到广泛的复杂、接触式装配任务中,从而推进不确定性下的机器人建造,并有助于更安全、更高效的建筑实践。

🔬 方法详解

问题定义:论文旨在解决建筑行业中,由于制造误差(如榫眼位置偏差)和材料缺陷导致的机器人装配精度和鲁棒性问题。现有方法通常依赖精确的建模和控制,难以适应这些不确定性,导致装配失败率高。

核心思路:论文的核心思路是利用扩散策略学习,直接从数据中学习感觉-运动策略,使机器人能够根据实时感知信息(例如力/力矩传感器数据、视觉信息等)调整其动作,从而适应装配过程中的不确定性。扩散模型能够生成多样化的动作序列,有助于探索更鲁棒的解决方案。

技术框架:整体框架包含数据收集和策略学习两个主要阶段。首先,通过物理仿真或真实机器人实验收集包含状态(例如关节角度、力/力矩传感器读数)和动作(例如关节速度)的数据集。然后,利用扩散模型在该数据集上训练一个策略网络,该网络能够根据当前状态生成一个动作分布,并从中采样得到下一步的动作。在推理阶段,机器人根据当前状态,使用训练好的策略网络生成动作,并执行该动作。

关键创新:最重要的技术创新点在于将扩散模型应用于机器人操作策略学习,使其能够生成多样化的动作序列,从而提高策略的鲁棒性和泛化能力。与传统的强化学习方法相比,扩散策略学习不需要显式地定义奖励函数,而是通过模仿学习的方式从专家数据中学习,更适用于复杂的接触式操作任务。

关键设计:论文中使用了基于Transformer的扩散模型,将状态和动作序列作为输入,预测下一步的动作分布。损失函数采用负对数似然损失,用于衡量预测的动作分布与真实动作之间的差异。在训练过程中,使用了数据增强技术,例如随机扰动状态和动作,以提高策略的鲁棒性。具体的网络结构和超参数设置在论文中有详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在木材榫卯结构装配任务中取得了显著的成果。在未扰动的情况下,装配成功率达到100%。即使在存在高达10毫米的榫眼位置扰动的情况下,平均成功率仍然达到75%。这表明该方法具有很强的鲁棒性和泛化能力,能够有效地应对制造误差和材料缺陷等不确定性。

🎯 应用场景

该研究成果可应用于建筑、制造等领域,尤其是在需要高精度和高鲁棒性的机器人装配任务中。例如,可用于机器人建造房屋、组装家具、制造汽车等。通过提高机器人装配的自动化程度和鲁棒性,可以降低人工成本,提高生产效率,并减少安全风险。未来,该方法还可以扩展到其他类型的装配任务,例如电子产品的组装、医疗器械的制造等。

📄 摘要(原文)

Construction uncertainties such as fabrication inaccuracies and material imperfections pose a significant challenge to contact-rich robotic manipulation by hindering precise and robust assembly. In this paper, we explore the performance and robustness of diffusion policy learning as a promising solution for contact-sensitive robotic assembly at construction scale, using timber mortise and tenon joints as a case study. A two-phase study is conducted: first, to evaluate policy performance and applicability; second, to assess robustness in handling fabrication uncertainties simulated as randomized perturbations to the mortise position. The best-performing policy achieved a total average success rate of 75% with perturbations up to 10 mm, including 100% success in unperturbed cases. The results demonstrate the potential of sensory-motor diffusion policies to generalize to a wide range of complex, contact-rich assembly tasks across construction and manufacturing, advancing robotic construction under uncertainty and contributing to safer, more efficient building practices.