TacDiffusion: Force-domain Diffusion Policy for Precise Tactile Manipulation

📄 arXiv: 2409.11047v2 📥 PDF

作者: Yansong Wu, Zongxie Chen, Fan Wu, Lingyun Chen, Liding Zhang, Zhenshan Bing, Abdalla Swikir, Sami Haddadin, Alois Knoll

分类: cs.RO

发布日期: 2024-09-17 (更新: 2025-03-06)

备注: 7 pages. Accepted to ICRA 2025


💡 一句话要点

TacDiffusion:力域扩散策略实现高精度触觉操作

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 触觉操作 扩散模型 力域控制 零样本迁移 高精度装配

📋 核心要点

  1. 高精度装配任务对机器人操作提出了挑战,现有方法难以在不同任务间迁移。
  2. TacDiffusion框架利用扩散模型生成6D力矩,学习单任务演示,实现零样本迁移。
  3. 通过动态系统滤波器解决扩散策略与实时控制频率失配问题,显著提升任务成功率。

📝 摘要(中文)

装配是现代制造业和服务机器人的一项关键技能。然而,掌握能够处理各种高精度装配任务的可迁移插入技能仍然是一个重大挑战。本文提出了一种新颖的框架,该框架利用扩散模型生成用于高精度触觉机器人插入任务的6D力矩。它从单个任务的演示中学习,并在各种新的高精度任务中实现了95.7%的零样本迁移成功率。我们的方法有效地继承了我们之前工作所展示的自适应性。在这个框架中,我们使用基于动态系统的滤波器解决了扩散策略和实时控制回路之间的频率失配问题,显著提高了9.15%的任务成功率。此外,我们还提供了关于扩散模型推理能力和速度之间权衡的实用指南。

🔬 方法详解

问题定义:现有机器人装配方法难以在不同高精度任务之间进行有效迁移,需要针对每个任务进行重新训练或调整。此外,扩散模型生成的控制信号频率与机器人实时控制系统的频率不匹配,导致控制效果不佳。

核心思路:利用扩散模型学习力域控制策略,从少量演示数据中学习装配任务的通用模式,实现零样本迁移到新的装配任务。通过动态系统滤波器,对扩散模型输出的控制信号进行平滑处理,解决频率失配问题。

技术框架:TacDiffusion框架主要包含以下几个模块:1) 触觉数据采集模块,用于获取机器人与环境交互过程中的力/力矩数据;2) 扩散模型训练模块,利用采集到的数据训练力域控制策略;3) 动态系统滤波器,用于平滑扩散模型输出的控制信号;4) 机器人控制模块,根据滤波后的控制信号控制机器人执行装配任务。整体流程为:首先,通过示教或专家经验获取少量装配任务的演示数据。然后,利用这些数据训练扩散模型,学习力域控制策略。在实际装配过程中,扩散模型根据当前状态生成控制信号,经过动态系统滤波器平滑后,输入到机器人控制模块,控制机器人执行装配任务。

关键创新:1) 将扩散模型应用于力域控制,实现高精度装配任务的零样本迁移;2) 提出动态系统滤波器,解决扩散模型输出与实时控制频率失配问题。

关键设计:扩散模型采用条件扩散模型,以当前机器人状态作为条件,预测下一步的力/力矩。动态系统滤波器采用二阶线性系统,其参数根据任务需求进行调整。损失函数包括力/力矩预测误差和轨迹平滑性约束。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

TacDiffusion在各种新的高精度任务中实现了95.7%的零样本迁移成功率,相较于传统方法有显著提升。动态系统滤波器的引入,使任务成功率提高了9.15%。论文还提供了关于扩散模型推理能力和速度之间权衡的实用指南,为实际应用提供了参考。

🎯 应用场景

该研究成果可应用于各种高精度装配任务,例如电子元件组装、精密仪器制造等。通过学习少量演示数据,机器人可以快速适应新的装配任务,提高生产效率和灵活性。此外,该方法还可以应用于医疗机器人、服务机器人等领域,实现更复杂、更精细的操作。

📄 摘要(原文)

Assembly is a crucial skill for robots in both modern manufacturing and service robotics. However, mastering transferable insertion skills that can handle a variety of high-precision assembly tasks remains a significant challenge. This paper presents a novel framework that utilizes diffusion models to generate 6D wrench for high-precision tactile robotic insertion tasks. It learns from demonstrations performed on a single task and achieves a zero-shot transfer success rate of 95.7% across various novel high-precision tasks. Our method effectively inherits the self-adaptability demonstrated by our previous work. In this framework, we address the frequency misalignment between the diffusion policy and the real-time control loop with a dynamic system-based filter, significantly improving the task success rate by 9.15%. Furthermore, we provide a practical guideline regarding the trade-off between diffusion models' inference ability and speed.