Query-Centric Diffusion Policy for Generalizable Robotic Assembly
作者: Ziyi Xu, Haohong Lin, Shiqi Liu, Ding Zhao
分类: cs.RO, cs.LG
发布日期: 2025-09-23
备注: 8 pages, 7 figures
💡 一句话要点
提出Query-centric Diffusion Policy,解决机器人装配中高层规划与底层控制的鸿沟
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 机器人装配 扩散策略 分层控制 点云处理 技能学习
📋 核心要点
- 现有机器人装配方法在高层规划和底层控制之间存在鸿沟,导致技能查询与实际执行不匹配。
- Query-centric Diffusion Policy (QDP) 通过引入查询机制,利用对象、接触点和技能信息来指导底层策略。
- 在FurnitureBench上的实验表明,QDP在技能精度和长时程成功率方面均优于现有方法,尤其在插入和拧螺丝任务中提升显著。
📝 摘要(中文)
机器人装配任务由于零件交互的复杂性以及接触环境中对噪声扰动的敏感性,对通用机器人提出了关键挑战。通常,装配代理以分层方式设计:高层多零件推理和低层精确控制。然而,由于高层技能查询和低层执行之间的不匹配,在实践中实现这种分层策略具有挑战性。为了解决这个问题,我们提出了Query-centric Diffusion Policy (QDP),这是一个分层框架,通过利用包含对象、接触点和技能信息的查询来桥接高层规划和低层控制。QDP引入了一种以查询为中心的机制,该机制识别任务相关的组件,并使用它们来指导低层策略,利用点云观测来提高策略的鲁棒性。我们在模拟和真实环境中的FurnitureBench上进行了全面的实验,证明了技能精度和长时程成功率的提高。在具有挑战性的插入和拧螺丝任务中,与没有结构化查询的基线相比,QDP将技能成功率提高了50%以上。
🔬 方法详解
问题定义:机器人装配任务,特别是家具组装,需要同时进行高层次的零件推理和低层次的精确控制。现有的分层策略在高层技能查询和低层动作执行之间存在不匹配,导致策略难以泛化到不同的装配场景,并且对噪声和扰动敏感。
核心思路:QDP的核心思路是以查询为中心,显式地将任务相关的对象、接触点和技能信息编码到查询中,然后利用这些查询来指导低层控制策略。这种方法旨在弥合高层规划和低层控制之间的差距,提高策略的鲁棒性和泛化能力。
技术框架:QDP是一个分层框架,包含以下主要模块:1) 查询生成模块:负责生成包含对象、接触点和技能信息的查询。2) 扩散策略模块:基于生成的查询和点云观测,生成低层控制动作。3) 执行模块:将生成的动作发送到机器人执行器。整个流程通过迭代查询、策略生成和执行,完成装配任务。
关键创新:QDP的关键创新在于引入了以查询为中心的机制,将任务相关的组件显式地编码到查询中。与传统的隐式表示方法相比,这种显式表示方式可以更好地指导低层策略,提高策略的鲁棒性和泛化能力。此外,QDP利用扩散模型来生成低层控制动作,可以更好地处理接触环境中的噪声和扰动。
关键设计:QDP使用点云作为输入,利用PointNet++等网络提取特征。查询生成模块可以使用预定义的规则或学习的方法来生成查询。扩散策略模块使用条件扩散模型,以查询和点云特征作为条件,生成低层控制动作。损失函数包括动作预测损失和技能完成损失,用于训练扩散策略模块。具体的网络结构和参数设置根据不同的装配任务进行调整。
🖼️ 关键图片
📊 实验亮点
在FurnitureBench的模拟和真实环境中,QDP在技能精度和长时程成功率方面均优于基线方法。在具有挑战性的插入和拧螺丝任务中,QDP的技能成功率比没有结构化查询的基线提高了50%以上。这些结果表明,QDP能够有效地弥合高层规划和低层控制之间的差距,提高机器人装配的性能。
🎯 应用场景
该研究成果可应用于各种机器人装配场景,例如家具组装、电子产品组装、汽车零部件装配等。通过提高机器人装配的精度、效率和鲁棒性,可以降低生产成本,提高产品质量,并实现自动化生产。
📄 摘要(原文)
The robotic assembly task poses a key challenge in building generalist robots due to the intrinsic complexity of part interactions and the sensitivity to noise perturbations in contact-rich settings. The assembly agent is typically designed in a hierarchical manner: high-level multi-part reasoning and low-level precise control. However, implementing such a hierarchical policy is challenging in practice due to the mismatch between high-level skill queries and low-level execution. To address this, we propose the Query-centric Diffusion Policy (QDP), a hierarchical framework that bridges high-level planning and low-level control by utilizing queries comprising objects, contact points, and skill information. QDP introduces a query-centric mechanism that identifies task-relevant components and uses them to guide low-level policies, leveraging point cloud observations to improve the policy's robustness. We conduct comprehensive experiments on the FurnitureBench in both simulation and real-world settings, demonstrating improved performance in skill precision and long-horizon success rate. In the challenging insertion and screwing tasks, QDP improves the skill-wise success rate by over 50% compared to baselines without structured queries.