Primitive-based Truncated Diffusion for Efficient Trajectory Generation of Differential Drive Mobile Manipulators

📄 arXiv: 2604.04166 📥 PDF

作者: Long Xu, Choilam Wong, Yuhang Zhong, Junxiao Lin, Jialiang Hou, Fei Gao

分类: cs.RO

发布日期: 2026-04-07


💡 一句话要点

提出基于原语截断扩散的运动规划器,高效生成差速移动机械臂轨迹。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 移动机械臂 运动规划 扩散模型 轨迹优化 深度学习

📋 核心要点

  1. 现有差速移动机械臂运动规划方法在复杂环境中效率较低,成功率受限,难以保证轨迹最优性。
  2. 论文提出一种基于原语的截断扩散模型,通过从有偏分布采样,提升轨迹生成效率和多样性。
  3. 实验结果表明,该方法在复杂3D环境中,相较于传统方法和原始扩散模型,显著提升了成功率和轨迹多样性,并保持了竞争力的运行时间。

📝 摘要(中文)

本文提出了一种学习增强的差速移动机械臂运动规划器,旨在提高效率、成功率和最优性。对于任务表征编码器,我们提出了一个关键点序列提取模块,通过可微正向运动学将边界状态映射到3D空间。点云和关键点被分别编码,并通过注意力机制融合,从而有效地整合环境和边界状态信息。此外,我们还提出了一种基于原语的截断扩散模型,该模型从有偏分布中采样。与原始扩散模型相比,该框架提高了解决方案的效率和多样性。去噪后的路径通过轨迹优化进行细化,以确保动态可行性和特定于任务的最优性。在杂乱的3D仿真中,与原始扩散模型和经典基线相比,我们的方法实现了更高的成功率、改进的轨迹多样性和具有竞争力的运行时间。源代码已发布在指定URL。

🔬 方法详解

问题定义:论文旨在解决差速驱动移动机械臂在复杂环境中运动规划效率低、成功率不高以及难以保证轨迹最优性的问题。现有方法,如传统采样方法或基于优化的方法,在复杂环境中搜索空间大,容易陷入局部最优,而直接应用扩散模型则计算成本高昂。

核心思路:论文的核心思路是利用学习方法,特别是扩散模型,学习运动规划的先验知识,并结合轨迹优化方法,生成高质量的轨迹。通过引入基于原语的截断扩散模型,限制采样空间,提高采样效率,同时保证轨迹的多样性。

技术框架:整体框架包含三个主要模块:1) 任务表征编码器:提取环境点云和边界状态的关键点序列,并使用注意力机制融合;2) 基于原语的截断扩散模型:从有偏分布中采样,生成初始轨迹;3) 轨迹优化器:对初始轨迹进行优化,确保动态可行性和任务最优性。

关键创新:最重要的技术创新点在于提出了基于原语的截断扩散模型。与传统的扩散模型相比,该模型不是从完全随机的噪声开始采样,而是从一个基于运动原语的有偏分布开始,从而大大缩小了搜索空间,提高了采样效率和轨迹的合理性。

关键设计:任务表征编码器使用可微正向运动学将边界状态映射到3D空间,并使用注意力机制融合点云和关键点信息。截断扩散模型使用预定义的运动原语作为先验知识,并设计了相应的采样策略。轨迹优化器使用动态可行性和任务相关的代价函数,对轨迹进行平滑和优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在杂乱的3D仿真环境中,相较于原始扩散模型和经典基线,实现了更高的成功率、改进的轨迹多样性和具有竞争力的运行时间。具体数据未在摘要中给出,但强调了在多个指标上的显著提升。

🎯 应用场景

该研究成果可应用于自动化仓库、智能工厂、医疗机器人等领域,提升移动机械臂在复杂环境中的作业效率和自主性。通过学习环境先验知识和运动规律,机器人能够更快速、更可靠地完成搬运、装配等任务,降低人工干预的需求,提高生产效率和安全性。

📄 摘要(原文)

We present a learning-enhanced motion planner for differential drive mobile manipulators to improve efficiency, success rate, and optimality. For task representation encoder, we propose a keypoint sequence extraction module that maps boundary states to 3D space via differentiable forward kinematics. Point clouds and keypoints are encoded separately and fused with attention, enabling effective integration of environment and boundary states information. We also propose a primitive-based truncated diffusion model that samples from a biased distribution. Compared with vanilla diffusion model, this framework improves the efficiency and diversity of the solution. Denoised paths are refined by trajectory optimization to ensure dynamic feasibility and task-specific optimality. In cluttered 3D simulations, our method achieves higher success rate, improved trajectory diversity, and competitive runtime compared to vanilla diffusion and classical baselines. The source code is released atthis https URL.