Scale-Invariant Sampling in Multi-Arm Bandit Motion Planning for Object Extraction

作者: Servet B. Bayraktar, Andreas Orthey, Marc Toussaint

分类: cs.RO

发布日期: 2026-04-15

备注: 19 pages, 5 figures. Accepted at WAFR 2026

💡 一句话要点

提出尺度不变采样策略，解决狭窄空间内物体提取的运动规划问题

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 运动规划 物体提取 尺度不变采样 多臂赌博机 机器人拆卸

📋 核心要点

在狭窄空间内的物体提取任务中，传统采样方法效率低下，因为大多数运动会导致与环境的碰撞。
论文提出一种尺度不变采样策略，通过grow-shrink搜索寻找合适的采样尺度，并利用PCA确定提取方向。
实验表明，该方法在多个3D物体提取场景中显著提高了成功率，优于传统和现代采样策略。

📝 摘要（中文）

本文提出了一种新颖的尺度不变采样策略，用于解决物体提取任务，尤其是在拆卸问题中，例如从狭窄空间移除螺栓、螺钉或销钉。针对传统基于采样的规划器在复杂环境中采样效率低下的问题，该策略通过grow-shrink搜索探索配置空间，寻找有效的高熵采样尺度。一旦找到合适的采样尺度，该框架利用主成分分析(PCA)寻找物体提取的有效方向。该采样器被嵌入到多臂赌博机快速探索随机树(MAB-RRT)规划器中，并在八个具有挑战性的3D物体提取场景中进行了测试，包括螺栓、齿轮、杆、销钉和插座。实验结果表明，在八个场景中的七个场景中，尺度不变采样将成功率提高了一个数量级。这表明尺度不变采样是拆卸任务中通用物体提取的重要概念。

🔬 方法详解

问题定义：论文旨在解决在狭窄、复杂的环境中进行物体提取的运动规划问题，例如拆卸任务。现有基于采样的运动规划方法，如RRT，在这些场景中面临挑战，因为随机采样的运动轨迹很容易与环境发生碰撞，导致采样效率极低，难以找到可行的路径。现有方法难以有效探索配置空间，尤其是在物体周围存在大量障碍物的情况下。

核心思路：论文的核心思路是引入尺度不变采样，即根据物体周围环境的复杂程度动态调整采样尺度。通过grow-shrink搜索策略，找到既能避免碰撞又能有效探索配置空间的采样尺度。找到合适的尺度后，利用PCA分析该尺度下的运动方向，优先采样更有可能成功的方向，从而提高采样效率。

技术框架：整体框架包括以下几个主要阶段：1) 尺度搜索阶段：使用grow-shrink策略在配置空间中搜索合适的采样尺度。Grow阶段逐步增大采样尺度，Shrink阶段逐步减小采样尺度，目标是找到一个既能避免碰撞又能保证探索性的尺度。2) 方向优化阶段：在找到合适的采样尺度后，利用PCA分析该尺度下的运动方向，选择方差最大的几个方向作为优先采样的方向。3) MAB-RRT规划阶段：将尺度不变采样器嵌入到多臂赌博机快速探索随机树(MAB-RRT)规划器中。MAB-RRT利用多臂赌博机算法平衡探索和利用，选择不同的采样策略（包括尺度不变采样和其他采样策略），并根据其成功率动态调整选择概率。

关键创新：最重要的技术创新点是尺度不变采样策略。与传统的固定尺度采样或基于障碍物的采样相比，该策略能够根据环境的复杂程度动态调整采样尺度，从而提高采样效率和规划成功率。此外，结合PCA进行方向优化，进一步提高了采样效率。与现有方法的本质区别在于，该方法不再依赖于预先设定的采样策略，而是通过学习的方式找到最适合当前环境的采样策略。

关键设计：Grow-shrink搜索策略的关键参数包括初始采样尺度、尺度增长/缩小因子、最大/最小采样尺度等。PCA分析的关键设计包括选择多少个主成分方向进行采样，以及如何将这些方向与随机采样相结合。MAB-RRT规划器的关键设计包括如何定义奖励函数（例如，是否成功扩展树），以及如何平衡不同采样策略的探索和利用。

📊 实验亮点

实验结果表明，在八个具有挑战性的3D物体提取场景中，尺度不变采样策略在七个场景中将成功率提高了一个数量级。与uniform sampling, obstacle-based sampling, narrow-passage sampling等传统方法，以及mate vectors, physics-based planning, disassembly breadth first search等现代方法相比，该方法在成功率和规划时间上均表现出显著优势，证明了尺度不变采样在复杂环境下的有效性。

🎯 应用场景

该研究成果可广泛应用于机器人操作、自动化装配、拆卸、医疗手术等领域。尤其是在狭窄、复杂的环境中进行物体操作的任务中，例如在拥挤的生产线上进行零件装配，或是在医疗手术中进行微创操作。该方法能够提高机器人操作的效率和可靠性，降低操作难度和成本，具有重要的实际应用价值。

📄 摘要（原文）

Object extraction tasks often occur in disassembly problems, where bolts, screws, or pins have to be removed from tight, narrow spaces. In such problems, the distance to the environment is often on the millimeter scale. Sampling-based planners can solve such problems and provide completeness guarantees. However, sampling becomes a bottleneck, since almost all motions will result in collisions with the environment. To overcome this problem, we propose a novel scale-invariant sampling strategy which explores the configuration space using a grow-shrink search to find useful, high-entropy sampling scales. Once a useful sampling scale has been found, our framework exploits this scale by using a principal components analysis (PCA) to find useful directions for object extraction. We embed this sampler into a multi-arm bandit rapidly-exploring random tree (MAB-RRT) planner and test it on eight challenging 3D object extraction scenarios, involving bolts, gears, rods, pins, and sockets. To evaluate our framework, we compare it with classical sampling strategies like uniform sampling, obstacle-based sampling, and narrow-passage sampling, and with modern strategies like mate vectors, physics-based planning, and disassembly breadth first search. Our experiments show that scale-invariant sampling improves success rate by one order of magnitude on 7 out of 8 scenarios. This demonstrates that scale-invariant sampling is an important concept for general purpose object extraction in disassembly tasks.

Scale-Invariant Sampling in Multi-Arm Bandit Motion Planning for Object Extraction

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理