Haptic Sorter: A Unified Planning Framework for Online Shape Estimation and Real-Time Pose Inference

📄 arXiv: 2605.31352v1 📥 PDF

作者: Zhuoyi Lu, Lin Yang, Sri Harsha Turlapati, Domenico Campolo

分类: cs.RO

发布日期: 2026-05-29


💡 一句话要点

提出Haptic Sorter,用于在线形状估计和实时姿态推断的统一规划框架

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 触觉感知 机器人操作 形状估计 姿态推断 贝叶斯优化

📋 核心要点

  1. 机器人操作通常假设物体形状和姿态已知,但实际中精确几何信息难以获取,姿态推断易受传感器误差和遮挡影响。
  2. 论文提出一种统一框架,利用贝叶斯优化引导触觉探索进行形状推断,并结合自适应操作势函数和在线ODE进行姿态推断。
  3. 在2D机器人分拣任务中,通过仿真和真实多臂实验验证了该框架在不同物体几何形状下的鲁棒性和泛化能力。

📝 摘要(中文)

本文提出了一种统一的、基于模型的几何框架,集成了机器人触觉感知、建模和操作规划。该框架旨在解决机器人操作中物体形状和姿态先验信息不准确的问题,以及姿态推断易受传感器不确定性和视线遮挡影响的挑战。主要创新点包括:(i) 引入贝叶斯优化(BO)指导触觉探索,用于物体形状推断,并使用超椭圆近似几何边界;(ii) 自适应地构建操作势函数,编码物体几何信息,用于准静态机器人-物体交互;(iii) 提出一种在线常微分方程(ODE),基于模型预测和触觉反馈进行实时姿态推断。该系统部署于2D机器人分拣任务中,通过改变物体几何形状,验证了框架在仿真和真实多臂环境中的鲁棒性和泛化性。

🔬 方法详解

问题定义:机器人操作中,精确的物体形状和姿态信息通常是运动规划的前提。然而,在实际应用中,由于传感器噪声、视线遮挡以及物体本身的不确定性,这些信息往往难以准确获取。现有的方法通常依赖于精确的3D模型或复杂的视觉算法,对环境和传感器的要求较高,难以适应动态变化的环境。因此,如何在缺乏精确先验知识的情况下,实现鲁棒的物体操作是一个重要的挑战。

核心思路:本文的核心思路是将触觉感知、物体建模和操作规划整合到一个统一的框架中。通过触觉探索,利用贝叶斯优化方法逐步推断物体的形状,并结合自适应的操作势函数和在线常微分方程,实现实时的姿态推断。这种方法的核心在于利用触觉反馈来弥补视觉信息的不足,并结合模型预测来提高姿态推断的准确性和鲁棒性。

技术框架:该框架主要包含三个模块:(1) 基于贝叶斯优化的形状推断模块,通过触觉探索获取物体表面的信息,并使用超椭圆来近似物体的几何形状;(2) 自适应操作势函数模块,根据物体几何形状构建操作势函数,用于指导机器人的运动规划;(3) 基于在线常微分方程的姿态推断模块,利用模型预测和触觉反馈,实时更新物体的姿态估计。整个流程是一个闭环反馈系统,通过不断地触觉感知和姿态推断,实现对物体的精确操作。

关键创新:该论文的关键创新在于将贝叶斯优化引入到触觉探索中,用于物体形状的推断。与传统的触觉感知方法相比,贝叶斯优化能够更有效地利用触觉反馈,减少探索的次数,并提高形状推断的准确性。此外,该论文还提出了一种自适应的操作势函数,能够根据物体的几何形状动态调整,从而实现更鲁棒的机器人-物体交互。

关键设计:在形状推断模块中,使用超椭圆作为物体几何形状的近似模型,并通过贝叶斯优化来优化超椭圆的参数。在操作势函数模块中,势函数的设计考虑了物体与机器人之间的距离和方向关系,并根据物体的几何形状进行自适应调整。在姿态推断模块中,常微分方程的建立基于物体运动的物理模型和触觉反馈,通过最小化预测误差来更新姿态估计。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该框架能够在仿真和真实环境中实现对不同形状物体的分拣任务。通过改变物体几何形状,验证了框架的鲁棒性和泛化能力。具体而言,该框架能够有效地利用触觉反馈进行形状推断和姿态估计,从而实现对物体的精确操作。虽然论文中没有给出具体的性能指标,但实验结果表明该方法在实际应用中具有良好的潜力。

🎯 应用场景

该研究成果可应用于自动化分拣、装配等领域,尤其适用于缺乏精确视觉信息的复杂环境。例如,在物流仓储中,机器人可以通过触觉感知对不同形状的包裹进行分拣;在工业生产线上,机器人可以利用触觉反馈进行精密装配。该研究有助于提高机器人操作的鲁棒性和适应性,推动机器人技术在更多领域的应用。

📄 摘要(原文)

Robotics manipulation usually assumes that the shape and pose of the object are known to the robot prior to motion planning. However, precise geometric information is not always available in practice, and pose inference suffers from sensor uncertainties and view occlusion. In this work, we propose a unified model-based geometric framework integrating robotic haptic perception, modeling, and manipulation planning. Our novelties involve: \textit{i)} Introducing Bayesian Optimization (BO) to guide the haptic exploration for object shape inference, where superellipses are used to approximate geometric boundary; \textit{ii)} Adaptive formulation of manipulation potential encoding object geometry for quasi-static robot-object interaction; \textit{iii)} Proposing an online Ordinary Differential Equation (ODE) for real-time pose inference based on model prediction and tactile feedback. We deploy our system on a 2D robotic sorting task, and vary object geometries to validate the robustness and generalizability of our framework in both simulation and a real-world multi-arm setup.