vMF-Contact: Uncertainty-aware Evidential Learning for Probabilistic Contact-grasp in Noisy Clutter
作者: Yitian Shi, Edgar Welte, Maximilian Gilles, Rania Rayyes
分类: cs.RO
发布日期: 2024-11-06 (更新: 2025-03-16)
备注: Accepted to ICRA 2025
🔗 代码/项目: GITHUB
💡 一句话要点
提出vMF-Contact,通过证据学习和vMF分布建模,提升噪声环境下概率接触抓取的鲁棒性。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 机器人抓取 不确定性建模 证据学习 vMF分布 点云重建 认知不确定性 偶然不确定性
📋 核心要点
- 现有抓取方法难以有效处理噪声环境下的不确定性,尤其是在认知不确定性方面,实时性受限。
- 论文提出vMF-Contact架构,利用证据学习和vMF分布,对接触抓取中的偶然和认知不确定性进行建模。
- 实验表明,该方法在真实场景中显著提升了抓取清除率,相比基线方法提升了39%。
📝 摘要(中文)
在存在遮挡、传感器噪声和分布外(OOD)对象等噪声环境中进行抓取学习面临巨大挑战。现有的基于学习的方法主要关注捕获来自固有数据噪声的偶然不确定性。而代表OOD识别的认知不确定性通常通过具有多个前向路径的集成方法来解决,限制了实时应用。本文提出了一种不确定性感知方法,用于6自由度抓取检测,该方法使用证据学习来全面捕获真实世界机器人抓取中的两种不确定性。作为一项关键贡献,我们引入了vMF-Contact,这是一种新颖的架构,用于学习具有方向不确定性的概率建模的分层接触抓取表示,使用von Mises-Fisher (vMF)分布。为此,我们分析了后验参数化的二阶目标的理论公式,为模型量化不确定性和提高抓取预测性能的能力提供了形式保证。此外,我们通过应用部分点重建作为辅助任务来增强特征表达能力,从而提高对不确定性量化的理解以及对未见对象的泛化能力。在真实世界的实验中,我们的方法与基线相比,整体清除率显着提高了39%。
🔬 方法详解
问题定义:论文旨在解决在复杂、噪声环境下机器人抓取任务中,由于遮挡、传感器噪声以及未见过的物体(Out-of-Distribution, OOD)带来的不确定性问题。现有方法主要关注数据本身的噪声(偶然不确定性),而忽略了模型对未知物体的认知不确定性。并且,现有处理认知不确定性的方法,如集成方法,计算量大,难以满足实时性要求。
核心思路:论文的核心思路是利用证据学习(Evidential Learning)同时建模偶然不确定性和认知不确定性。通过将抓取方向建模为von Mises-Fisher (vMF)分布,可以有效地表示方向上的不确定性。此外,通过引入部分点云重建作为辅助任务,增强模型对场景的理解,从而提升不确定性估计的准确性。
技术框架:vMF-Contact的整体架构包含以下几个主要模块:1) 特征提取模块:用于从输入的点云数据中提取特征。2) 证据学习模块:利用证据学习框架,预测抓取姿态的证据分布,从而量化不确定性。3) vMF分布建模模块:将抓取方向建模为vMF分布,用于表示方向上的不确定性。4) 部分点云重建模块:作为一个辅助任务,用于提升特征表达能力和不确定性估计的准确性。
关键创新:论文的关键创新在于:1) 提出了vMF-Contact架构,将证据学习和vMF分布建模相结合,能够同时捕获偶然不确定性和认知不确定性。2) 分析了后验参数化的二阶目标的理论公式,为模型量化不确定性和提高抓取预测性能的能力提供了形式保证。3) 引入了部分点云重建作为辅助任务,提升了特征表达能力和对未知物体的泛化能力。
关键设计:在vMF-Contact中,抓取方向被建模为vMF分布,其参数由网络预测。证据学习框架中的损失函数被设计为能够鼓励模型学习到准确的证据分布,从而量化不确定性。部分点云重建任务的损失函数被设计为最小化重建点云与原始点云之间的差异。网络结构采用PointNet++作为主干网络,用于提取点云特征。
🖼️ 关键图片
📊 实验亮点
实验结果表明,vMF-Contact在真实世界的机器人抓取任务中取得了显著的性能提升。与基线方法相比,整体清除率提高了39%。这表明该方法能够有效地处理噪声环境下的不确定性,并提高抓取的成功率。此外,消融实验验证了vMF分布建模和部分点云重建辅助任务的有效性。
🎯 应用场景
该研究成果可应用于各种需要机器人抓取的场景,例如:自动化仓库中的物体拣选、家庭服务机器人中的物品整理、以及在复杂环境下的工业机器人操作。通过提高抓取的鲁棒性和可靠性,可以减少人工干预,提高自动化水平,并降低操作风险。未来,该方法可以进一步扩展到更复杂的任务中,例如:多物体抓取、动态环境下的抓取等。
📄 摘要(原文)
Grasp learning in noisy environments, such as occlusions, sensor noise, and out-of-distribution (OOD) objects, poses significant challenges. Recent learning-based approaches focus primarily on capturing aleatoric uncertainty from inherent data noise. The epistemic uncertainty, which represents the OOD recognition, is often addressed by ensembles with multiple forward paths, limiting real-time application. In this paper, we propose an uncertainty-aware approach for 6-DoF grasp detection using evidential learning to comprehensively capture both uncertainties in real-world robotic grasping. As a key contribution, we introduce vMF-Contact, a novel architecture for learning hierarchical contact grasp representations with probabilistic modeling of directional uncertainty as von Mises-Fisher (vMF) distribution. To achieve this, we analyze the theoretical formulation of the second-order objective on the posterior parametrization, providing formal guarantees for the model's ability to quantify uncertainty and improve grasp prediction performance. Moreover, we enhance feature expressiveness by applying partial point reconstructions as an auxiliary task, improving the comprehension of uncertainty quantification as well as the generalization to unseen objects. In the real-world experiments, our method demonstrates a significant improvement by 39% in the overall clearance rate compared to the baselines. The code is available under: https://github.com/YitianShi/vMF-Contact/