Variational Neural Belief Parameterizations for Robust Dexterous Grasping under Multimodal Uncertainty
作者: Clinton Enwerem, Shreya Kalyanaraman, John S. Baras, Calin Belta
分类: cs.RO, cs.LG, eess.SY
发布日期: 2026-04-28
备注: 11 pages, 10 figures
💡 一句话要点
提出变分神经信念参数化以解决多模态不确定性下的灵巧抓取问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 变分推断 高斯混合体 灵巧抓取 多模态不确定性 风险敏感控制 机器人技术 优化算法
📋 核心要点
- 现有方法在处理抓取执行中的接触变异和不确定性时,往往忽视尾部结果,导致抓取失败。
- 本文提出通过变分推断对潜在接触参数和物体姿态进行建模,使用可微分的高斯混合体来表示信念。
- 实验结果显示,所提方法在抓取成功率和规划时间上均优于传统的粒子滤波模型预测控制方法。
📝 摘要(中文)
抓取执行受到接触变异、传感器不确定性和外部干扰的影响,导致其具有随机性。现有的期望质量目标忽视尾部结果,常常选择在不利接触情况下失败的抓取。风险敏感的部分可观测马尔可夫决策过程(POMDP)虽然解决了这一问题,但许多方法使用的粒子滤波信念扩展性差,阻碍了基于梯度的优化,并且以高方差近似估计条件风险价值(CVaR)。本文提出将抓取获取视为对潜在接触参数和物体姿态的变分推断,使用可微分的高斯混合体表示信念。通过Gumbel-Softmax组件选择和位置-尺度重参数化,将样本表示为信念参数的平滑函数,从而实现通过可微CVaR替代品的路径梯度优化。实验表明,所提变分神经信念在接触参数不确定性和外部力扰动下显著提高了抓取成功率,并将规划时间缩短了约一个数量级。
🔬 方法详解
问题定义:本文旨在解决在多模态不确定性下灵巧抓取的随机性问题。现有的粒子滤波信念方法在处理复杂不确定性时扩展性差,且难以进行有效的梯度优化。
核心思路:通过将抓取获取视为对潜在接触参数和物体姿态的变分推断,利用可微分的高斯混合体来表示信念,从而实现更高效的优化过程。
技术框架:整体框架包括信念的变分推断、Gumbel-Softmax组件选择和位置-尺度重参数化。通过这些模块,样本能够被表示为信念参数的平滑函数,进而实现路径梯度的计算。
关键创新:最重要的创新在于使用可微分的高斯混合体来表示信念,并通过变分推断实现对接触参数的建模,这与传统的粒子滤波方法有本质区别。
关键设计:在设计中,采用了Gumbel-Softmax进行组件选择,并通过位置-尺度重参数化来优化样本生成过程。此外,损失函数的设计也考虑了CVaR的可微性,以便于直接优化尾部鲁棒性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,所提变分神经信念在接触参数不确定性和外部力扰动下的抓取成功率显著提高,相较于粒子滤波模型预测控制,规划时间缩短了约一个数量级。同时,所提方法在抓取质量的评估上也表现出更高的准确性,平均绝对校准误差低于0.14,而交叉熵方法规划器的误差为0.58。
🎯 应用场景
该研究的潜在应用领域包括机器人抓取、自动化装配和人机交互等场景,能够有效提升在不确定环境下的操作可靠性。未来,该方法有望在复杂动态环境中实现更高效的抓取和操作,推动智能机器人技术的发展。
📄 摘要(原文)
Contact variability, sensing uncertainty, and external disturbances make grasp execution stochastic. Expected-quality objectives ignore tail outcomes and often select grasps that fail under adverse contact realizations. Risk-sensitive POMDPs address this failure mode, but many use particle-filter beliefs that scale poorly, obstruct gradient-based optimization, and estimate Conditional Value-at-Risk (CVaR) with high-variance approximations. We instead formulate grasp acquisition as variational inference over latent contact parameters and object pose, representing the belief with a differentiable Gaussian mixture. We use Gumbel-Softmax component selection and location-scale reparameterization to express samples as smooth functions of the belief parameters, enabling pathwise gradients through a differentiable CVaR surrogate for direct optimization of tail robustness. In simulation, our variational neural belief improves robust grasp success under contact-parameter uncertainty and exogenous force perturbations while reducing planning time by roughly an order of magnitude relative to particle-filter model-predictive control. On a serial-chain robot arm with a multifingered hand, we validate grasp-and-lift success under object-pose uncertainty against a Gaussian baseline. Both methods succeed on the tested perturbations, but our controller terminates in fewer steps and less wall-clock time while achieving a higher tactile grasp-quality proxy. Our learned belief also calibrates risk more accurately, keeping mean absolute calibration error below 0.14 across tested simulation regimes, compared with 0.58 for a Cross-Entropy Method planner.