GRITS: A Spillage-Aware Guided Diffusion Policy for Robot Food Scooping Tasks

📄 arXiv: 2510.00573v1 📥 PDF

作者: Yen-Ling Tai, Yi-Ru Yang, Kuan-Ting Yu, Yu-Wei Chao, Yi-Ting Chen

分类: cs.RO

发布日期: 2025-10-01


💡 一句话要点

GRITS:一种用于机器人食物舀取任务的防溢出引导扩散策略

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 机器人操作 食物舀取 扩散模型 引导策略 溢出预测 强化学习 机器人学习

📋 核心要点

  1. 现有机器人学习方法在处理动态食物舀取任务时,容易因食物状态变化导致溢出,可靠性不足。
  2. GRITS通过引导扩散策略,利用溢出预测器作为可微分的引导信号,优化轨迹,减少溢出。
  3. 实验表明,GRITS在真实机器人平台上,显著降低了食物舀取过程中的溢出率,提高了任务成功率。

📝 摘要(中文)

机器人食物舀取是食品制备和服务机器人的关键操作技能。然而,现有的机器人学习算法,特别是示教学习方法,仍然难以处理多样化和动态的食物状态,这通常会导致溢出并降低可靠性。本文提出了GRITS:一种用于机器人食物舀取任务的防溢出引导扩散策略。该框架利用引导扩散策略来最小化舀取过程中的食物溢出,并确保食物从初始位置可靠地转移到目标位置。具体来说,我们设计了一个溢出预测器,用于估计给定当前观察和动作轨迹的溢出概率。该预测器在模拟数据集上进行训练,该数据集包含食物溢出场景,由四种基本形状(球体、立方体、锥体和圆柱体)构成,并具有不同的物理属性,如质量、摩擦力和粒度。在推理时,该预测器作为可微分的引导信号,引导扩散采样过程朝着更安全的轨迹发展,同时保持任务成功。我们在真实的机器人食物舀取平台上验证了GRITS。GRITS在六个食物类别上进行训练,并在十个具有不同形状和数量的未见类别上进行评估。GRITS实现了82%的任务成功率和4%的溢出率,与没有引导的基线相比,溢出率降低了40%以上,从而证明了其有效性。

🔬 方法详解

问题定义:论文旨在解决机器人食物舀取任务中,由于食物状态多样和动态变化导致的溢出问题。现有方法难以适应这些变化,导致舀取过程不稳定,食物容易洒出,影响任务的可靠性。

核心思路:论文的核心思路是利用引导扩散策略,在生成舀取轨迹时,同时考虑任务成功和溢出风险。通过训练一个溢出预测器,预测给定状态和动作下的溢出概率,并将其作为引导信号,引导扩散模型生成更安全的轨迹。

技术框架:GRITS框架包含以下主要模块:1) 模拟数据生成器,用于生成包含各种食物形状和物理属性的模拟数据,并模拟溢出场景;2) 溢出预测器,基于观察和动作序列,预测溢出概率;3) 引导扩散策略,利用溢出预测器的输出作为引导信号,在扩散采样过程中调整轨迹,最小化溢出风险。

关键创新:GRITS的关键创新在于将溢出预测器与扩散模型相结合,实现了一种防溢出的引导策略。与传统的基于示教学习的方法相比,GRITS能够显式地考虑溢出风险,并生成更鲁棒和安全的舀取轨迹。此外,使用可微分的溢出预测器作为引导信号,可以直接优化扩散模型的采样过程。

关键设计:溢出预测器采用神经网络结构,输入为当前观察(例如,食物的视觉信息)和动作序列,输出为溢出概率。损失函数包括任务成功损失和溢出损失,其中溢出损失基于溢出预测器的输出。扩散模型使用标准的扩散模型架构,通过引导信号调整采样过程,生成既能完成任务又能最小化溢出的轨迹。

📊 实验亮点

GRITS在真实机器人食物舀取平台上进行了验证,在六个食物类别上训练后,在十个未见过的食物类别上进行了评估。实验结果表明,GRITS实现了82%的任务成功率和4%的溢出率,与没有引导的基线相比,溢出率降低了40%以上。这充分证明了GRITS在减少食物溢出和提高任务可靠性方面的有效性。

🎯 应用场景

GRITS技术可应用于各种食品制备和服务机器人,例如餐厅的自动配餐机器人、家庭的烹饪助手等。通过减少食物溢出,提高任务可靠性,可以显著提升用户体验,降低清洁成本,并促进机器人技术在餐饮行业的广泛应用。未来,该技术还可以扩展到其他需要精确操作的机器人任务,例如液体转移、物料搬运等。

📄 摘要(原文)

Robotic food scooping is a critical manipulation skill for food preparation and service robots. However, existing robot learning algorithms, especially learn-from-demonstration methods, still struggle to handle diverse and dynamic food states, which often results in spillage and reduced reliability. In this work, we introduce GRITS: A Spillage-Aware Guided Diffusion Policy for Robot Food Scooping Tasks. This framework leverages guided diffusion policy to minimize food spillage during scooping and to ensure reliable transfer of food items from the initial to the target location. Specifically, we design a spillage predictor that estimates the probability of spillage given current observation and action rollout. The predictor is trained on a simulated dataset with food spillage scenarios, constructed from four primitive shapes (spheres, cubes, cones, and cylinders) with varied physical properties such as mass, friction, and particle size. At inference time, the predictor serves as a differentiable guidance signal, steering the diffusion sampling process toward safer trajectories while preserving task success. We validate GRITS on a real-world robotic food scooping platform. GRITS is trained on six food categories and evaluated on ten unseen categories with different shapes and quantities. GRITS achieves an 82% task success rate and a 4% spillage rate, reducing spillage by over 40% compared to baselines without guidance, thereby demonstrating its effectiveness.