ChicGrasp: Imitation-Learning based Customized Dual-Jaw Gripper Control for Delicate, Irregular Bio-products Manipulation
作者: Amirreza Davar, Zhengtong Xu, Siavash Mahmoudi, Pouya Sohrabipour, Chaitanya Pallerla, Yu She, Wan Shou, Philip Crandall, Dongyi Wang
分类: cs.RO, cs.LG
发布日期: 2025-05-13
备注: Submitted for journal review
💡 一句话要点
ChicGrasp:基于模仿学习的定制双爪夹持器控制,用于精细、不规则生物产品操作
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)
关键词: 机器人抓取 模仿学习 条件扩散策略 农业机器人 生物产品操作
📋 核心要点
- 现有禽类加工依赖人工,面临家禽胴体易损、形状不规则以及卫生要求高等挑战,传统方法难以胜任。
- ChicGrasp采用软硬件协同设计,利用双爪夹持器和条件扩散策略,直接从少量演示数据中学习抓取策略。
- 实验表明,ChicGrasp在抓取和提升成功率上显著优于现有方法,为农业机器人领域提供新的解决方案。
📝 摘要(中文)
禽类自动化加工生产线仍然依赖人工将湿滑、易损的家禽胴体吊挂到传送带上。形变性、解剖结构差异以及严格的卫生规则使得传统的吸取和脚本化运动变得不可靠。我们提出了ChicGrasp,一个用于此任务的端到端软硬件协同设计。一个独立驱动的双爪气动夹持器夹紧鸡的两条腿,而一个条件扩散策略控制器,仅从50个多视角遥操作演示(RGB + 自身感知)中训练,一次性规划5自由度的末端执行器运动,其中包括夹爪命令。在单独呈现的生肉鸡胴体上,我们的系统实现了40.6%的抓取和提升成功率,并在38秒内完成从拾取到吊挂的循环,而最先进的隐式行为克隆(IBC)和LSTM-GMM基线完全失败。所有CAD、代码和数据集都将开源。ChicGrasp表明,模仿学习可以弥合刚性硬件和可变生物产品之间的差距,为农业工程和机器人学习的研究人员提供一个可重复的基准和一个公共数据集。
🔬 方法详解
问题定义:论文旨在解决禽类加工自动化中,机器人难以稳定、高效地抓取和吊挂家禽胴体的问题。现有方法,如吸取和预编程运动,由于家禽胴体的形变性、解剖结构差异以及卫生要求,表现不佳。痛点在于缺乏能够适应生物产品高度可变性的抓取策略。
核心思路:论文的核心思路是利用模仿学习,直接从人类操作员的演示数据中学习抓取策略。通过条件扩散策略,机器人能够学习到如何根据视觉输入和自身状态,控制双爪夹持器完成抓取和吊挂任务。这种方法避免了手动设计复杂控制策略的需要,并能够更好地适应生物产品的可变性。
技术框架:ChicGrasp系统包含以下主要模块:1) 双爪气动夹持器:独立驱动的双爪设计,能够灵活地夹紧家禽胴体的腿部。2) 多视角视觉系统:提供家禽胴体的RGB图像,用于策略学习。3) 条件扩散策略控制器:基于扩散模型的策略网络,根据视觉输入和自身状态,输出末端执行器的运动指令和夹爪控制指令。4) 机器人运动控制系统:执行策略网络输出的运动指令,控制夹持器完成抓取和吊挂任务。
关键创新:论文的关键创新在于将条件扩散策略应用于机器人抓取任务,并成功地从少量演示数据中学习到有效的抓取策略。与传统的行为克隆方法相比,扩散模型能够更好地处理多模态数据,并生成更加鲁棒的控制策略。此外,软硬件协同设计也是一个重要的创新点,定制的双爪夹持器能够更好地适应家禽胴体的形状。
关键设计:条件扩散策略采用U-Net结构,以RGB图像和机器人自身感知数据作为输入,预测末端执行器的运动和夹爪控制指令。损失函数包括运动损失和夹爪控制损失。训练数据仅包含50个多视角遥操作演示。夹持器的设计考虑了家禽胴体的形状和尺寸,以及卫生要求。具体参数设置和网络结构细节在论文中有详细描述(未知)。
🖼️ 关键图片
📊 实验亮点
ChicGrasp系统在生肉鸡胴体抓取和提升任务中取得了40.6%的成功率,并在38秒内完成拾取到吊挂的循环。相比之下,最先进的隐式行为克隆(IBC)和LSTM-GMM基线方法完全失败。实验结果表明,ChicGrasp能够有效地从少量演示数据中学习到鲁棒的抓取策略,显著优于现有方法。
🎯 应用场景
ChicGrasp技术可应用于禽类加工自动化生产线,提高生产效率,降低人工成本,并减少人为操作带来的食品安全风险。该研究思路和方法也可推广到其他生物产品的自动化操作,例如水果、蔬菜等,具有广阔的应用前景。此外,该研究提供的开源数据集和基准,将促进农业机器人和机器人学习领域的研究。
📄 摘要(原文)
Automated poultry processing lines still rely on humans to lift slippery, easily bruised carcasses onto a shackle conveyor. Deformability, anatomical variance, and strict hygiene rules make conventional suction and scripted motions unreliable. We present ChicGrasp, an end--to--end hardware--software co-design for this task. An independently actuated dual-jaw pneumatic gripper clamps both chicken legs, while a conditional diffusion-policy controller, trained from only 50 multi--view teleoperation demonstrations (RGB + proprioception), plans 5 DoF end--effector motion, which includes jaw commands in one shot. On individually presented raw broiler carcasses, our system achieves a 40.6\% grasp--and--lift success rate and completes the pick to shackle cycle in 38 s, whereas state--of--the--art implicit behaviour cloning (IBC) and LSTM-GMM baselines fail entirely. All CAD, code, and datasets will be open-source. ChicGrasp shows that imitation learning can bridge the gap between rigid hardware and variable bio--products, offering a reproducible benchmark and a public dataset for researchers in agricultural engineering and robot learning.