Learning to Throw-Flip

📄 arXiv: 2510.10357v1 📥 PDF

作者: Yang Liu, Bruno Da Costa, Aude Billard

分类: cs.RO, cs.LG

发布日期: 2025-10-11

备注: Accepted to IROS 2025. Video Summary: https://youtu.be/txYc9b1oflU


💡 一句话要点

提出一种基于学习的投掷翻转方法,实现机器人对物体精确的姿态控制

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱八:物理动画 (Physics-based Animation)

关键词: 机器人投掷 姿态控制 动态操作 机器学习 物理建模

📋 核心要点

  1. 传统机器人投掷操作难以精确控制物体落地时的姿态,限制了其在物流等领域的应用。
  2. 该方法设计特定的投掷运动以解耦寄生旋转,并结合物理模型和回归学习来提升精度。
  3. 实验表明,该方法能快速学习将物体投掷到目标姿态,且能有效利用已有知识加速学习。

📝 摘要(中文)

本文提出了一种使机器人能够精确地“投掷翻转”物体到期望着陆姿态(位置和方向)的方法。传统的旋转机器人投掷物体时会产生寄生旋转,导致着陆姿态受限且难以控制。该方法基于两个关键设计:首先,利用冲量-动量原理,设计了一系列能够有效解耦寄生旋转的投掷运动,显著扩展了可行的着陆姿态集合。其次,结合基于物理的自由飞行模型和基于回归的学习方法来解决未建模的影响。真实机器人实验表明,该框架可以在数十次试验中学习将物体投掷翻转到(±5厘米,±45度)阈值内的目标姿态。由于数据同化,与端到端学习方法相比,在投掷翻转到未见过的姿态时,结合弹丸动力学可将样本复杂度平均降低40%。此外,该方法还能有效重用过去在手物体旋转方面的知识,在投掷具有质心(CoM)偏移的新物体时,学习速度提高了70%。

🔬 方法详解

问题定义:现有机器人投掷物体的方法主要关注落点位置,忽略了物体落地时的姿态控制。由于旋转机器人在投掷过程中会产生寄生旋转,导致物体落地姿态难以预测和控制,严重限制了其应用范围。因此,需要一种能够精确控制物体落地姿态的投掷方法。

核心思路:论文的核心思路是将投掷运动设计与学习方法相结合。首先,通过理论分析,设计特定的投掷运动来解耦寄生旋转,从而扩大可控的落地姿态范围。然后,利用物理模型对自由飞行过程进行建模,并结合回归学习方法来补偿模型误差和未建模因素,最终实现精确的姿态控制。

技术框架:该方法的技术框架主要包括两个阶段:运动规划和学习优化。在运动规划阶段,基于冲量-动量原理,设计一系列投掷运动,以解耦寄生旋转。在学习优化阶段,首先利用物理模型预测落地姿态,然后使用回归模型(例如神经网络)对预测结果进行修正,并通过实验数据不断优化模型参数。整体流程为:给定目标姿态 -> 运动规划生成初始轨迹 -> 物理模型预测 -> 回归模型修正 -> 执行投掷 -> 收集数据 -> 更新回归模型。

关键创新:该方法最重要的技术创新点在于将基于物理的建模与数据驱动的学习相结合。传统的投掷方法要么依赖于精确的物理模型,要么完全依赖于数据学习。而该方法利用物理模型提供初始预测,减少了学习的样本复杂度,同时利用学习方法补偿模型误差,提高了精度和鲁棒性。此外,通过解耦寄生旋转的运动设计,显著扩展了可行的落地姿态范围。

关键设计:在运动规划方面,关键在于选择合适的投掷轨迹参数,以最小化寄生旋转。在学习方面,回归模型的选择和训练数据的收集策略至关重要。论文中使用了高斯过程回归(GPR)或神经网络作为回归模型。损失函数通常采用均方误差(MSE),衡量预测姿态与目标姿态之间的差异。数据收集策略采用主动学习或随机采样,以提高学习效率。

📊 实验亮点

实验结果表明,该方法能够在数十次试验中学习将物体投掷翻转到目标姿态的(±5厘米,±45度)阈值内。与端到端学习方法相比,结合弹丸动力学可将样本复杂度平均降低40%。此外,该方法还能有效重用过去在手物体旋转方面的知识,在投掷具有质心偏移的新物体时,学习速度提高了70%。

🎯 应用场景

该研究成果可应用于自动化物流、智能制造等领域。例如,在仓库拣选场景中,机器人可以通过投掷翻转将物体精确地放置到指定位置和方向,提高分拣效率和准确性。此外,该方法还可以应用于空间操作、灾难救援等复杂环境中,实现对物体的远程操控。

📄 摘要(原文)

Dynamic manipulation, such as robot tossing or throwing objects, has recently gained attention as a novel paradigm to speed up logistic operations. However, the focus has predominantly been on the object's landing location, irrespective of its final orientation. In this work, we present a method enabling a robot to accurately "throw-flip" objects to a desired landing pose (position and orientation). Conventionally, objects thrown by revolute robots suffer from parasitic rotation, resulting in highly restricted and uncontrollable landing poses. Our approach is based on two key design choices: first, leveraging the impulse-momentum principle, we design a family of throwing motions that effectively decouple the parasitic rotation, significantly expanding the feasible set of landing poses. Second, we combine a physics-based model of free flight with regression-based learning methods to account for unmodeled effects. Real robot experiments demonstrate that our framework can learn to throw-flip objects to a pose target within ($\pm$5 cm, $\pm$45 degrees) threshold in dozens of trials. Thanks to data assimilation, incorporating projectile dynamics reduces sample complexity by an average of 40% when throw-flipping to unseen poses compared to end-to-end learning methods. Additionally, we show that past knowledge on in-hand object spinning can be effectively reused, accelerating learning by 70% when throwing a new object with a Center of Mass (CoM) shift. A video summarizing the proposed method and the hardware experiments is available at https://youtu.be/txYc9b1oflU.