Lightweight Learning from Actuation-Space Demonstrations via Flow Matching for Whole-Body Soft Robotic Grasping

📄 arXiv: 2511.01770v1 📥 PDF

作者: Liudi Yang, Yang Bai, Yuhao Wang, Ibrahim Alsarraj, Gitta Kutyniok, Zhanchi Wang, Ke Wu

分类: cs.RO

发布日期: 2025-11-03


💡 一句话要点

提出基于流匹配的轻量级驱动空间学习方法,用于全身软体机器人抓取

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 软体机器人 机器人抓取 驱动空间学习 流匹配 模仿学习

📋 核心要点

  1. 传统刚性机器人手在不确定环境中抓取时,依赖复杂模型和反馈控制,难以适应。
  2. 论文提出一种轻量级驱动空间学习框架,利用软体机器人的被动柔顺性,直接从演示中学习控制策略。
  3. 实验表明,该方法仅需少量演示即可实现高成功率,并能泛化到不同尺寸物体和动态响应。

📝 摘要(中文)

由于其不确定性和丰富的接触特性,不确定性下的机器人抓取仍然是一个根本性的挑战。传统的刚性机器人手自由度和柔顺性有限,依赖于复杂的基于模型的重型反馈控制器来管理这些交互。相比之下,软体机器人表现出具身的机械智能:其欠驱动结构和全身的被动灵活性,自然地适应不确定的接触并实现自适应行为。为了利用这种能力,我们提出了一种轻量级的驱动空间学习框架,该框架使用流匹配模型(Rectified Flow)直接从确定性演示中推断全身软体机器人抓取的分布控制表示,而无需密集的传感或繁重的控制回路。仅使用 30 个演示(不到可达工作空间的 8%),学习到的策略在整个工作空间中实现了 97.5% 的抓取成功率,推广到 +-33% 的抓取对象尺寸变化,并在通过将执行时间从 20% 缩放到 200% 直接调整机器人的动态响应时保持稳定的性能。这些结果表明,驱动空间学习通过利用其被动的冗余自由度和灵活性,将身体的力学转化为功能控制智能,并大大减轻了这种不确定性丰富的任务的中央控制器的负担。

🔬 方法详解

问题定义:论文旨在解决软体机器人在不确定环境中进行抓取的问题。现有方法,特别是针对刚性机器人的方法,通常依赖于复杂的模型和控制策略来处理接触和不确定性,这对于软体机器人来说是不必要的负担,因为软体机器人本身具有内在的适应性。

核心思路:论文的核心思路是利用软体机器人的内在机械智能,通过学习驱动空间(actuation space)的控制策略,直接从少量演示中学习抓取动作。这种方法避免了对复杂环境建模和精确控制的需求,而是让机器人通过其自身的柔顺性和冗余自由度来适应环境。

技术框架:该框架主要包含以下几个步骤:1) 数据收集:通过人工演示收集少量(30个)抓取动作的驱动空间数据。2) 流匹配模型训练:使用收集到的数据训练一个流匹配模型(Rectified Flow),该模型学习从随机噪声到目标驱动状态的映射。3) 控制策略生成:利用训练好的流匹配模型,根据当前状态生成控制指令,驱动软体机器人进行抓取。

关键创新:该论文的关键创新在于:1) 提出了一种轻量级的驱动空间学习方法,避免了对复杂环境建模和精确控制的需求。2) 使用流匹配模型直接从少量演示中学习控制策略,提高了学习效率和泛化能力。3) 将软体机器人的内在机械智能融入到控制策略中,使其能够更好地适应不确定环境。

关键设计:论文中使用的流匹配模型(Rectified Flow)是一种生成模型,它通过学习一个连续的向量场,将一个简单的分布(如高斯分布)映射到目标分布。在训练过程中,论文使用了均方误差损失函数来优化向量场。此外,论文还对驱动空间数据进行了归一化处理,以提高模型的训练效果。

📊 实验亮点

实验结果表明,该方法仅使用 30 个演示,即可在整个工作空间中实现 97.5% 的抓取成功率,并且能够泛化到 +-33% 的抓取对象尺寸变化。此外,该方法在机器人动态响应发生变化时,仍能保持稳定的性能,表明其具有较强的鲁棒性。

🎯 应用场景

该研究成果可应用于各种复杂环境下的软体机器人抓取任务,例如:医疗康复、食品加工、物流分拣等。通过学习少量演示,软体机器人能够快速适应新的抓取对象和环境,降低了开发成本和部署难度。此外,该方法还可以推广到其他软体机器人控制任务中,例如:软体机器人的运动控制、形状控制等。

📄 摘要(原文)

Robotic grasping under uncertainty remains a fundamental challenge due to its uncertain and contact-rich nature. Traditional rigid robotic hands, with limited degrees of freedom and compliance, rely on complex model-based and heavy feedback controllers to manage such interactions. Soft robots, by contrast, exhibit embodied mechanical intelligence: their underactuated structures and passive flexibility of their whole body, naturally accommodate uncertain contacts and enable adaptive behaviors. To harness this capability, we propose a lightweight actuation-space learning framework that infers distributional control representations for whole-body soft robotic grasping, directly from deterministic demonstrations using a flow matching model (Rectified Flow),without requiring dense sensing or heavy control loops. Using only 30 demonstrations (less than 8% of the reachable workspace), the learned policy achieves a 97.5% grasp success rate across the whole workspace, generalizes to grasped-object size variations of +-33%, and maintains stable performance when the robot's dynamic response is directly adjusted by scaling the execution time from 20% to 200%. These results demonstrate that actuation-space learning, by leveraging its passive redundant DOFs and flexibility, converts the body's mechanics into functional control intelligence and substantially reduces the burden on central controllers for this uncertain-rich task.