Adaptive Wiping: Adaptive contact-rich manipulation through few-shot imitation learning with Force-Torque feedback and pre-trained object representations

作者: Chikaha Tsuji, Enrique Coronado, Pablo Osorio, Gentiane Venture

分类: cs.RO

发布日期: 2025-05-09

期刊: IEEE Robotics and Automation Letters, vol.10, no.1, pp.240-247, 2025

DOI: 10.1109/LRA.2024.3497713

💡 一句话要点

提出基于力矩反馈和预训练对象表征的自适应擦拭模仿学习方法

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱二：RL算法与架构 (RL & Architecture)

关键词: 模仿学习 力矩反馈 对象表征 自适应控制 接触式操作

📋 核心要点

接触式操作任务，如擦拭，对机器人来说具有挑战性，因为需要处理物体形变和环境变化，传统方法泛化性不足。
该论文提出了一种结合力矩反馈和预训练对象表征的模仿学习方法，使机器人能够自适应地调整力，应对环境变化。
实验结果表明，该方法在真实擦拭任务中表现出色，力控制精度显著提高，并展现出良好的泛化能力。

📝 摘要（中文）

模仿学习为机器人执行重复性任务提供了途径，使人类能够专注于更具吸引力和意义的活动。然而，挑战来自于对大量演示的需求以及训练环境与真实环境之间的差异。本文着重研究了诸如使用柔软且可变形物体进行擦拭等接触密集型任务，这些任务需要自适应力控制来处理擦拭表面高度和海绵物理特性的变化。为了应对这些挑战，我们提出了一种新颖的方法，该方法集成了实时力矩（FT）反馈与预训练的对象表征。这种方法使机器人能够动态地适应先前未见过的表面高度变化和海绵的物理特性。在真实世界的实验中，我们的方法在施加参考力方面达到了96%的准确率，显著优于之前缺乏FT反馈回路的方法，该方法仅达到了4%的准确率。为了评估我们方法的适应性，我们进行了与训练设置不同的条件下的实验，包括使用10个具有不同物理特性的海绵和4种类型的擦拭表面高度的40个场景，通过分析力轨迹证明了机器人适应性的显著提高。

🔬 方法详解

问题定义：论文旨在解决接触式操作任务中，机器人难以适应环境变化和物体形变的问题，尤其是在擦拭任务中，表面高度和海绵物理特性的变化会导致传统方法性能下降。现有方法通常依赖大量演示数据，且难以泛化到新的环境和物体上。

核心思路：论文的核心思路是利用力矩反馈和预训练的对象表征，使机器人能够实时感知环境变化和物体形变，并自适应地调整施加的力。通过模仿学习，机器人可以学习人类的擦拭策略，并在新的环境中进行泛化。

技术框架：该方法的技术框架主要包括以下几个模块：1）力矩传感器：用于实时测量机器人与环境之间的作用力；2）预训练对象表征：利用预训练模型提取海绵等物体的特征表示；3）模仿学习模型：学习人类的擦拭轨迹和力控制策略；4）力控制模块：根据力矩反馈和对象表征，调整机器人的运动，实现自适应力控制。整个流程是，机器人首先通过力矩传感器感知环境，然后利用预训练模型提取对象特征，接着通过模仿学习模型生成运动指令，最后通过力控制模块调整运动，完成擦拭任务。

关键创新：该论文的关键创新在于将力矩反馈和预训练对象表征相结合，用于自适应的接触式操作。与现有方法相比，该方法不需要大量的演示数据，并且能够更好地泛化到新的环境和物体上。此外，该方法还提出了一种新的力控制策略，能够有效地处理物体形变和环境变化。

关键设计：论文中关键的设计包括：1）力矩传感器的选择和标定；2）预训练模型的选择和微调；3）模仿学习模型的结构和训练方法；4）力控制模块的参数设置和优化。例如，模仿学习模型可能采用循环神经网络（RNN）或Transformer等结构，损失函数可能包括轨迹损失和力损失等。力控制模块可能采用PID控制或阻抗控制等方法。

🖼️ 关键图片

📊 实验亮点

该方法在真实世界的擦拭实验中取得了显著的成果。在施加参考力方面，该方法达到了96%的准确率，而之前缺乏FT反馈回路的方法仅达到了4%的准确率。在不同条件下的实验中，该方法也展现出良好的泛化能力，证明了其在实际应用中的潜力。

🎯 应用场景

该研究成果可应用于各种需要接触式操作的机器人任务，例如清洁、打磨、抛光等。在工业自动化领域，可以提高生产效率和产品质量。在家庭服务机器人领域，可以实现更智能、更灵活的清洁服务。此外，该方法还可以扩展到医疗机器人领域，用于进行精细的手术操作。

📄 摘要（原文）

Imitation learning offers a pathway for robots to perform repetitive tasks, allowing humans to focus on more engaging and meaningful activities. However, challenges arise from the need for extensive demonstrations and the disparity between training and real-world environments. This paper focuses on contact-rich tasks like wiping with soft and deformable objects, requiring adaptive force control to handle variations in wiping surface height and the sponge's physical properties. To address these challenges, we propose a novel method that integrates real-time force-torque (FT) feedback with pre-trained object representations. This approach allows robots to dynamically adjust to previously unseen changes in surface heights and sponges' physical properties. In real-world experiments, our method achieved 96% accuracy in applying reference forces, significantly outperforming the previous method that lacked an FT feedback loop, which only achieved 4% accuracy. To evaluate the adaptability of our approach, we conducted experiments under different conditions from the training setup, involving 40 scenarios using 10 sponges with varying physical properties and 4 types of wiping surface heights, demonstrating significant improvements in the robot's adaptability by analyzing force trajectories. The video of our work is available at: https://sites.google.com/view/adaptive-wiping

Adaptive Wiping: Adaptive contact-rich manipulation through few-shot imitation learning with Force-Torque feedback and pre-trained object representations

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理