Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks
作者: Noah Geiger, Tamim Asfour, Neville Hogan, Johannes Lachner
分类: cs.RO, cs.AI, cs.LG
发布日期: 2025-09-24 (更新: 2025-09-29)
备注: 15 pages, 12 figures
💡 一句话要点
提出基于扩散模型的阻抗学习框架,用于接触式操作任务
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱四:生成式动作 (Generative Motion) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)
关键词: 扩散模型 阻抗学习 接触式操作 机器人控制 物理人工智能
📋 核心要点
- 传统学习方法擅长信息域的运动生成,但缺乏对能量域物理交互的有效建模。
- 论文提出扩散阻抗学习框架,利用扩散模型重建零力轨迹,并结合能量估计器更新阻抗参数。
- 实验表明,该模型在跑酷和插拔任务中表现出色,实现了高精度控制和自主刚度适应。
📝 摘要(中文)
本文提出了一种基于扩散的阻抗学习框架,该框架结合了信息域的运动生成和能量域的物理交互。该框架使用一个基于Transformer的扩散模型,通过交叉注意力机制处理外部力矩,重建模拟零力轨迹(sZFT),从而捕捉平移和旋转的任务空间行为。对于旋转,引入了一种基于SLERP的四元数噪声调度器,以确保几何一致性。重建的sZFT被传递给一个基于能量的估计器,用于更新刚度和阻尼参数。应用方向性规则,降低非任务轴上的阻抗,同时保持任务方向上的刚性。使用Apple Vision Pro进行遥操作,收集了跑酷场景和机器人辅助治疗任务的训练数据。该模型仅使用数万个样本,就实现了亚毫米级的位置精度和亚度级的旋转精度。其紧凑的模型尺寸实现了KUKA LBR iiwa机器人上的实时扭矩控制和自主刚度适应。该控制器在力和速度限制内实现了平滑的跑酷穿越,并且在没有特定于插拔演示的情况下,圆柱形、方形和星形插拔的成功率均为30/30。Transformer扩散模型、机器人控制器和Apple Vision Pro遥操作框架的所有代码均已公开。这些结果标志着物理人工智能的重要一步,将用于物理交互的基于模型的控制与用于轨迹生成的基于学习的方法融合在一起。
🔬 方法详解
问题定义:现有方法在接触式操作任务中,难以同时兼顾运动轨迹的生成和物理交互的控制。传统的阻抗控制需要手动调整参数,缺乏自适应性,而纯粹的运动生成方法又忽略了环境的力反馈。因此,需要一种能够根据任务自适应调整阻抗参数,并能处理复杂接触情况的方法。
核心思路:论文的核心思路是将运动生成和阻抗控制相结合,利用扩散模型学习任务的运动轨迹,并根据轨迹信息估计合适的阻抗参数。通过重建模拟零力轨迹(sZFT),模型能够学习到任务所需的运动模式,并根据外部力矩调整阻抗参数,从而实现自适应的物理交互。
技术框架:该框架主要包含两个阶段:1) 基于Transformer的扩散模型,用于重建模拟零力轨迹(sZFT)。该模型以外部力矩为输入,通过交叉注意力机制学习任务的运动模式。2) 基于能量的估计器,用于根据重建的sZFT更新刚度和阻尼参数。该估计器根据sZFT的能量变化,自适应地调整阻抗参数,以实现最佳的物理交互。
关键创新:该论文的关键创新在于:1) 将扩散模型应用于阻抗学习,实现了运动生成和阻抗控制的有效结合。2) 提出了一种基于SLERP的四元数噪声调度器,确保了旋转运动的几何一致性。3) 提出了一种方向性规则,降低非任务轴上的阻抗,同时保持任务方向上的刚性,从而提高了控制的稳定性和效率。
关键设计:在扩散模型中,使用了Transformer架构,并引入了交叉注意力机制,以便更好地处理外部力矩。对于旋转运动,使用了基于SLERP的四元数噪声调度器,以避免万向锁问题。在能量估计器中,使用了基于能量变化的阻抗参数更新规则。此外,还使用了方向性规则,根据任务方向调整阻抗参数。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该模型仅使用数万个样本,就实现了亚毫米级的位置精度和亚度级的旋转精度。在跑酷任务中,该控制器在力和速度限制内实现了平滑的穿越。在插拔任务中,即使没有特定于插拔演示的数据,圆柱形、方形和星形插拔的成功率也达到了30/30。这些结果表明,该模型具有很强的泛化能力和鲁棒性。
🎯 应用场景
该研究成果可应用于各种需要精确物理交互的机器人任务,例如:机器人辅助手术、康复训练、装配作业、以及在复杂环境中进行操作的机器人。通过自主学习和适应环境变化,机器人能够更安全、更有效地完成任务,提高生产效率和操作精度。未来,该技术有望推动机器人更加智能化和自主化。
📄 摘要(原文)
Learning methods excel at motion generation in the information domain but are not primarily designed for physical interaction in the energy domain. Impedance Control shapes physical interaction but requires task-aware tuning by selecting feasible impedance parameters. We present Diffusion-Based Impedance Learning, a framework that combines both domains. A Transformer-based Diffusion Model with cross-attention to external wrenches reconstructs a simulated Zero-Force Trajectory (sZFT). This captures both translational and rotational task-space behavior. For rotations, we introduce a novel SLERP-based quaternion noise scheduler that ensures geometric consistency. The reconstructed sZFT is then passed to an energy-based estimator that updates stiffness and damping parameters. A directional rule is applied that reduces impedance along non task axes while preserving rigidity along task directions. Training data were collected for a parkour scenario and robotic-assisted therapy tasks using teleoperation with Apple Vision Pro. With only tens of thousands of samples, the model achieved sub-millimeter positional accuracy and sub-degree rotational accuracy. Its compact model size enabled real-time torque control and autonomous stiffness adaptation on a KUKA LBR iiwa robot. The controller achieved smooth parkour traversal within force and velocity limits and 30/30 success rates for cylindrical, square, and star peg insertions without any peg-specific demonstrations in the training data set. All code for the Transformer-based Diffusion Model, the robot controller, and the Apple Vision Pro telemanipulation framework is publicly available. These results mark an important step towards Physical AI, fusing model-based control for physical interaction with learning-based methods for trajectory generation.