Learning Contact Dynamics for Control with Action-conditioned Face Interaction Graph Networks

📄 arXiv: 2509.12151v1 📥 PDF

作者: Zongyao Yi, Joachim Hertzberg, Martin Atzmueller

分类: cs.RO, cs.LG

发布日期: 2025-09-15


💡 一句话要点

提出基于动作条件面交互图网络的接触动力学学习模型,用于机器人操作控制。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: 接触动力学 图神经网络 机器人控制 物理模拟 动作条件

📋 核心要点

  1. 现有物理模拟器在处理机器人富接触操作时,难以准确预测运动和力矩,限制了控制器的性能。
  2. 本文提出一种基于动作条件面交互图网络的物理模拟器,通过学习节点和边之间的交互来预测运动和力矩。
  3. 实验表明,该模型在仿真和真实环境中均优于基线方法,尤其在力矩预测精度上有显著提升。

📝 摘要(中文)

本文提出了一种可学习的物理模拟器,能够对机器人末端执行器在富接触操作中的运动和力矩进行精确预测。该模型扩展了最先进的基于图神经网络的模拟器(FIGNet),通过引入新的节点和边类型,实现了动作条件预测,从而支持控制和状态估计任务。在仿真实验中,使用本文模型的MPC智能体在具有挑战性的孔轴配合任务中,性能与使用真实动力学模型的控制器相当。在真实世界实验中,本文模型在运动预测精度上比基线物理模拟器提高了50%,力矩预测精度提高了3倍。源代码和数据已公开。

🔬 方法详解

问题定义:论文旨在解决机器人富接触操作中,现有物理模拟器难以准确预测末端执行器的运动和力矩的问题。传统方法通常依赖于手工设计的物理模型,难以适应复杂和动态的接触情况,导致控制性能下降。

核心思路:论文的核心思路是利用图神经网络(GNN)学习接触动力学,将机器人末端执行器的表面离散为节点,节点之间的交互关系建模为边,通过学习节点和边之间的信息传递来预测运动和力矩。引入动作条件,使模型能够根据不同的动作预测不同的动力学行为。

技术框架:整体框架基于FIGNet,主要包含以下模块:1) 节点特征提取:提取每个面(节点)的几何特征和状态信息;2) 边特征提取:提取相邻面之间的相对位置和姿态信息;3) 消息传递:利用GNN进行多轮消息传递,更新节点和边的表示;4) 预测:基于更新后的节点表示,预测末端执行器的运动和力矩。关键在于扩展了FIGNet的节点和边类型,以适应动作条件预测。

关键创新:最重要的技术创新在于引入了动作条件的面交互图网络。通过将动作信息融入到节点和边的特征中,模型能够学习到动作与接触动力学之间的关系,从而实现更准确的预测。与传统FIGNet相比,该模型能够根据不同的动作预测不同的动力学行为,提高了模型的泛化能力。

关键设计:论文的关键设计包括:1) 节点和边类型的扩展:引入了新的节点和边类型,用于表示动作信息;2) 损失函数的设计:采用了运动和力矩预测的联合损失函数,以提高模型的预测精度;3) 网络结构的优化:对GNN的结构进行了优化,以提高模型的学习能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在仿真环境中,使用该模型的MPC智能体在孔轴配合任务中,性能与使用真实动力学模型的控制器相当。在真实世界实验中,该模型在运动预测精度上比基线物理模拟器提高了50%,力矩预测精度提高了3倍,证明了该模型在实际应用中的有效性。

🎯 应用场景

该研究成果可应用于机器人自动化装配、精密操作、人机协作等领域。通过精确预测接触动力学,可以提高机器人的操作精度和稳定性,降低操作风险,并为机器人自主学习和规划提供更可靠的基础。未来可进一步扩展到更复杂的环境和任务中,例如柔性物体的操作和多机器人协同操作。

📄 摘要(原文)

We present a learnable physics simulator that provides accurate motion and force-torque prediction of robot end effectors in contact-rich manipulation. The proposed model extends the state-of-the-art GNN-based simulator (FIGNet) with novel node and edge types, enabling action-conditional predictions for control and state estimation tasks. In simulation, the MPC agent using our model matches the performance of the same controller with the ground truth dynamics model in a challenging peg-in-hole task, while in the real-world experiment, our model achieves a 50% improvement in motion prediction accuracy and 3$\times$ increase in force-torque prediction precision over the baseline physics simulator. Source code and data are publicly available.