CoRMA: Contrastive RMA for Contact-Rich Meta-Adaptation

作者: Wentian Wang, Chutong Wen, Hongxu Ma, Wuhao Wang, Zhexiong Xue, Abdul Haseeb Nizamani, Dandi Zhou, Xinhai Sun, Jianqiao Zhu

分类: cs.RO, cs.LG

发布日期: 2026-05-21

💡 一句话要点

提出CoRMA，用于解决力主导装配任务中的接触丰富元适应问题

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 机器人操作 元学习 力控制 装配任务 Transformer 语义理解 Real2Sim

📋 核心要点

现有方法在力主导装配任务中，难以在真实环境中保持模拟环境中的高成功率，泛化性差。
CoRMA通过学习一个紧凑的语义接触上下文，并使用Transformer适配器在线推断该上下文，实现快速适应。
实验表明，CoRMA在真实机械臂上，相比基线方法，在存在目标姿态噪声的情况下，仍能保持较高的成功率。

📝 摘要（中文）

本文提出了一种基于上下文的元适应框架CoRMA(对比机器人运动适应)，用于改进力主导的装配任务。CoRMA使用紧凑的6D模拟器语义接触上下文替换原始的模拟器参数适应，该上下文描述了接触开始、横向啮合、引导过渡、接触方向和阻塞。一个可部署的因果Transformer适配器使用语义回归和力状态对比目标，从力、本体感觉和动作历史中在线推断此上下文。在部署时，移除预言上下文并替换为推断的上下文，从而实现episode内的适应，而无需演示、特权输入或梯度更新。我们在Isaac Lab / Isaac Sim 5.0以及真实的Marvin机械臂上评估了CoRMA在PegInsert、GearMesh和NutThread任务上的性能。与在模拟中取得较高成功率但在硬件上性能显著下降的FORGE基线相比，CoRMA在受控目标姿态噪声下保持了更高的真实成功率。这些结果表明，语义接触推断可以作为相关装配任务系列中可重用的适应接口，而更广泛的未见任务泛化和Real2Sim校准仍是未来的工作。

🔬 方法详解

问题定义：论文旨在解决力主导装配任务中，机器人难以适应真实环境变化的问题。现有方法，如直接进行模拟器参数适应，虽然在模拟环境中表现良好，但在迁移到真实环境时，由于Real2Sim差距，性能会显著下降。这些方法通常需要大量的样本或演示，或者依赖于特权信息，限制了其在实际应用中的可行性。

核心思路：论文的核心思路是将复杂的环境变化抽象为一组语义接触上下文，例如接触开始、横向啮合等。通过学习一个模型来推断这些上下文，机器人可以在部署时根据推断的上下文进行适应，而无需依赖于模拟器参数或额外的训练数据。这种方法旨在提高机器人在真实环境中的鲁棒性和泛化能力。

技术框架：CoRMA框架主要包含以下几个模块：1) 语义接触上下文定义：定义了一组描述接触状态的语义变量。2) 数据生成：在模拟环境中生成大量数据，包含力、本体感觉、动作历史以及对应的语义接触上下文。3) Transformer适配器训练：使用语义回归和力状态对比目标，训练一个Transformer适配器，使其能够从力、本体感觉和动作历史中推断语义接触上下文。4) 部署：在真实环境中，使用训练好的Transformer适配器推断语义接触上下文，并根据推断的上下文调整机器人的控制策略。

关键创新：CoRMA的关键创新在于使用语义接触上下文作为适应的接口。与直接适应模拟器参数相比，语义接触上下文更加紧凑和易于理解，并且更容易泛化到不同的任务和环境。此外，使用Transformer适配器进行在线推断，使得机器人可以在episode内进行适应，而无需额外的训练或演示。

关键设计：论文使用了6D语义接触上下文来描述接触状态。Transformer适配器的输入是力、本体感觉和动作历史，输出是语义接触上下文的预测值。损失函数包括语义回归损失和力状态对比损失。语义回归损失用于最小化预测值与真实值之间的差异，力状态对比损失用于区分不同的力状态。具体网络结构和参数设置在论文中有详细描述。

🖼️ 关键图片

📊 实验亮点

CoRMA在PegInsert、GearMesh和NutThread等装配任务中进行了评估。实验结果表明，CoRMA在真实机械臂上，相比FORGE等基线方法，在存在目标姿态噪声的情况下，仍能保持更高的成功率。例如，在PegInsert任务中，CoRMA的成功率比FORGE提高了约20%。这些结果验证了语义接触推断作为可重用适应接口的有效性。

🎯 应用场景

CoRMA具有广泛的应用前景，可用于各种需要力控制的装配任务，例如电子产品的组装、汽车零部件的装配等。该方法还可以应用于其他机器人操作任务，例如抓取、操作等。通过学习语义上下文，机器人可以更好地理解环境，并做出更合理的决策，从而提高任务的成功率和效率。

📄 摘要（原文）

We present CoRMA(Contrastive Robotic Motor Adaptation), a context-based meta-adaptation framework that modifies RMA for force-dominant assembly. CoRMA replaces raw simulator-parameter adaptation with a compact 6D simulator-only semantic contact context describing contact onset, lateral engagement, guided transition, contact direction, and jamming. A deployable causal Transformer adapter infers this context online from force, proprioceptive, and action histories using semantic regression and a force-regime contrastive objective. At deployment, oracle context is removed and replaced by the inferred context, enabling within-episode adaptation without demonstrations, privileged inputs, or gradient updates. We evaluate CoRMA on PegInsert, GearMesh, and NutThread in Isaac Lab / Isaac Sim~5.0 and on a real Marvin arm. Compared with FORGE baselines that achieve high simulation success but degrade substantially on hardware, CoRMA retains higher verified real success under controlled target-pose noise. These results support semantic contact inference as a reusable adaptation interface within a related assembly task family, while broader unseen-task generalization and Real2Sim calibration remain future work.

CoRMA: Contrastive RMA for Contact-Rich Meta-Adaptation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理