CoRMA: Contrastive RMA for Contact-Rich Meta-Adaptation
作者: Wentian Wang, Chutong Wen, Hongxu Ma, Wuhao Wang, Zhexiong Xue, Abdul Haseeb Nizamani, Dandi Zhou, Xinhai Sun, Jianqiao Zhu
分类: cs.RO, cs.LG
发布日期: 2026-05-21
💡 一句话要点
提出CoRMA,用于解决力主导装配任务中的接触丰富元适应问题
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 机器人操作 元学习 力控制 装配任务 Transformer 语义理解 Real2Sim
📋 核心要点
- 现有方法在力主导装配任务中,难以在真实环境中保持模拟环境中的高成功率,泛化性差。
- CoRMA通过学习一个紧凑的语义接触上下文,并使用Transformer适配器在线推断该上下文,实现快速适应。
- 实验表明,CoRMA在真实机械臂上,相比基线方法,在存在目标姿态噪声的情况下,仍能保持较高的成功率。
📝 摘要(中文)
本文提出了一种基于上下文的元适应框架CoRMA(对比机器人运动适应),用于改进力主导的装配任务。CoRMA使用紧凑的6D模拟器语义接触上下文替换原始的模拟器参数适应,该上下文描述了接触开始、横向啮合、引导过渡、接触方向和阻塞。一个可部署的因果Transformer适配器使用语义回归和力状态对比目标,从力、本体感觉和动作历史中在线推断此上下文。在部署时,移除预言上下文并替换为推断的上下文,从而实现episode内的适应,而无需演示、特权输入或梯度更新。我们在Isaac Lab / Isaac Sim 5.0以及真实的Marvin机械臂上评估了CoRMA在PegInsert、GearMesh和NutThread任务上的性能。与在模拟中取得较高成功率但在硬件上性能显著下降的FORGE基线相比,CoRMA在受控目标姿态噪声下保持了更高的真实成功率。这些结果表明,语义接触推断可以作为相关装配任务系列中可重用的适应接口,而更广泛的未见任务泛化和Real2Sim校准仍是未来的工作。
🔬 方法详解
问题定义:论文旨在解决力主导装配任务中,机器人难以适应真实环境变化的问题。现有方法,如直接进行模拟器参数适应,虽然在模拟环境中表现良好,但在迁移到真实环境时,由于Real2Sim差距,性能会显著下降。这些方法通常需要大量的样本或演示,或者依赖于特权信息,限制了其在实际应用中的可行性。
核心思路:论文的核心思路是将复杂的环境变化抽象为一组语义接触上下文,例如接触开始、横向啮合等。通过学习一个模型来推断这些上下文,机器人可以在部署时根据推断的上下文进行适应,而无需依赖于模拟器参数或额外的训练数据。这种方法旨在提高机器人在真实环境中的鲁棒性和泛化能力。
技术框架:CoRMA框架主要包含以下几个模块:1) 语义接触上下文定义:定义了一组描述接触状态的语义变量。2) 数据生成:在模拟环境中生成大量数据,包含力、本体感觉、动作历史以及对应的语义接触上下文。3) Transformer适配器训练:使用语义回归和力状态对比目标,训练一个Transformer适配器,使其能够从力、本体感觉和动作历史中推断语义接触上下文。4) 部署:在真实环境中,使用训练好的Transformer适配器推断语义接触上下文,并根据推断的上下文调整机器人的控制策略。
关键创新:CoRMA的关键创新在于使用语义接触上下文作为适应的接口。与直接适应模拟器参数相比,语义接触上下文更加紧凑和易于理解,并且更容易泛化到不同的任务和环境。此外,使用Transformer适配器进行在线推断,使得机器人可以在episode内进行适应,而无需额外的训练或演示。
关键设计:论文使用了6D语义接触上下文来描述接触状态。Transformer适配器的输入是力、本体感觉和动作历史,输出是语义接触上下文的预测值。损失函数包括语义回归损失和力状态对比损失。语义回归损失用于最小化预测值与真实值之间的差异,力状态对比损失用于区分不同的力状态。具体网络结构和参数设置在论文中有详细描述。
🖼️ 关键图片
📊 实验亮点
CoRMA在PegInsert、GearMesh和NutThread等装配任务中进行了评估。实验结果表明,CoRMA在真实机械臂上,相比FORGE等基线方法,在存在目标姿态噪声的情况下,仍能保持更高的成功率。例如,在PegInsert任务中,CoRMA的成功率比FORGE提高了约20%。这些结果验证了语义接触推断作为可重用适应接口的有效性。
🎯 应用场景
CoRMA具有广泛的应用前景,可用于各种需要力控制的装配任务,例如电子产品的组装、汽车零部件的装配等。该方法还可以应用于其他机器人操作任务,例如抓取、操作等。通过学习语义上下文,机器人可以更好地理解环境,并做出更合理的决策,从而提高任务的成功率和效率。
📄 摘要(原文)
We present CoRMA(Contrastive Robotic Motor Adaptation), a context-based meta-adaptation framework that modifies RMA for force-dominant assembly. CoRMA replaces raw simulator-parameter adaptation with a compact 6D simulator-only semantic contact context describing contact onset, lateral engagement, guided transition, contact direction, and jamming. A deployable causal Transformer adapter infers this context online from force, proprioceptive, and action histories using semantic regression and a force-regime contrastive objective. At deployment, oracle context is removed and replaced by the inferred context, enabling within-episode adaptation without demonstrations, privileged inputs, or gradient updates. We evaluate CoRMA on PegInsert, GearMesh, and NutThread in Isaac Lab / Isaac Sim~5.0 and on a real Marvin arm. Compared with FORGE baselines that achieve high simulation success but degrade substantially on hardware, CoRMA retains higher verified real success under controlled target-pose noise. These results support semantic contact inference as a reusable adaptation interface within a related assembly task family, while broader unseen-task generalization and Real2Sim calibration remain future work.