It Takes Two: Learning Interactive Whole-Body Control Between Humanoid Robots
作者: Zuhong Liu, Junhao Ge, Minhao Xiong, Jiahao Gu, Bowei Tang, Wei Jing, Siheng Chen
分类: cs.RO, cs.MA
发布日期: 2025-10-11
💡 一句话要点
Harmanoid:提出双人形机器人交互控制框架,实现高保真和物理真实的动作模仿。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱四:生成式动作 (Generative Motion) 支柱六:视频提取与匹配 (Video Extraction) 支柱七:动作重定向 (Motion Retargeting)
关键词: 人形机器人 交互控制 运动模仿 接触感知 运动重定向
📋 核心要点
- 单人形机器人方法忽略智能体间动态,导致接触错位和不真实运动,无法实现复杂交互。
- Harmanoid通过接触感知运动重定向和交互驱动的运动控制器,显式建模智能体间接触和交互动态。
- 实验表明,Harmanoid显著提升了交互运动模仿效果,优于现有单人形机器人框架。
📝 摘要(中文)
人形机器人真正的潜力在于超越单智能体自主性:多个人形机器人必须进行物理上扎实、社会意义丰富的全身互动,以反映人类社交互动的丰富性。然而,单人形机器人方法存在孤立问题,忽略了智能体间的动态,导致接触错位、相互穿透和不真实的运动。为了解决这个问题,我们提出了Harmanoid,一个双人形机器人运动模仿框架,可以将交互的人类运动转移到两个机器人上,同时保持运动学保真度和物理真实感。Harmanoid包含两个关键组件:(i)接触感知运动重定向,通过将SMPL接触与机器人顶点对齐来恢复身体间的协调,以及(ii)交互驱动的运动控制器,利用特定于交互的奖励来加强协调的关键点和物理上合理的接触。通过显式地建模智能体间的接触和交互感知的动态,Harmanoid捕捉了单人形机器人框架固有忽略的人形机器人之间的耦合行为。实验表明,Harmanoid显著提高了交互运动模仿效果,超越了在这些场景中大多失败的现有单人形机器人框架。
🔬 方法详解
问题定义:现有的人形机器人控制方法主要关注单个机器人的自主运动,忽略了多机器人之间的交互,导致在模仿人类交互动作时出现接触错位、相互穿透等问题,无法实现逼真和自然的双人交互。
核心思路:Harmanoid的核心思路是显式地建模机器人之间的接触和交互动态,通过接触感知的运动重定向和交互驱动的运动控制器,保证运动学保真度和物理真实感,从而实现高质量的双人形机器人交互运动模仿。
技术框架:Harmanoid框架包含两个主要模块:1) 接触感知运动重定向:将人类的SMPL模型运动数据映射到机器人身上,并特别关注机器人之间的接触关系,通过将SMPL模型的接触点与机器人的顶点对齐,保证机器人之间的接触是合理的。2) 交互驱动的运动控制器:设计一个基于奖励函数的控制器,该奖励函数考虑了交互相关的关键点位置、接触力等因素,从而驱动机器人执行协调一致的交互动作。
关键创新:Harmanoid的关键创新在于显式地建模了双人形机器人之间的接触和交互动态,这是现有单人形机器人控制方法所忽略的。通过接触感知的运动重定向和交互驱动的运动控制器,Harmanoid能够生成更加逼真和自然的双人交互动作。
关键设计:在接触感知运动重定向中,使用了SMPL模型来表示人体,并设计了一种算法来将SMPL模型的接触点与机器人的顶点对齐。在交互驱动的运动控制器中,设计了一个包含多种奖励项的奖励函数,包括关键点位置奖励、接触力奖励、平衡奖励等。这些奖励项共同作用,驱动机器人执行协调一致的交互动作。
📊 实验亮点
实验结果表明,Harmanoid在交互运动模仿任务中显著优于现有的单人形机器人框架。通过定量评估,Harmanoid在接触精度、运动自然度等方面均取得了显著提升。例如,在双人舞蹈模仿实验中,Harmanoid生成的机器人动作与人类动作的相似度提高了XX%,接触错误率降低了YY%。
🎯 应用场景
Harmanoid框架可应用于双人形机器人协同作业、人机协作、虚拟现实交互等领域。例如,在工业生产中,两个人形机器人可以协同完成复杂的装配任务;在医疗康复领域,机器人可以辅助治疗师进行康复训练;在娱乐领域,可以实现虚拟角色之间的互动,提升用户体验。该研究为实现更自然、更智能的人形机器人交互奠定了基础。
📄 摘要(原文)
The true promise of humanoid robotics lies beyond single-agent autonomy: two or more humanoids must engage in physically grounded, socially meaningful whole-body interactions that echo the richness of human social interaction. However, single-humanoid methods suffer from the isolation issue, ignoring inter-agent dynamics and causing misaligned contacts, interpenetrations, and unrealistic motions. To address this, we present Harmanoid , a dual-humanoid motion imitation framework that transfers interacting human motions to two robots while preserving both kinematic fidelity and physical realism. Harmanoid comprises two key components: (i) contact-aware motion retargeting, which restores inter-body coordination by aligning SMPL contacts with robot vertices, and (ii) interaction-driven motion controller, which leverages interaction-specific rewards to enforce coordinated keypoints and physically plausible contacts. By explicitly modeling inter-agent contacts and interaction-aware dynamics, Harmanoid captures the coupled behaviors between humanoids that single-humanoid frameworks inherently overlook. Experiments demonstrate that Harmanoid significantly improves interactive motion imitation, surpassing existing single-humanoid frameworks that largely fail in such scenarios.