PhysiGen: Integrating Collision-Aware Physical Constraints for High-Fidelity Human-Human Interaction Generation
作者: Nan Lei, Yuan-Ming Li, Ling-An Zeng, Liang Xu, Zhi-Wei Xia, Hui-Wen Huang, Fa-Ting Hong, Wei-Shi Zheng
分类: cs.CV
发布日期: 2026-05-01
备注: 15 pages, 9 figures
💡 一句话要点
PhysiGen:集成碰撞感知物理约束,实现高保真的人人交互生成
🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱五:交互与反应 (Interaction & Reaction) 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)
关键词: 人体运动生成 人机交互 物理约束 碰撞检测 优化算法 三维动画 深度学习
📋 核心要点
- 现有的人人交互生成模型难以避免身体穿透问题,降低了生成结果的真实性和可用性。
- PhysiGen通过简化人体网格为几何图元,并利用碰撞区域指导优化方向,实现了高效的碰撞感知。
- 实验表明,PhysiGen能有效减少身体穿透,显著提升生成结果的视觉连贯性和物理合理性。
📝 摘要(中文)
本文提出PhysiGen,一种通用的、计算高效的优化策略,用于显式地集成碰撞感知的物理约束,以生成逼真的人人交互序列。现有的基于文本驱动的3D人体运动合成方法在生成多人交互序列时面临挑战,尤其是在数据获取和生成结果中普遍存在身体互相穿透的问题,严重影响了真实性和可用性。以往的模型要么忽略这个问题,要么引入计算成本高昂的网格级损失函数来缓解碰撞。PhysiGen通过将高分辨率人体网格简化为几何图元,大大降低了人际碰撞检测的成本,并识别碰撞区域作为优化方向的指导。PhysiGen是即插即用的,可以很容易地集成到现有人人交互生成模型中。大量的跨数据集和跨模型实验表明,与最先进的方法相比,我们的方法可以有效地减少相互穿透,并显著提高视觉连贯性和物理合理性。
🔬 方法详解
问题定义:论文旨在解决文本驱动的3D人体运动合成中,多人交互场景下身体互相穿透的问题。现有方法要么忽略碰撞问题,要么采用计算复杂度高的网格级损失函数,难以在效率和效果之间取得平衡。
核心思路:论文的核心思路是将高精度的3D人体网格简化为低精度的几何图元,从而大幅降低碰撞检测的计算成本。同时,通过识别碰撞区域,并将其作为优化的指导方向,从而有效地避免身体穿透。
技术框架:PhysiGen作为一个即插即用的模块,可以集成到现有的多人交互生成模型中。其主要流程包括:1) 将高分辨率人体网格简化为几何图元;2) 进行人际碰撞检测,识别碰撞区域;3) 根据碰撞区域,计算优化方向;4) 利用优化方向,调整人体姿态,减少身体穿透。
关键创新:PhysiGen的关键创新在于其高效的碰撞检测方法和基于碰撞区域的优化策略。与传统的网格级碰撞检测相比,几何图元简化大大降低了计算复杂度。同时,利用碰撞区域作为优化指导,避免了盲目搜索,提高了优化效率。
关键设计:论文中,人体网格被简化为球体、胶囊体等几何图元。碰撞检测采用快速的几何图元相交测试。优化方向的计算基于碰撞深度和碰撞区域的法向量。损失函数包括碰撞损失、姿态损失等,用于约束优化过程。
🖼️ 关键图片
📊 实验亮点
实验结果表明,PhysiGen能够显著减少人体穿透现象,在多个数据集和模型上都取得了优于现有方法的性能。相较于现有技术,PhysiGen在视觉连贯性和物理合理性方面均有显著提升,为多人交互动画生成提供了更有效的解决方案。
🎯 应用场景
PhysiGen可应用于虚拟现实、游戏开发、电影制作等领域,提升虚拟人物交互的真实感和沉浸感。该方法能够生成更自然、更符合物理规律的多人交互动画,从而增强用户体验,并为相关应用提供更可靠的运动数据。
📄 摘要(原文)
Despite substantial progress in text-driven 3D human motion synthesis, generating realistic multi-person interaction sequences remains challenging. Notably, body inter-penetration is a pervasive issue from both data acquisition to the generated results, which significantly undermines the realism and usability. Previous generative models either ignored this issue or introduced computationally expensive mesh-level loss functions to alleviate inter-body collisions. In this paper, we propose a general-purpose and computationally efficient optimization strategy named PhysiGen to explicitly integrate collision-aware physical constraints for human-human interaction generation. Specifically, we simplify the high-resolution human body mesh into geometric primitives to greatly reduce the cost of inter-person collision detection. Moreover, we identify the collision regions as the guidance of the optimization directions. PhysiGen is plug-and-play and can be readily integrated into existing human interaction generation models. Extensive cross-dataset and cross-model experiments show that our method can effectively reduce interpenetration and significantly improve visual coherence and physical plausibility compared to the state-of-the-art methods.