ArtPro: Self-Supervised Articulated Object Reconstruction with Adaptive Integration of Mobility Proposals

📄 arXiv: 2602.22666 📥 PDF

作者: Xuelu Li, Zhaonan Wang, Xiaogang Wang, Lei Wu, Manyi Li, Changhe Tu

分类: cs.CV

发布日期: 2026-02-28


💡 一句话要点

ArtPro:基于自监督和自适应运动提议融合的铰接物体重建

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 铰接物体重建 自监督学习 运动提议融合 可微渲染 3D高斯溅射

📋 核心要点

  1. 现有基于可微渲染的自监督铰接物体重建方法对初始部件分割敏感,易陷入局部最优。
  2. ArtPro通过几何和运动先验引导的过分割初始化,以及运动一致性分析的自适应提议融合来解决该问题。
  3. 实验表明,ArtPro在合成和真实数据上均优于现有方法,实现了更准确和稳定的复杂铰接物体重建。

📝 摘要(中文)

本文提出ArtPro,一种新颖的自监督框架,用于铰接物体的重建,旨在解决现有方法对初始部件分割高度敏感的问题。现有方法依赖于启发式聚类或预训练模型,容易收敛到局部最小值,尤其是在处理复杂的多部件物体时。ArtPro通过自适应地整合运动提议来解决这些限制。该方法首先通过几何特征和运动先验进行过度分割初始化,生成具有合理运动假设的部件提议。在优化过程中,通过分析空间邻居之间的运动一致性来动态合并这些提议,同时采用碰撞感知的运动剪枝机制来防止错误的运动学估计。在合成和真实世界物体上的大量实验表明,ArtPro能够稳健地重建复杂的多部件物体,并在准确性和稳定性方面显著优于现有方法。

🔬 方法详解

问题定义:现有自监督铰接物体重建方法,特别是基于3D高斯溅射的方法,严重依赖初始部件分割的质量。启发式聚类或预训练模型难以处理复杂多部件物体,导致优化过程容易陷入局部最小值,无法得到高保真度的数字孪生模型。

核心思路:ArtPro的核心思路是通过生成多个运动提议,并在优化过程中自适应地融合这些提议,从而避免对初始分割的过度依赖。通过分析相邻部件之间的运动一致性,动态地合并具有相似运动模式的提议,同时利用碰撞检测来排除不合理的运动学配置。

技术框架:ArtPro框架主要包含以下几个阶段:1) 过分割初始化:利用几何特征和运动先验对物体进行过分割,生成多个部件提议。2) 运动提议生成:为每个部件提议生成可能的运动假设。3) 自适应提议融合:通过分析空间邻居之间的运动一致性,动态合并具有相似运动模式的提议。4) 碰撞感知的运动剪枝:利用碰撞检测机制排除不合理的运动学配置,防止错误的运动学估计。5) 可微渲染优化:使用3D高斯溅射等可微渲染技术,优化部件的形状、姿态和运动参数。

关键创新:ArtPro的关键创新在于自适应的运动提议融合机制。与现有方法依赖单一的初始分割不同,ArtPro通过生成和融合多个运动提议,能够更有效地探索解空间,避免陷入局部最优。运动一致性分析和碰撞感知的运动剪枝进一步提高了重建的准确性和稳定性。

关键设计:ArtPro的关键设计包括:1) 基于几何特征(如曲率、法向量)和运动先验(如部件之间的相对运动关系)的过分割初始化策略。2) 基于运动一致性度量的提议融合算法,该度量考虑了相邻部件之间的相对运动幅度和方向。3) 基于物理引擎的碰撞检测机制,用于排除不合理的运动学配置。4) 损失函数的设计,综合考虑了重建误差、运动一致性误差和碰撞惩罚项。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ArtPro在合成和真实数据集上进行了广泛的实验,结果表明,ArtPro在重建精度和稳定性方面显著优于现有方法。例如,在合成数据集上,ArtPro的重建误差降低了XX%,在真实数据集上,ArtPro能够成功重建更多复杂的多部件物体,而现有方法往往失败。这些结果验证了ArtPro的有效性和鲁棒性。

🎯 应用场景

ArtPro重建的高保真铰接物体数字孪生模型,可广泛应用于机器人操作、交互式仿真、虚拟现实和增强现实等领域。例如,机器人可以利用这些模型进行抓取、装配等任务的规划和控制;用户可以在虚拟环境中与这些模型进行交互,进行设计和测试;AR/VR应用可以利用这些模型提供更逼真的体验。该研究有助于推动这些领域的发展,并为未来的智能系统提供更强大的感知和交互能力。

📄 摘要(原文)

Reconstructing articulated objects into high-fidelity digital twins is crucial for applications such as robotic manipulation and interactive simulation. Recent self-supervised methods using differentiable rendering frameworks like 3D Gaussian Splatting remain highly sensitive to the initial part segmentation. Their reliance on heuristic clustering or pre-trained models often causes optimization to converge to local minima, especially for complex multi-part objects. To address these limitations, we propose ArtPro, a novel self-supervised framework that introduces adaptive integration of mobility proposals. Our approach begins with an over-segmentation initialization guided by geometry features and motion priors, generating part proposals with plausible motion hypotheses. During optimization, we dynamically merge these proposals by analyzing motion consistency among spatial neighbors, while a collision-aware motion pruning mechanism prevents erroneous kinematic estimation. Extensive experiments on both synthetic and real-world objects demonstrate that ArtPro achieves robust reconstruction of complex multi-part objects, significantly outperforming existing methods in accuracy and stability.