ParCo-SDF: Learning Prior-Free Partial-to-Complete Signed Distance Fields of Deformable Objects

📄 arXiv: 2605.29417v2 📥 PDF

作者: Deokmin Hwang, Minseok Song, Daehyung Park

分类: cs.CV

发布日期: 2026-05-28 (更新: 2026-05-29)

备注: Accepted at the 23rd International Conference on Ubiquitous Robots (UR 2026), 6 pages


💡 一句话要点

ParCo-SDF:学习可变形物体无先验的部分到完整SDF重建

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 可变形物体重建 有符号距离场 隐式神经表示 时间编码器 无先验学习

📋 核心要点

  1. 现有可变形物体重建方法依赖于对象特定的形状先验,限制了泛化能力。
  2. ParCo-SDF通过时间几何编码和FiLM条件SDF预测,实现无先验的部分到完整重建。
  3. 实验表明,ParCo-SDF在严重遮挡下实现了鲁棒和高保真的可变形物体重建。

📝 摘要(中文)

本研究旨在解决从点云观测中对可变形物体(DO)进行部分到完整的几何重建问题,以实现精确的DO操作。现有的DO重建方法通常采用隐式神经表示(INR)来建模连续表面并捕获结构可变性。然而,这些方法通常依赖于特定于对象的形状先验,这提高了训练稳定性但也限制了泛化能力。为了解决这个问题,我们引入了ParCo-SDF,这是一个两阶段的部分到完整的有符号距离场(SDF)重建框架,包括时间几何编码和FiLM条件SDF预测。时间编码器捕获DO序列中的结构相似性,从而实现无先验的稳定训练。基于FiLM的条件作用保留了重建的表达能力,同时降低了网络复杂度。我们在橡皮筋操作数据集上评估了所提出的方法,并与最先进的DO表面重建基线进行了比较,证明了在严重遮挡下鲁棒和高保真的重建。

🔬 方法详解

问题定义:论文旨在解决可变形物体在部分观测下的完整几何重建问题。现有方法依赖于物体特定的形状先验,虽然能提高训练稳定性,但限制了模型的泛化能力,无法适应各种形状和拓扑结构的可变形物体。此外,在严重遮挡情况下,重建质量会显著下降。

核心思路:论文的核心思路是利用可变形物体在时间序列上的结构相似性,通过时间编码器学习一个通用的几何表示,从而避免对特定形状先验的依赖。同时,使用FiLM(Feature-wise Linear Modulation)来调节SDF预测网络,以保留重建的表达能力并降低网络复杂度。

技术框架:ParCo-SDF是一个两阶段的框架。第一阶段是时间几何编码,使用一个时间编码器从可变形物体的点云序列中提取几何特征。第二阶段是FiLM条件SDF预测,使用一个SDF预测网络,该网络以第一阶段提取的几何特征作为条件,预测空间中任意点的SDF值。整体流程是从部分点云观测序列到完整SDF的重建。

关键创新:该方法最重要的创新点在于提出了一个无先验的可变形物体重建框架。通过时间编码器学习时间序列上的结构信息,避免了对特定形状先验的依赖,从而提高了模型的泛化能力。此外,使用FiLM调节SDF预测网络,在保证重建质量的同时,降低了网络复杂度。

关键设计:时间编码器可以使用各种序列模型,例如LSTM或Transformer。SDF预测网络可以使用MLP或其他隐式神经表示网络。FiLM层用于将时间编码器提取的特征调制到SDF预测网络的中间层。损失函数通常包括SDF损失(例如L1或L2损失)和Eikonal损失,以保证SDF的性质。具体的网络结构和参数设置需要根据具体的数据集和任务进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,ParCo-SDF在橡皮筋操作数据集上优于最先进的DO表面重建基线。在严重遮挡情况下,ParCo-SDF仍然能够实现鲁棒和高保真的重建,表明了其在实际应用中的潜力。具体的性能数据(例如Chamfer Distance或IoU)需要在论文中查找。

🎯 应用场景

该研究成果可应用于机器人操作、虚拟现实、增强现实等领域。例如,机器人可以利用该方法从部分观测中重建可变形物体的完整形状,从而实现更精确的抓取和操作。在虚拟现实和增强现实中,该方法可以用于创建更逼真的可变形物体模型,提高用户体验。未来,该方法可以扩展到更复杂的场景,例如人体姿态估计和服装建模。

📄 摘要(原文)

This study addresses the partial-to-complete geometry reconstruction of deformable objects (DOs) from point-cloud observations toward precise DO manipulation. Recent DO reconstruction approaches often adopt implicit neural representations (INRs) to model continuous surfaces as well as capture structural variability. However, these methods typically rely on object-specific shape priors that improve training stability and limit generalization. To figure it out, we introduce ParCo-SDF, a two-stage partial-to-complete signed distance field (SDF) reconstruction framework consisting of temporal geometry encoding followed by FiLM-conditioned SDF prediction. The temporal encoder captures structural similarity across DO sequence, enabling prior-free stable training. FiLM-based conditioning preserves reconstruction expressivity while reducing network complexity. We evaluate the proposed method against a state-of-the-art DO surface reconstruction baseline on a rubber band manipulation dataset, demonstrating robust and high-fidelity reconstruction under severe occlusions.