An Object-Centered Data Acquisition Method for 3D Gaussian Splatting using Mobile Phones

📄 arXiv: 2604.19216v1 📥 PDF

作者: Yuezhe Zhang, Luqian Bai, Mengting Yu, Lei Wei, Shuai Wan, Yifan Zhang

分类: cs.CV

发布日期: 2026-04-21


💡 一句话要点

提出一种基于手机的物体中心3D高斯溅射数据采集方法

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 3D高斯溅射 移动端采集 物体中心重建 视点覆盖 实时指导

📋 核心要点

  1. 现有3D高斯溅射方法在手机端数据采集方面存在挑战,尤其是在物体中心场景下,缺乏有效的采集指导。
  2. 该方法通过设备端实时指导和记录传感器数据,校准设备姿态,并利用球面网格进行均匀视点索引,从而实现可靠的移动采集。
  3. 实验表明,该方法相比自由捕获和RealityScan,能够使用更少的图像获得更高的重建质量,并实现更全面均匀的视点覆盖。

📝 摘要(中文)

本文针对3D高斯溅射(3DGS)中利用手机进行数据采集的挑战,专注于物体中心场景,通过提供设备端捕获指导和记录板载传感器信号以进行离线重建,实现了可靠的移动采集。在校准步骤之后,设备方向与基准坐标系对齐以获得相对姿态,并且相机的光轴被映射到以对象为中心的球形网格以进行均匀的视点索引。为了抑制极坐标采样偏差,我们实时计算面积加权的球面覆盖率,并相应地指导用户的运动。我们将所提出的方法与RealityScan和自由捕获策略进行了比较。我们的方法使用比自由捕获和RealityScan更少的输入图像实现了卓越的重建质量。进一步的分析表明,所提出的方法能够在以对象为中心的采集中获得更全面和均匀的视点覆盖。

🔬 方法详解

问题定义:现有3D高斯溅射方法在使用手机进行物体中心数据采集时,面临着视点分布不均匀、重建质量不高的问题。用户难以确定最佳的拍摄位置和角度,导致数据冗余或缺失,最终影响重建效果。RealityScan等现有方案也无法很好地解决这个问题。

核心思路:该论文的核心思路是提供实时的采集指导,引导用户围绕物体进行均匀的视点覆盖。通过将相机光轴映射到以物体为中心的球形网格,并实时计算面积加权的球面覆盖率,可以有效地避免极坐标采样偏差,确保采集到的数据具有更好的分布性。

技术框架:该方法主要包含以下几个阶段:1) 设备校准:将设备方向与基准坐标系对齐,获得相对姿态。2) 视点索引:将相机光轴映射到以对象为中心的球形网格。3) 实时指导:计算面积加权的球面覆盖率,并根据覆盖率指导用户的运动。4) 离线重建:利用采集到的图像和传感器数据进行3D高斯溅射重建。

关键创新:该方法最重要的创新点在于提出了基于面积加权球面覆盖率的实时采集指导策略。与传统的自由捕获或预定义路径的方式不同,该方法能够根据已采集数据的分布情况,动态地引导用户进行下一步的拍摄,从而实现更均匀和全面的视点覆盖。

关键设计:关键设计包括:1) 球形网格的划分方式,需要平衡网格密度和计算复杂度。2) 面积加权球面覆盖率的计算方法,需要考虑不同网格区域的大小和重要性。3) 实时指导策略,需要将覆盖率信息转化为用户易于理解的运动指令。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法使用比自由捕获和RealityScan更少的输入图像,实现了更高的重建质量。与RealityScan相比,在相同图像数量下,重建质量有显著提升。进一步分析表明,该方法能够获得更全面和均匀的视点覆盖。

🎯 应用场景

该研究成果可应用于电商展示、文化遗产数字化、游戏资产制作等领域。用户可以使用手机快速、高质量地重建物体三维模型,无需专业设备和复杂操作。该方法有望降低3D建模的门槛,促进三维内容的普及。

📄 摘要(原文)

Data acquisition through mobile phones remains a challenge for 3D Gaussian Splatting (3DGS). In this work we target the object-centered scenario and enable reliable mobile acquisition by providing on-device capture guidance and recording onboard sensor signals for offline reconstruction. After the calibration step, the device orientations are aligned to a baseline frame to obtain relative poses, and the optical axis of the camera is mapped to an object-centered spherical grid for uniform viewpoint indexing. To curb polar sampling bias, we compute area-weighted spherical coverage in real-time and guide the user's motion accordingly. We compare the proposed method with RealityScan and the free-capture strategy. Our method achieves superior reconstruction quality using fewer input images compared to free capture and RealityScan. Further analysis shows that the proposed method is able to obtain more comprehensive and uniform viewpoint coverage during object-centered acquisition.