Cross-Instance Gaussian Splatting Registration via Geometry-Aware Feature-Guided Alignment
作者: Roy Amoyal, Oren Freifeld, Chaim Baskin
分类: cs.CV
发布日期: 2026-03-23
备注: Accepted to CVPR 2026
🔗 代码/项目: PROJECT_PAGE
💡 一句话要点
提出GSA,通过几何感知特征引导对齐实现跨实例3D高斯溅射配准
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 3D高斯溅射 点云配准 跨实例配准 特征匹配 几何感知 球面地图 绝对方向估计
📋 核心要点
- 现有3DGS配准方法通常只能处理同一物体的模型,且依赖真实尺度信息,限制了其应用范围。
- GSA利用视点引导的球面地图特征建立鲁棒对应关系,并通过两步优化框架实现跨实例的3DGS模型对齐。
- 实验表明,GSA在同对象配准任务中超越现有方法,并在跨对象配准任务中表现出显著优势,为该领域提供了有效解决方案。
📝 摘要(中文)
本文提出了一种名为高斯溅射对齐(GSA)的新方法,用于通过相似变换(旋转、平移和缩放)对齐两个独立的3D高斯溅射(3DGS)模型,即使它们是同一类别中的不同对象(例如,不同的汽车)。与现有方法只能对齐同一对象的3DGS模型(例如,同一辆汽车)并且通常必须给定真实比例作为输入不同,GSA可以成功估计比例。GSA利用视点引导的球面地图特征来获得鲁棒的对应关系,并引入了一个两步优化框架,该框架在保持3DGS模型固定的同时对齐它们。首先,我们应用迭代的特征引导的绝对方向求解器作为粗配准,该求解器对较差的初始化(例如,180度未对准或10倍的比例差距)具有鲁棒性。接下来,我们使用精细配准步骤,该步骤强制执行多视图特征一致性,灵感来自逆辐射场公式。第一步已经实现了最先进的性能,第二步进一步提高了结果。在同一对象的情况下,GSA优于先前的工作,通常幅度很大,即使其他方法给出了真实的比例。在同一类别中不同对象的更困难的情况下,GSA大大超过了它们,为类别级别的3DGS配准提供了第一个有效的解决方案,并开启了新的应用。
🔬 方法详解
问题定义:现有3D高斯溅射(3DGS)配准方法主要针对同一物体的不同扫描结果,需要提供真实的尺度信息,无法处理同一类别不同实例的配准问题。这限制了3DGS在更广泛场景下的应用,例如类别级别的三维重建和场景理解。
核心思路:GSA的核心思路是利用几何感知的特征引导对齐,通过视点引导的球面地图特征建立不同3DGS模型之间的对应关系,并设计一个两步优化框架,在保持3DGS模型不变的情况下,估计一个相似变换,从而实现模型的对齐。这种方法避免了直接修改3DGS参数,简化了优化过程。
技术框架:GSA包含两个主要阶段:粗配准和精配准。 1. 粗配准:使用迭代的特征引导的绝对方向求解器,基于球面地图特征建立对应关系,估计一个初始的相似变换。该阶段对初始化误差具有较强的鲁棒性。 2. 精配准:利用多视图特征一致性,借鉴逆辐射场的思想,进一步优化相似变换,提高配准精度。
关键创新:GSA的关键创新在于: 1. 提出了一种基于视点引导的球面地图特征的对应关系建立方法,能够处理不同实例之间的配准问题。 2. 设计了一个两步优化框架,将配准问题分解为粗配准和精配准两个阶段,提高了配准的鲁棒性和精度。 3. 无需提供真实尺度信息,能够自动估计尺度变换。
关键设计: 1. 球面地图特征:通过渲染每个3DGS模型在不同视点下的图像,并提取图像特征,构建球面地图。这些特征用于建立对应关系。 2. 特征匹配:使用互最近邻(Mutual Nearest Neighbor)方法进行特征匹配,并使用RANSAC算法去除外点。 3. 损失函数:精配准阶段的损失函数基于多视图特征一致性,鼓励对齐后的模型在不同视点下具有相似的特征。
🖼️ 关键图片
📊 实验亮点
GSA在同对象配准任务中,即使在其他方法已知真实尺度的情况下,也超越了现有方法。在更具挑战性的跨对象配准任务中,GSA显著优于现有方法,实现了同类别不同实例的3DGS模型配准,为该领域提供了首个有效解决方案。项目主页提供了详细的实验结果和可视化展示。
🎯 应用场景
GSA在机器人导航、自动驾驶、三维场景理解等领域具有广泛的应用前景。例如,可以用于将不同视角的3D扫描结果对齐,构建完整的场景模型;也可以用于识别和定位同一类别中的不同物体,为机器人提供更丰富的环境信息。此外,GSA还可以应用于虚拟现实和增强现实等领域,提高用户体验。
📄 摘要(原文)
We present Gaussian Splatting Alignment (GSA), a novel method for aligning two independent 3D Gaussian Splatting (3DGS) models via a similarity transformation (rotation, translation, and scale), even when they are of different objects in the same category (e.g., different cars). In contrast, existing methods can only align 3DGS models of the same object (e.g., the same car) and often must be given true scale as input, while we estimate it successfully. GSA leverages viewpoint-guided spherical map features to obtain robust correspondences and introduces a two-step optimization framework that aligns 3DGS models while keeping them fixed. First, we apply an iterative feature-guided absolute orientation solver as our coarse registration, which is robust to poor initialization (e.g., 180 degrees misalignment or a 10x scale gap). Next, we use a fine registration step that enforces multi-view feature consistency, inspired by inverse radiance-field formulations. The first step already achieves state-of-the-art performance, and the second further improves results. In the same-object case, GSA outperforms prior works, often by a large margin, even when the other methods are given the true scale. In the harder case of different objects in the same category, GSA vastly surpasses them, providing the first effective solution for category-level 3DGS registration and unlocking new applications. Project webpage: https://bgu-cs-vil.github.io/GSA-project/