NVSim: Novel View Synthesis Simulator for Large Scale Indoor Navigation

📄 arXiv: 2510.24335v1 📥 PDF

作者: Mingyu Jeong, Eunsung Kim, Sehun Park, Andrew Jaeyong Choi

分类: cs.RO, cs.CV

发布日期: 2025-10-28

备注: 9 pages, 10 figures


💡 一句话要点

NVSim:提出基于图像序列的大规模室内导航新视角合成模拟器

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 新视角合成 室内导航 3D高斯溅射 机器人模拟 可通行性分析

📋 核心要点

  1. 传统3D扫描构建室内导航模拟器成本高昂且难以扩展,限制了大规模机器人导航研究。
  2. NVSim通过改进3D高斯溅射,并引入Floor-Aware Gaussian Splatting,从图像序列构建可导航的室内环境。
  3. 该系统能够从真实世界数据生成大规模导航图,为机器人导航研究提供有效的模拟环境。

📝 摘要(中文)

本文提出NVSim,一个能够仅从普通图像序列自动构建大规模、可导航室内模拟器的框架,克服了传统3D扫描的成本和可扩展性限制。我们的方法改进了3D高斯溅射,以解决机器人遍历数据中常见的稀疏观测地面上的视觉伪影问题。我们引入了Floor-Aware Gaussian Splatting,以确保干净、可导航的地面,以及一种新颖的无网格可通行性检查算法,该算法通过直接分析渲染视图来构建拓扑图。我们展示了我们的系统从真实世界数据生成有效的大规模导航图的能力。

🔬 方法详解

问题定义:现有方法依赖于昂贵的3D扫描设备和人工标注,难以构建大规模室内导航模拟器。机器人遍历数据通常存在稀疏观测地面上的视觉伪影,影响导航的准确性。因此,需要一种能够从普通图像序列自动构建大规模、可导航室内模拟器的方案。

核心思路:NVSim的核心思路是利用3D高斯溅射技术,从图像序列中重建室内场景,并通过Floor-Aware Gaussian Splatting来优化地面表示,确保地面的干净和可导航性。此外,采用无网格可通行性检查算法,直接从渲染视图中分析可通行区域,构建拓扑导航图。

技术框架:NVSim的整体框架包括以下几个主要阶段:1) 从图像序列中重建3D高斯溅射场景;2) 利用Floor-Aware Gaussian Splatting优化地面表示;3) 通过无网格可通行性检查算法分析渲染视图,构建拓扑导航图。

关键创新:NVSim的关键创新在于:1) 提出了Floor-Aware Gaussian Splatting,能够有效去除地面上的视觉伪影,确保地面的可导航性;2) 引入了无网格可通行性检查算法,避免了传统基于网格的方法的复杂性,直接从渲染视图中分析可通行区域。

关键设计:Floor-Aware Gaussian Splatting通过引入额外的损失函数,约束高斯分布在地面附近的形状和位置,从而优化地面表示。无网格可通行性检查算法通过分析渲染视图中的深度信息和颜色信息,判断像素是否属于可通行区域,并构建拓扑导航图。具体参数设置和损失函数细节在论文中有详细描述(未知)。

🖼️ 关键图片

img_0

📊 实验亮点

NVSim能够从真实世界的图像序列中生成大规模、可导航的室内模拟环境。通过Floor-Aware Gaussian Splatting,有效减少了地面上的视觉伪影,提高了导航的准确性。无网格可通行性检查算法简化了导航图的构建过程。具体性能数据和对比基线在论文中有详细描述(未知)。

🎯 应用场景

NVSim可应用于机器人导航算法的开发和测试,例如路径规划、SLAM、目标检测等。它还可以用于虚拟现实和增强现实应用,例如室内导航、虚拟导览等。通过提供低成本、可扩展的室内模拟环境,NVSim有望加速机器人和AR/VR技术的发展。

📄 摘要(原文)

We present NVSim, a framework that automatically constructs large-scale, navigable indoor simulators from only common image sequences, overcoming the cost and scalability limitations of traditional 3D scanning. Our approach adapts 3D Gaussian Splatting to address visual artifacts on sparsely observed floors a common issue in robotic traversal data. We introduce Floor-Aware Gaussian Splatting to ensure a clean, navigable ground plane, and a novel mesh-free traversability checking algorithm that constructs a topological graph by directly analyzing rendered views. We demonstrate our system's ability to generate valid, large-scale navigation graphs from real-world data. A video demonstration is avilable at https://youtu.be/tTiIQt6nXC8