BlitzGS: City-Scale Gaussian Splatting at Lightning Speed
作者: Zhongtao Wang, Huishan Au, Yilong Li, Mai Su, Haojie Jin, Yisong Chen, Meng Gai, Fei Zhu, Guoping Wang
分类: cs.GR, cs.CV
发布日期: 2026-05-13
💡 一句话要点
BlitzGS:一种闪电般快速的城市级高斯溅射框架,显著加速重建过程。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 高斯溅射 三维重建 城市级场景 分布式渲染 重要性采样
📋 核心要点
- 现有空间分割方法在高斯溅射中存在跨块可见性冗余,导致计算效率低下,难以实现城市级场景的快速重建。
- BlitzGS 通过索引奇偶性分片高斯分布,并结合重要性评分和距离 LOD 等策略,有效减少活跃高斯的工作负载。
- 实验表明,BlitzGS 在大型基准测试中达到了与现有方法相当的渲染质量,同时实现了数量级的速度提升,可在数十分钟内训练城市级场景。
📝 摘要(中文)
BlitzGS 是一种分布式 3D 高斯溅射框架,旨在减少活跃高斯的工作负载,从而实现快速的城市级重建。该框架在三个耦合的层面上管理工作负载。在系统层面,它通过索引奇偶性而非空间块来跨 GPU 分片高斯分布,从而减轻空间分割中固有的跨块可见性冗余。此外,它通过单个跨 GPU 交换来分发每个渲染步骤,将投影的高斯分布路由到其瓦片所有者。在模型层面,调度的重要性评分过程会缩小全局高斯群体的规模。在此过程中,框架会生成每个高斯分布的可见性权重,以使密度控制更新偏向于贡献图元,并为视图级渲染器生成每个视图的重要性掩码。在视图层面,BlitzGS 使用基于距离的 LOD 门限来修剪每个相机的活动集,以排除当前视锥体中过于精细的图元,并使用基于重要性的剔除掩码来跳过具有可忽略的跨视图贡献的高斯分布。
🔬 方法详解
问题定义:现有的大规模场景高斯溅射方法,特别是城市级别的场景,由于场景规模巨大,高斯基元的数量庞大,导致渲染和训练过程计算量巨大,效率低下。空间分割方法虽然常用,但存在跨块可见性冗余,进一步增加了不必要的计算负担。
核心思路:BlitzGS 的核心思路是通过在系统、模型和视图三个层面协同优化,减少需要处理的活跃高斯基元的数量,从而降低计算复杂度,提高渲染和训练速度。具体来说,通过非空间分片方式减少冗余计算,通过重要性评分和LOD剔除减少不必要的高斯基元。
技术框架:BlitzGS 的整体框架包含三个主要层次:系统级、模型级和视图级。在系统级,采用基于索引奇偶性的高斯分片策略,将高斯基元分配到不同的 GPU 上。在模型级,通过重要性评分机制,对高斯基元进行筛选,去除不重要的基元。在视图级,利用距离 LOD 和重要性掩码,进一步剔除当前视角下不必要的高斯基元。每个渲染步骤通过单次跨 GPU 交换完成,将投影的高斯分布路由到对应的瓦片所有者。
关键创新:BlitzGS 的关键创新在于其三层协同优化策略,特别是基于索引奇偶性的分片方式和重要性评分机制。传统的空间分割方法容易造成跨块可见性冗余,而索引奇偶性分片可以有效缓解这一问题。重要性评分机制能够准确评估每个高斯基元的贡献,从而有针对性地进行剔除,避免了盲目剔除可能造成的质量损失。
关键设计:在模型层面,BlitzGS 使用重要性评分来指导密度控制更新,使得更新偏向于对渲染结果有贡献的图元。同时,为每个视图生成重要性掩码,用于视图级别的渲染。在视图层面,采用基于距离的 LOD 门限和重要性剔除掩码,进一步减少需要处理的高斯基元数量。具体的参数设置和损失函数细节在论文中未明确说明,属于未知信息。
🖼️ 关键图片
📊 实验亮点
BlitzGS 在大规模基准测试中,在保证渲染质量的前提下,实现了比现有方法数量级的速度提升。这意味着可以在数十分钟内完成城市级场景的训练,极大地提高了效率。具体性能数据和对比基线在摘要中未详细说明,需要参考论文全文。
🎯 应用场景
BlitzGS 在城市级三维重建、自动驾驶、虚拟现实、游戏开发等领域具有广泛的应用前景。它可以用于快速生成城市级别的三维模型,为自动驾驶提供高精度的环境感知,为虚拟现实和游戏开发提供逼真的场景渲染。该研究的突破将加速相关领域的发展,并推动三维重建技术的普及。
📄 摘要(原文)
We present BlitzGS, a distributed 3DGS framework that reduces active Gaussian workload for fast city-scale reconstruction. BlitzGS manages this workload at three coupled levels. At the system level, the framework shards Gaussians across GPUs by index parity rather than spatial blocks. This approach mitigates the cross-block visibility redundancy inherent in spatial partitioning. Furthermore, it distributes each rendering step through a single cross-GPU exchange that routes projected Gaussians to their tile owners. At the model level, scheduled importance-scoring passes shrink the global Gaussian population. During these passes, the framework generates a per-Gaussian visibility weight to bias density-control updates toward contributing primitives and a per-view importance mask for the view-level renderer. At the view level, BlitzGS trims each camera's active set with a distance-based LOD gate to exclude excessively fine primitives for the current frustum and the importance-based culling mask to skip Gaussians with negligible cross-view contribution. On large-scale benchmarks, BlitzGS matches the rendering quality of recent large-scale baselines while delivering an order-of-magnitude speedup, training city-scale scenes in tens of minutes. Our code is available at https: //github.com/AkierRaee/BlitzGS.