WebSplatter: Enabling Cross-Device Efficient Gaussian Splatting in Web Browsers via WebGPU

📄 arXiv: 2602.03207v1 📥 PDF

作者: Yudong Han, Chao Xu, Xiaodan Ye, Weichen Bi, Zilong Dong, Yun Ma

分类: cs.GR, cs.CV, cs.PF

发布日期: 2026-02-03


💡 一句话要点

WebSplatter:通过WebGPU实现Web浏览器中的跨设备高效高斯溅射渲染

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: WebGPU 高斯溅射 渲染管线 基数排序 几何剔除 跨平台 Web3D

📋 核心要点

  1. 现有Web高斯溅射渲染方案效率较低,难以在异构Web环境中实现高性能和确定性。
  2. WebSplatter通过无等待分层基数排序和感知不透明度的几何剔除,优化渲染管线。
  3. 实验表明,WebSplatter相比现有技术,在渲染速度上提升了1.2到4.5倍。

📝 摘要(中文)

本文提出了WebSplatter,一个为异构Web生态系统设计的端到端GPU渲染管线。与简单的移植不同,WebSplatter引入了一种无等待的分层基数排序,规避了WebGPU中全局原子操作的缺失,确保了在不同硬件上的确定性执行。此外,我们提出了一种感知不透明度的几何剔除阶段,在光栅化之前动态地修剪splat,显著减少了过度绘制和峰值内存占用。评估表明,WebSplatter始终比最先进的Web渲染器实现了1.2倍到4.5倍的加速。

🔬 方法详解

问题定义:Web端高斯溅射渲染面临的挑战在于,WebGPU缺乏全局原子操作,导致无法直接应用传统的高斯溅射排序算法。此外,过度绘制和高内存占用也是影响渲染效率的关键因素。现有方法难以在保证渲染质量的同时,实现跨设备的高效渲染。

核心思路:WebSplatter的核心思路是通过优化排序算法和剔除策略,规避WebGPU的限制,并减少不必要的计算和内存占用。具体来说,采用无等待分层基数排序解决排序问题,并利用感知不透明度的几何剔除减少过度绘制。

技术框架:WebSplatter的渲染管线主要包括以下几个阶段:1) 数据预处理:将高斯溅射数据转换为WebGPU可用的格式。2) 无等待分层基数排序:对splat进行排序,确保渲染顺序正确。3) 感知不透明度的几何剔除:根据splat的不透明度和几何属性,动态剔除不可见或贡献较小的splat。4) 光栅化:将剩余的splat渲染到屏幕上。5) 后处理:进行颜色校正和合成等操作。

关键创新:WebSplatter的关键创新在于:1) 提出了适用于WebGPU的无等待分层基数排序算法,解决了全局原子操作缺失的问题。2) 引入了感知不透明度的几何剔除策略,有效减少了过度绘制和内存占用。

关键设计:无等待分层基数排序算法通过多轮局部排序和数据交换,模拟全局原子操作的效果。感知不透明度的几何剔除策略根据splat的不透明度值和深度信息,动态调整剔除阈值,以平衡渲染质量和效率。具体参数设置(如分层基数排序的层数、剔除阈值等)需要根据实际场景进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,WebSplatter在多个数据集上均取得了显著的性能提升。与最先进的Web渲染器相比,WebSplatter实现了1.2倍到4.5倍的加速。此外,WebSplatter还显著降低了峰值内存占用,使其能够在资源受限的设备上运行。

🎯 应用场景

WebSplatter可应用于各种基于Web的3D场景渲染,例如在线3D模型展示、虚拟现实/增强现实应用、游戏开发等。它能够提升Web端3D渲染的性能和用户体验,降低对硬件的要求,并促进跨平台3D应用的普及。未来,WebSplatter有望成为Web3D生态系统的重要组成部分。

📄 摘要(原文)

We present WebSplatter, an end-to-end GPU rendering pipeline for the heterogeneous web ecosystem. Unlike naive ports, WebSplatter introduces a wait-free hierarchical radix sort that circumvents the lack of global atomics in WebGPU, ensuring deterministic execution across diverse hardware. Furthermore, we propose an opacity-aware geometry culling stage that dynamically prunes splats before rasterization, significantly reducing overdraw and peak memory footprint. Evaluation demonstrates that WebSplatter consistently achieves 1.2$\times$ to 4.5$\times$ speedups over state-of-the-art web viewers.