City-on-Web: Real-time Neural Rendering of Large-scale Scenes on the Web

作者: Kaiwen Song, Xiaoyi Zeng, Chenqu Ren, Juyong Zhang

分类: cs.CV, cs.GR

发布日期: 2023-12-27 (更新: 2024-04-01)

备注: Project page: https://ustc3dv.github.io/City-on-Web/

💡 一句话要点

City-on-Web：首个Web端大规模场景实时神经渲染方法

🎯 匹配领域: 支柱三：空间感知与语义 (Perception & Semantics)

关键词: 神经渲染 大规模场景 实时渲染 Web平台 体渲染 细节层次 动态加载

📋 核心要点

现有神经辐射场方法难以在Web端实时渲染大规模场景，主要受限于计算资源、内存和带宽。
City-on-Web采用基于块的体渲染，保证3D一致性和遮挡关系，并结合LOD和动态资源管理降低内存需求。
实验表明，该系统在Web端RTX 3060 GPU上能以约32FPS渲染大规模场景，渲染质量媲美SOTA方法。

📝 摘要（中文）

现有的基于神经辐射场的方法可以在Web平台上实现小型场景的实时渲染。然而，由于计算、内存和带宽资源的限制，将这些方法扩展到大规模场景仍然面临着巨大的挑战。本文提出了City-on-Web，这是第一个用于在Web上实时渲染大规模场景的方法。我们提出了一种基于块的体渲染方法，以保证块之间的3D一致性和正确的遮挡关系，并引入了一种结合资源动态加载/卸载的细节层次策略，以显著降低内存需求。我们的系统在Web上使用RTX 3060 GPU以大约32FPS的速度实现了大规模场景的实时渲染，并保持了与当前最先进的新视角合成方法相当的渲染质量。

🔬 方法详解

问题定义：论文旨在解决大规模场景在Web端实时神经渲染的问题。现有方法在处理大规模场景时，面临着计算量大、内存占用高以及带宽需求高等挑战，难以在资源受限的Web环境中实现实时渲染。现有方法难以保证渲染质量和实时性之间的平衡。

核心思路：论文的核心思路是将大规模场景分割成多个块，并采用基于块的体渲染方法，以保证块之间的3D一致性和正确的遮挡关系。同时，引入细节层次（Level-of-Detail, LOD）策略，结合动态加载/卸载资源，从而显著降低内存需求，提高渲染效率。

技术框架：City-on-Web系统的整体框架主要包含以下几个阶段：1) 场景预处理：将大规模场景分割成多个块，并为每个块生成不同LOD级别的表示。2) 动态加载/卸载：根据相机视角和距离，动态加载/卸载可见块的资源。3) 基于块的体渲染：对加载的块进行体渲染，并保证块之间的3D一致性和遮挡关系。4) Web端渲染：将渲染结果在Web端进行展示。

关键创新：该论文的关键创新在于提出了一个完整的、可行的Web端大规模场景实时神经渲染解决方案。具体包括：1) 基于块的体渲染方法，保证了大规模场景的渲染质量和一致性。2) 结合动态加载/卸载的LOD策略，显著降低了内存需求，使得在资源受限的Web环境中实现实时渲染成为可能。3) 针对Web平台的优化，提升了渲染效率。

关键设计：论文中关键的设计包括：1) 块的大小和LOD级别的选择，需要在渲染质量、内存占用和加载速度之间进行权衡。2) 动态加载/卸载策略，需要根据相机视角和距离，以及块的重要性，进行合理的资源管理。3) 体渲染过程中的采样策略和光照模型，需要保证渲染质量和效率。

📊 实验亮点

City-on-Web系统在Web端使用RTX 3060 GPU以大约32FPS的速度实现了大规模场景的实时渲染，并且渲染质量与当前最先进的新视角合成方法相当。该系统显著降低了内存需求，使得在Web端实时渲染大规模场景成为可能。实验结果表明，该方法在渲染质量和实时性之间取得了良好的平衡。

🎯 应用场景

City-on-Web技术可广泛应用于在线地图、虚拟旅游、智慧城市、远程教育、游戏开发等领域。用户可以通过Web浏览器实时浏览和探索大规模的城市或场景，无需安装任何客户端软件。该技术可以提升用户体验，降低开发成本，并为相关产业带来新的发展机遇。

📄 摘要（原文）

Existing neural radiance field-based methods can achieve real-time rendering of small scenes on the web platform. However, extending these methods to large-scale scenes still poses significant challenges due to limited resources in computation, memory, and bandwidth. In this paper, we propose City-on-Web, the first method for real-time rendering of large-scale scenes on the web. We propose a block-based volume rendering method to guarantee 3D consistency and correct occlusion between blocks, and introduce a Level-of-Detail strategy combined with dynamic loading/unloading of resources to significantly reduce memory demands. Our system achieves real-time rendering of large-scale scenes at approximately 32FPS with RTX 3060 GPU on the web and maintains rendering quality comparable to the current state-of-the-art novel view synthesis methods.

City-on-Web: Real-time Neural Rendering of Large-scale Scenes on the Web

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册