You Only Gaussian Once: Controllable 3D Gaussian Splatting for Ultra-Densely Sampled Scenes

📄 arXiv: 2604.21400v1 📥 PDF

作者: Jinrang Jia, Zhenjia Li, Yifeng Shi

分类: cs.CV

发布日期: 2026-04-23

备注: 17 pages, 5 figures

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

YOGO:面向超密集场景的可控3D高斯溅射,弥合工业界与学术界差距

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 3D高斯溅射 神经渲染 三维重建 多传感器融合 确定性优化 资源控制 超密集场景

📋 核心要点

  1. 现有3DGS方法在资源消耗上存在不可预测性,且易受数据集稀疏性的影响,难以满足工业级应用的需求。
  2. YOGO将随机高斯增长过程转化为确定性的、预算感知的平衡,从而实现可控的资源分配和鲁棒的多传感器融合。
  3. YOGO在视觉质量上达到了最先进水平,同时保持了严格的确定性,并发布了超密集室内数据集Immersion v1.0。

📝 摘要(中文)

3D高斯溅射(3DGS)彻底改变了神经渲染,但现有方法主要还是研究原型,不适合生产级部署。本文指出了阻碍实际应用的关键“工业界-学术界差距”:启发式高斯增长导致不可预测的资源消耗,当前基准测试的“稀疏性屏蔽”奖励幻觉而非物理保真度,以及严重的多传感器数据污染。为了弥合这一差距,我们提出了YOGO(You Only Gaussian Once),一个系统级框架,将随机增长过程重新定义为确定性的、预算感知的平衡。YOGO集成了用于硬件约束资源分配的新型预算控制器和用于鲁棒多传感器融合的可用性注册协议。为了突破重建保真度的界限,我们引入了Immersion v1.0,这是第一个超密集室内数据集,专门用于打破“稀疏性屏蔽”。通过提供饱和的视点覆盖,Immersion v1.0迫使算法专注于极端的物理保真度,而不是视点插值,并使社区能够专注于高保真重建的上限。大量实验表明,YOGO在保持严格确定性配置文件的同时,实现了最先进的视觉质量,为生产级3DGS建立了新标准。为了方便重现,Immersion v1.0数据集的部分场景和YOGO的源代码已公开发布。

🔬 方法详解

问题定义:现有3D高斯溅射方法在实际应用中面临资源消耗不可预测、对稀疏数据过度依赖以及多传感器数据融合困难等问题。启发式的高斯增长策略导致资源使用难以控制,而现有benchmark的稀疏性使得算法倾向于生成幻觉而非真实的物理结构。此外,多传感器数据中的噪声和误差会严重影响重建质量。

核心思路:YOGO的核心思路是将原本随机的高斯增长过程转化为一个确定性的、预算感知的平衡状态。通过引入预算控制器,可以根据硬件资源限制来精确控制高斯数量的增长,避免资源过度消耗。同时,采用可用性注册协议来处理多传感器数据,提高数据融合的鲁棒性。

技术框架:YOGO的整体框架包含以下几个主要模块:1) 预算控制器:负责根据硬件资源限制动态调整高斯数量的增长;2) 可用性注册协议:用于处理多传感器数据,过滤噪声和误差,提高数据融合的质量;3) 确定性高斯增长策略:将随机增长过程转化为确定性的过程,保证资源消耗的可预测性;4) 渲染模块:基于优化后的高斯参数进行图像渲染。

关键创新:YOGO最重要的创新点在于将随机高斯增长过程转化为确定性的、预算感知的平衡状态。与现有方法依赖启发式规则不同,YOGO通过预算控制器和可用性注册协议,实现了对资源消耗和数据质量的精确控制,从而提高了算法的稳定性和鲁棒性。此外,Immersion v1.0数据集的引入也打破了“稀疏性屏蔽”,迫使算法关注真实的物理结构。

关键设计:YOGO的关键设计包括:1) 预算控制器的设计,需要根据硬件资源和场景复杂度来动态调整高斯数量的增长速率;2) 可用性注册协议的设计,需要有效地过滤多传感器数据中的噪声和误差;3) 损失函数的设计,需要平衡重建质量和资源消耗,避免过度优化导致资源浪费;4) Immersion v1.0数据集的设计,需要保证视点覆盖的饱和度,迫使算法关注真实的物理结构。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

YOGO在多个数据集上取得了state-of-the-art的视觉质量,同时保持了严格的确定性。与现有方法相比,YOGO在资源消耗上更加可控,能够更好地适应硬件资源的限制。此外,YOGO在Immersion v1.0数据集上的表现证明了其在超密集场景下的重建能力,打破了“稀疏性屏蔽”。

🎯 应用场景

YOGO具有广泛的应用前景,包括:1) 工业级三维重建:可用于城市建模、文物数字化、工厂场景重建等;2) 虚拟现实/增强现实:可用于创建逼真的虚拟环境和增强现实体验;3) 机器人导航:可用于构建机器人的环境地图,提高导航的准确性和鲁棒性。YOGO的确定性和可控性使其能够更好地适应实际应用场景的需求,具有重要的实际价值和未来影响。

📄 摘要(原文)

3D Gaussian Splatting (3DGS) has revolutionized neural rendering, yet existing methods remain predominantly research prototypes ill-suited for production-level deployment. We identify a critical "Industry-Academia Gap" hindering real-world application: unpredictable resource consumption from heuristic Gaussian growth, the "sparsity shield" of current benchmarks that rewards hallucination over physical fidelity, and severe multi-sensor data pollution. To bridge this gap, we propose YOGO (You Only Gaussian Once), a system-level framework that reformulates the stochastic growth process into a deterministic, budget-aware equilibrium. YOGO integrates a novel budget controller for hardware-constrained resource allocation and an availability-registration protocol for robust multi-sensor fusion. To push the boundaries of reconstruction fidelity, we introduce Immersion v1.0, the first ultra-dense indoor dataset specifically designed to break the "sparsity shield." By providing saturated viewpoint coverage, Immersion v1.0 forces algorithms to focus on extreme physical fidelity rather than viewpoint interpolation, and enables the community to focus on the upper limits of high-fidelity reconstruction. Extensive experiments demonstrate that YOGO achieves state-of-the-art visual quality while maintaining a strictly deterministic profile, establishing a new standard for production-grade 3DGS. To facilitate reproducibility, part scenes of Immersion v1.0 dataset and source code of YOGO has been publicly released. The project link is https://jjrcn.github.io/YOGO/.