You Only Gaussian Once: Controllable 3D Gaussian Splatting for Ultra-Densely Sampled Scenes

📄 arXiv: 2604.21400v2 📥 PDF

作者: Jinrang Jia, Zhenjia Li, Yifeng Shi

分类: cs.CV

发布日期: 2026-04-23 (更新: 2026-04-24)

备注: 17 pages, 5 figures

🔗 代码/项目: PROJECT_PAGE


💡 一句话要点

YOGO:面向超密集场景的可控3D高斯溅射,解决工业界应用难题

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 3D高斯溅射 神经渲染 工业应用 确定性优化 多传感器融合 超密集重建 资源控制 物理保真度

📋 核心要点

  1. 现有3DGS方法在资源消耗上存在不可预测性,且在稀疏数据上倾向于产生幻觉,限制了其在工业界的实际应用。
  2. YOGO将随机高斯增长过程转化为确定性的、预算感知的平衡,通过预算控制器进行资源分配,并采用可用性注册协议进行多传感器融合。
  3. YOGO在视觉质量上达到了最先进水平,同时保持了确定性的资源消耗,并发布了超密集室内数据集Immersion v1.0以促进高保真重建研究。

📝 摘要(中文)

3D高斯溅射(3DGS)彻底改变了神经渲染,但现有方法主要还是研究原型,不适合生产级部署。我们发现了阻碍实际应用的“工业界-学术界差距”:高斯增长的启发式方法导致不可预测的资源消耗,当前基准测试的“稀疏性保护”奖励了幻觉而非物理保真度,以及严重的多传感器数据污染。为了弥合这一差距,我们提出了YOGO(You Only Gaussian Once),一个系统级框架,将随机增长过程重新制定为确定性的、预算感知的平衡。YOGO集成了用于硬件约束资源分配的新型预算控制器和用于鲁棒多传感器融合的可用性注册协议。为了突破重建保真度的界限,我们引入了Immersion v1.0,这是第一个专门用于打破“稀疏性保护”的超密集室内数据集。通过提供饱和的视点覆盖,Immersion v1.0迫使算法专注于极端的物理保真度而不是视点插值,并使社区能够专注于高保真重建的上限。大量实验表明,YOGO在保持严格确定性配置文件的同时,实现了最先进的视觉质量,为生产级3DGS建立了新标准。为了方便重现,Immersion v1.0数据集的部分场景和YOGO的源代码已公开发布。

🔬 方法详解

问题定义:现有3D高斯溅射方法在工业应用中面临资源消耗不可预测、对稀疏数据过度依赖以及多传感器数据融合困难等问题。启发式的高斯增长策略导致资源使用不稳定,而现有benchmark的稀疏性使得算法倾向于通过幻觉来填补空白,而非提升物理真实性。

核心思路:YOGO的核心在于将高斯增长过程从随机、启发式的过程转变为确定性的、预算感知的平衡状态。通过引入预算控制器,YOGO能够根据硬件资源约束进行高斯资源的分配,从而保证资源消耗的可预测性。同时,通过可用性注册协议,YOGO能够更有效地融合多传感器数据,减少数据污染。

技术框架:YOGO的整体框架包含以下几个主要模块:1) 预算控制器:负责根据硬件资源限制,动态调整高斯资源的分配策略。2) 可用性注册协议:用于处理和融合来自多个传感器的数据,提高数据质量和鲁棒性。3) 确定性高斯增长:将传统随机增长过程转化为确定性过程,保证资源消耗的可预测性。4) Immersion v1.0数据集:提供超密集视点覆盖的室内场景数据,用于训练和评估算法的物理保真度。

关键创新:YOGO的关键创新在于其确定性的高斯增长策略和预算控制机制。与现有方法不同,YOGO不再依赖启发式规则进行高斯增长,而是通过预算控制器来精确控制资源的分配,从而保证资源消耗的可预测性。此外,Immersion v1.0数据集的引入,使得算法能够专注于提升物理保真度,而非仅仅依赖视点插值。

关键设计:YOGO的关键设计包括:1) 预算控制器的具体实现,例如如何根据硬件资源动态调整高斯数量和大小。2) 可用性注册协议的细节,例如如何处理不同传感器之间的噪声和偏差。3) 确定性高斯增长的具体算法,例如如何根据场景的几何和纹理信息来确定高斯的初始位置和属性。4) Immersion v1.0数据集的采集和标注方法,例如如何保证视点覆盖的密度和数据的准确性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

YOGO在实验中取得了显著的成果,在视觉质量上达到了state-of-the-art水平,同时保持了严格的确定性资源消耗。Immersion v1.0数据集的发布为高保真3D重建研究提供了新的基准。实验结果表明,YOGO能够有效地减少幻觉,提升物理保真度,为生产级3DGS应用奠定了基础。

🎯 应用场景

YOGO具有广泛的应用前景,包括:1) 工业级3D重建:可用于创建高质量的3D模型,应用于产品设计、虚拟现实等领域。2) 机器人导航:可用于构建精确的环境地图,帮助机器人在复杂环境中进行导航。3) 城市建模:可用于创建大规模的城市3D模型,应用于城市规划、交通管理等领域。YOGO的确定性资源消耗特性使其更易于部署在资源受限的设备上,具有重要的实际价值。

📄 摘要(原文)

3D Gaussian Splatting (3DGS) has revolutionized neural rendering, yet existing methods remain predominantly research prototypes ill-suited for production-level deployment. We identify a critical "Industry-Academia Gap" hindering real-world application: unpredictable resource consumption from heuristic Gaussian growth, the "sparsity shield" of current benchmarks that rewards hallucination over physical fidelity, and severe multi-sensor data pollution. To bridge this gap, we propose YOGO (You Only Gaussian Once), a system-level framework that reformulates the stochastic growth process into a deterministic, budget-aware equilibrium. YOGO integrates a novel budget controller for hardware-constrained resource allocation and an availability-registration protocol for robust multi-sensor fusion. To push the boundaries of reconstruction fidelity, we introduce Immersion v1.0, the first ultra-dense indoor dataset specifically designed to break the "sparsity shield." By providing saturated viewpoint coverage, Immersion v1.0 forces algorithms to focus on extreme physical fidelity rather than viewpoint interpolation, and enables the community to focus on the upper limits of high-fidelity reconstruction. Extensive experiments demonstrate that YOGO achieves state-of-the-art visual quality while maintaining a strictly deterministic profile, establishing a new standard for production-grade 3DGS. To facilitate reproducibility, part scenes of Immersion v1.0 dataset and source code of YOGO has been publicly released. The project link is https://jjrcn.github.io/yogo-project-home/