AA-Splat: Anti-Aliased Feed-forward Gaussian Splatting

📄 arXiv: 2603.29394v1 📥 PDF

作者: Taewoo Suh, Sungpyo Kim, Jongmin Park, Munchurl Kim

分类: cs.CV

发布日期: 2026-03-31

备注: Please visit our project page at https://kaist-viclab.github.io/aasplat-site/


💡 一句话要点

提出AA-Splat,解决FF-3DGS在新视角合成中因采样率变化导致的渲染伪影问题

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 新视角合成 3D高斯溅射 抗锯齿渲染 前馈网络 渲染伪影

📋 核心要点

  1. 现有FF-3DGS方法依赖不准确的屏幕空间膨胀滤波器,导致在新视角合成中,尤其是在不同采样率下,产生明显的渲染伪影。
  2. AA-Splat通过引入不透明度平衡的带限(OBBL)设计,限制3D场景表示的带宽,并使用不透明度平衡来补偿高斯基元重叠,实现抗锯齿渲染。
  3. 实验结果表明,AA-Splat在不同分辨率下,相比SOTA基线DepthSplat,PSNR平均提升5.4dB到7.5dB,显著改善了新视角合成的质量。

📝 摘要(中文)

前馈3D高斯溅射(FF-3DGS)作为一种快速且鲁棒的稀疏视角3D重建和新视角合成(NVS)解决方案而出现。然而,现有的FF-3DGS方法建立在不正确的屏幕空间膨胀滤波器之上,导致在分布外采样率下渲染时出现严重的渲染伪影。我们首先提出了一个FF-3DGS模型,称为AA-Splat,以实现在任何分辨率下鲁棒的抗锯齿渲染。AA-Splat利用不透明度平衡的带限(OBBL)设计,它结合了两个组件:一个3D带限后置滤波器,将多视角最大频率边界集成到前馈重建管道中,有效地限制了生成的3D场景表示的带宽并消除了退化的高斯;一个不透明度平衡(OB),用于无缝地将所有像素对齐的高斯基元集成到渲染过程中,补偿了扩展高斯基元之间增加的重叠。AA-Splat在所有分辨率(4×到1/4×之间)的新视角合成性能上,相比最先进的(SOTA)基线DepthSplat,展示了平均5.4∼7.5dB PSNR增益的显著改进。代码将会开源。

🔬 方法详解

问题定义:现有的Feed-forward 3D Gaussian Splatting (FF-3DGS)方法在进行新视角合成时,尤其是在训练和渲染使用不同分辨率的情况下,会产生严重的渲染伪影。这是由于它们使用了不正确的屏幕空间膨胀滤波器,无法有效处理不同采样率下的抗锯齿问题。

核心思路:AA-Splat的核心思路是引入一个opacity-balanced band-limiting (OBBL)设计,从而在FF-3DGS框架下实现鲁棒的抗锯齿渲染。OBBL设计包含两个关键组件:3D带限后置滤波器和不透明度平衡(Opacity Balancing, OB)。通过限制3D场景表示的带宽,并补偿扩展高斯基元之间的重叠,从而消除渲染伪影。

技术框架:AA-Splat的整体框架仍然是FF-3DGS,即通过前馈网络直接从输入图像重建3D场景表示。主要改进在于渲染阶段,引入了OBBL模块。该模块首先使用3D带限后置滤波器来限制场景的频率成分,然后使用Opacity Balancing来调整高斯基元的不透明度,最后进行渲染。

关键创新:AA-Splat的关键创新在于OBBL设计,它将多视角最大频率边界集成到前馈重建管道中,有效地限制了3D场景表示的带宽,并消除了退化的高斯。同时,Opacity Balancing补偿了扩展高斯基元之间增加的重叠,从而实现了高质量的抗锯齿渲染。与现有方法相比,AA-Splat不再依赖于不准确的屏幕空间膨胀滤波器,而是直接在3D空间中进行带限操作。

关键设计:3D带限后置滤波器通过分析多视角图像的频率成分,估计场景的最大频率边界,并将其作为滤波器的截止频率。Opacity Balancing通过调整高斯基元的不透明度,来补偿由于高斯基元扩展而导致的重叠增加。具体实现细节(如滤波器类型、不透明度调整函数等)在论文中有详细描述,但摘要中未明确给出。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

AA-Splat在多个数据集上进行了实验,结果表明,相比于最先进的基线方法DepthSplat,AA-Splat在不同分辨率下均取得了显著的性能提升。具体而言,PSNR平均提升了5.4dB到7.5dB。这些结果表明,AA-Splat能够有效地解决FF-3DGS中的渲染伪影问题,并提高新视角合成的质量。

🎯 应用场景

AA-Splat在虚拟现实、增强现实、机器人导航、自动驾驶等领域具有广泛的应用前景。通过提高新视角合成的质量和鲁棒性,可以为用户提供更逼真的沉浸式体验,并为机器人提供更准确的环境感知能力。该研究还有助于推动3D重建和渲染技术的发展。

📄 摘要(原文)

Feed-forward 3D Gaussian Splatting (FF-3DGS) emerges as a fast and robust solution for sparse-view 3D reconstruction and novel view synthesis (NVS). However, existing FF-3DGS methods are built on incorrect screen-space dilation filters, causing severe rendering artifacts when rendering at out-of-distribution sampling rates. We firstly propose an FF-3DGS model, called AA-Splat, to enable robust anti-aliased rendering at any resolution. AA-Splat utilizes an opacity-balanced band-limiting (OBBL) design, which combines two components: a 3D band-limiting post-filter integrates multi-view maximal frequency bounds into the feed-forward reconstruction pipeline, effectively band-limiting the resulting 3D scene representations and eliminating degenerate Gaussians; an Opacity Balancing (OB) to seamlessly integrate all pixel-aligned Gaussian primitives into the rendering process, compensating for the increased overlap between expanded Gaussian primitives. AA-Splat demonstrates drastic improvements with average 5.4$\sim$7.5dB PSNR gains on NVS performance over a state-of-the-art (SOTA) baseline, DepthSplat, at all resolutions, between $4\times$ and $1/4\times$. Code will be made available.