Few TensoRF: Enhance the Few-shot on Tensorial Radiance Fields
作者: Thanh-Hai Le, Hoang-Hau Tran, Trong-Nghia Vu
分类: cs.CV, cs.AI
发布日期: 2026-03-26
备注: 11 pages, 8 figures
💡 一句话要点
Few TensoRF:结合张量分解与频率正则化,提升少样本3D重建效果
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 少样本学习 神经辐射场 3D重建 张量分解 频率正则化
📋 核心要点
- 现有NeRF方法在少样本情况下重建质量较差,且训练时间长,难以满足实时应用需求。
- Few TensoRF结合TensorRF的快速渲染和FreeNeRF的频率正则化,提升少样本重建的质量和效率。
- 实验表明,Few TensoRF在重建质量和训练速度上均优于TensorRF,并在人体重建上表现出竞争力。
📝 摘要(中文)
本文提出了Few TensoRF,一个3D重建框架,它结合了TensorRF的高效张量表示和FreeNeRF的频率驱动的少样本正则化方法。通过使用TensorRF显著加速渲染速度,并引入频率和遮挡掩码,该方法提高了稀疏输入视图下的稳定性和重建质量。在Synthesis NeRF基准测试上的实验表明,Few TensoRF方法将平均PSNR从21.45 dB (TensorRF) 提高到 23.70 dB,经过微调的版本达到 24.52 dB,同时保持了TensorRF的快速训练时间(约10-15分钟)。在THuman 2.0数据集上的实验进一步证明了其在人体重建方面的竞争性能,仅使用八个输入图像就达到了 27.37 - 34.00 dB。这些结果表明,Few TensoRF是一种高效且数据有效的解决方案,适用于各种场景的实时3D重建。
🔬 方法详解
问题定义:在少样本(few-shot)条件下,如何高效且高质量地进行3D重建?现有的NeRF方法在数据稀疏时容易过拟合,导致重建质量下降,且训练时间较长,难以应用于实时场景。TensorRF虽然速度快,但在少样本下的性能仍有提升空间。
核心思路:Few TensoRF的核心思路是结合TensorRF的高效张量分解表示和FreeNeRF的频率正则化策略。TensorRF提供快速渲染能力,而FreeNeRF的频率正则化能够约束重建结果,避免过拟合,从而在少样本情况下提升重建质量。此外,还引入了遮挡掩码,进一步提升重建的鲁棒性。
技术框架:Few TensoRF的整体框架可以概括为:首先,利用TensorRF进行场景的张量分解表示,得到场景的密度和颜色信息。然后,在训练过程中,引入FreeNeRF的频率正则化项,约束场景的重建结果。同时,使用遮挡掩码来处理遮挡问题,提高重建的准确性。最后,通过优化张量分解表示和频率正则化项,得到最终的3D重建结果。
关键创新:Few TensoRF的关键创新在于将频率正则化方法引入到基于张量分解的NeRF框架中。与直接使用NeRF相比,TensorRF的张量分解能够加速渲染过程,而频率正则化则能够有效地约束重建结果,避免在少样本情况下出现过拟合。此外,遮挡掩码的引入也提高了重建的鲁棒性。
关键设计:Few TensoRF的关键设计包括:1) 使用TensorRF的CP分解来表示场景的密度和颜色;2) 引入FreeNeRF的频率正则化项,包括Eikonal loss和Laplacian loss;3) 使用遮挡掩码来过滤掉被遮挡的像素,避免其对重建产生干扰;4) 联合优化张量分解表示和频率正则化项,以获得最佳的重建效果。具体的损失函数包括渲染损失、Eikonal loss、Laplacian loss和正则化损失。
🖼️ 关键图片
📊 实验亮点
Few TensoRF在Synthesis NeRF数据集上,相较于TensorRF,平均PSNR从21.45 dB提升至23.70 dB,微调后达到24.52 dB,同时保持了TensorRF的快速训练速度(10-15分钟)。在THuman 2.0数据集上,仅使用8张输入图像,Few TensoRF达到了27.37 - 34.00 dB的PSNR,展现了其在人体重建方面的竞争力。
🎯 应用场景
Few TensoRF在机器人导航、虚拟现实、增强现实、三维地图构建等领域具有广泛的应用前景。该方法能够利用少量图像快速重建高质量的3D模型,为这些应用提供高效的数据支持。未来,可以进一步研究如何将Few TensoRF应用于动态场景的重建,以及如何与其他传感器数据融合,以提高重建的准确性和鲁棒性。
📄 摘要(原文)
This paper presents Few TensoRF, a 3D reconstruction framework that combines TensorRF's efficient tensor based representation with FreeNeRF's frequency driven few shot regularization. Using TensorRF to significantly accelerate rendering speed and introducing frequency and occlusion masks, the method improves stability and reconstruction quality under sparse input views. Experiments on the Synthesis NeRF benchmark show that Few TensoRF method improves the average PSNR from 21.45 dB (TensorRF) to 23.70 dB, with the fine tuned version reaching 24.52 dB, while maintaining TensorRF's fast (\approx10-15) minute training time. Experiments on the THuman 2.0 dataset further demonstrate competitive performance in human body reconstruction, achieving 27.37 - 34.00 dB with only eight input images. These results highlight Few TensoRF as an efficient and data effective solution for real-time 3D reconstruction across diverse scenes.