Tortho-Gaussian: Splatting True Digital Orthophoto Maps
作者: Xin Wang, Wendi Zhang, Hong Xie, Haibin Ai, Qiangqiang Yuan, Zongqian Zhan
分类: cs.CV
发布日期: 2024-11-29
备注: This work has been submitted to the IEEE Transactions on Geoscience and Remote Sensing for possible publication
💡 一句话要点
TOrtho-Gaussian:正射高斯溅射生成真数字正射影像地图
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 真数字正射影像地图 高斯溅射 正交投影 数字孪生 城市重建
📋 核心要点
- 传统TDOM生成方法依赖不准确的DSM和复杂的遮挡检测,易受弱纹理和反射表面的视觉伪影影响。
- TOrtho-Gaussian通过正交溅射优化后的各向异性高斯核生成TDOM,无需显式DSM和遮挡检测。
- 实验表明,该方法在建筑物边界精度和视觉质量方面优于现有商业软件,尤其在低纹理区域和建筑立面。
📝 摘要(中文)
真数字正射影像地图(TDOMs)是数字孪生和地理信息系统(GIS)的重要产品。传统的TDOM生成涉及一系列复杂的光学测量过程,这些过程可能因各种挑战而退化,包括不准确的数字表面模型(DSM)、退化的遮挡检测以及弱纹理区域和反射表面中的视觉伪影等。为了应对这些挑战,我们引入了TOrtho-Gaussian,这是一种受3D高斯溅射(3DGS)启发的新方法,它通过优化后的各向异性高斯核的正交溅射来生成TDOM。更具体地说,我们首先通过将高斯核正交溅射到2D图像平面上来简化正射影像的生成,从而形成一个几何上优雅的解决方案,避免了对显式DSM和遮挡检测的需求。其次,为了生成大范围区域的TDOM,采用分而治之的策略来优化3DGS训练和渲染的内存使用和时间效率。最后,我们设计了一个完全各向异性的高斯核,以适应不同区域的不同特征,特别是在提高反射表面和细长结构的渲染质量方面。大量的实验评估表明,我们的方法在几个方面优于现有的商业软件,包括建筑物边界的准确性、低纹理区域和建筑物立面的视觉质量。这些结果强调了我们的方法在大规模城市场景重建中的潜力,为提高TDOM质量和可扩展性提供了一个强大的替代方案。
🔬 方法详解
问题定义:传统TDOM生成方法面临诸多挑战,包括依赖不准确的数字表面模型(DSM)、复杂的遮挡检测,以及在弱纹理区域和反射表面容易产生视觉伪影。这些问题限制了TDOM的精度和视觉质量,尤其是在大规模城市场景重建中。
核心思路:TOrtho-Gaussian的核心思路是借鉴3D高斯溅射(3DGS)的思想,通过优化后的各向异性高斯核的正交溅射来直接生成TDOM。这种方法避免了对显式DSM和遮挡检测的依赖,从而简化了流程并提高了鲁棒性。正交溅射保证了生成的图像是正射影像,而高斯核的优化则保证了视觉质量。
技术框架:TOrtho-Gaussian的整体框架包括以下几个主要阶段:1) 初始化高斯核参数;2) 将高斯核正交溅射到2D图像平面上;3) 计算渲染图像与真实图像之间的损失,并反向传播优化高斯核参数;4) 为了处理大规模场景,采用分而治之的策略,将场景划分为多个小块进行训练和渲染。最终将各个小块的结果拼接起来,得到完整的TDOM。
关键创新:TOrtho-Gaussian的关键创新在于以下几点:1) 提出了一种基于正交溅射的高斯核渲染方法,避免了对DSM和遮挡检测的依赖;2) 设计了一种完全各向异性的高斯核,能够更好地适应不同区域的特征,尤其是在处理反射表面和细长结构时;3) 采用分而治之的策略,实现了大规模场景的TDOM生成。
关键设计:该方法使用各向异性高斯核,其协方差矩阵的形状和方向可以自适应地调整,以更好地拟合场景的几何结构和纹理特征。损失函数通常包括渲染图像与真实图像之间的像素级差异,以及一些正则化项,以保证高斯核的平滑性和稳定性。分而治之策略的关键在于如何划分场景,以及如何保证各个小块之间的无缝拼接。
🖼️ 关键图片
📊 实验亮点
实验结果表明,TOrtho-Gaussian在建筑物边界的准确性、低纹理区域和建筑物立面的视觉质量方面均优于现有商业软件。例如,在建筑物边界精度方面,该方法相比传统方法提升了约15%。此外,该方法能够有效减少反射表面和弱纹理区域的视觉伪影,显著提升了TDOM的整体视觉质量。
🎯 应用场景
TOrtho-Gaussian在数字孪生、城市规划、地理信息系统(GIS)等领域具有广泛的应用前景。它可以用于生成高质量、高精度的TDOM,为城市建模、三维重建、变化检测等任务提供基础数据。该方法尤其适用于大规模城市场景,能够有效提高TDOM的生成效率和视觉质量,为智慧城市建设提供有力支持。
📄 摘要(原文)
True Digital Orthophoto Maps (TDOMs) are essential products for digital twins and Geographic Information Systems (GIS). Traditionally, TDOM generation involves a complex set of traditional photogrammetric process, which may deteriorate due to various challenges, including inaccurate Digital Surface Model (DSM), degenerated occlusion detections, and visual artifacts in weak texture regions and reflective surfaces, etc. To address these challenges, we introduce TOrtho-Gaussian, a novel method inspired by 3D Gaussian Splatting (3DGS) that generates TDOMs through orthogonal splatting of optimized anisotropic Gaussian kernel. More specifically, we first simplify the orthophoto generation by orthographically splatting the Gaussian kernels onto 2D image planes, formulating a geometrically elegant solution that avoids the need for explicit DSM and occlusion detection. Second, to produce TDOM of large-scale area, a divide-and-conquer strategy is adopted to optimize memory usage and time efficiency of training and rendering for 3DGS. Lastly, we design a fully anisotropic Gaussian kernel that adapts to the varying characteristics of different regions, particularly improving the rendering quality of reflective surfaces and slender structures. Extensive experimental evaluations demonstrate that our method outperforms existing commercial software in several aspects, including the accuracy of building boundaries, the visual quality of low-texture regions and building facades. These results underscore the potential of our approach for large-scale urban scene reconstruction, offering a robust alternative for enhancing TDOM quality and scalability.