A Novel Solution for Drone Photogrammetry with Low-overlap Aerial Images using Monocular Depth Estimation

📄 arXiv: 2503.04513v1 📥 PDF

作者: Jiageng Zhong, Qi Zhou, Ming Li, Armin Gruen, Xuan Liao

分类: cs.CV

发布日期: 2025-03-06


💡 一句话要点

提出基于单目深度估计的无人机影像重建方法,解决低重叠度影像重建难题

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 无人机影像 摄影测量 低重叠度 单目深度估计 三维重建

📋 核心要点

  1. 传统摄影测量方法依赖高重叠度影像,在低重叠度航拍影像重建中面临精度和完整性挑战。
  2. 该方法利用单目深度估计,通过空中三角测量连接点建立单目深度与度量深度的关系,生成密集深度信息。
  3. 实验结果表明,该方法在低重叠度影像下重建的深度图和DSM达到米级精度,并显著提升了完整性。

📝 摘要(中文)

本研究提出了一种基于单目深度估计的无人机影像重建新流程,旨在解决传统摄影测量方法在低重叠度航拍影像处理中的局限性。传统方法严重依赖高影像重叠度以生成精确和完整的测绘产品。该方法利用空中三角测量获得的连接点,建立单目深度与度量深度之间的关系,从而将原始深度图转换为度量深度图,实现密集深度信息的生成和场景的全面重建。实验中,使用包含296张影像的高重叠度无人机数据集,通过Metashape生成深度图和DSM作为真值。然后,选择20张影像创建低重叠度数据集进行评估。结果表明,恢复的深度图和生成的DSM达到了米级精度,并且与传统方法相比,在单张影像覆盖的区域具有显著更高的完整性。这项研究展示了单目深度估计在低重叠度航空摄影测量中的潜力。

🔬 方法详解

问题定义:传统摄影测量方法在处理低重叠度航拍影像时面临挑战。由于缺乏足够的影像重叠,难以建立可靠的匹配关系,导致重建精度下降,甚至无法生成完整的模型。现有方法难以在保证精度的同时,实现低重叠度影像的有效重建。

核心思路:论文的核心思路是利用单目深度估计来弥补低重叠度影像带来的信息缺失。单目深度估计可以从单张影像中预测深度信息,即使在缺乏影像重叠的区域也能提供深度线索。通过将单目深度估计的结果与空中三角测量获得的稀疏点云进行融合,可以实现更完整、更精确的场景重建。

技术框架:该方法主要包含以下几个阶段:1) 使用空中三角测量(AT)处理低重叠度影像,获得稀疏点云和相机姿态;2) 使用单目深度估计网络,从每张影像中预测深度图;3) 利用AT结果,建立单目深度与度量深度之间的转换关系,将单目深度图转换为度量深度图;4) 将转换后的度量深度图进行融合,生成密集的点云模型和数字表面模型(DSM)。

关键创新:该方法最重要的创新点在于将单目深度估计引入到低重叠度航拍影像重建中。传统方法主要依赖多视几何约束,在低重叠度情况下失效。而该方法利用单目深度估计提供额外的深度信息,从而克服了低重叠度带来的限制。通过建立单目深度与度量深度之间的关系,实现了单目深度估计结果的有效利用。

关键设计:论文中,单目深度估计网络的选择和训练是关键。具体使用的网络结构和损失函数未知,但需要保证网络能够从航拍影像中准确预测深度信息。此外,单目深度与度量深度之间转换关系的建立也至关重要,需要选择合适的转换模型,并利用AT结果进行参数估计。具体参数设置和损失函数细节未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在低重叠度(20张影像)无人机数据集上,能够生成米级精度的深度图和DSM。与传统方法相比,该方法在单张影像覆盖区域的完整性显著提升。虽然没有给出具体的量化指标,但实验结果表明该方法在低重叠度影像重建方面具有明显优势。

🎯 应用场景

该研究成果可应用于快速测绘、灾害评估、环境监测等领域。在这些场景中,快速获取大范围、低成本的地理空间数据至关重要。低重叠度航拍影像可以显著降低数据采集成本和时间,而该方法能够有效处理这些数据,为相关应用提供高质量的重建结果。未来,该技术有望进一步推动无人机遥感在各个领域的应用。

📄 摘要(原文)

Low-overlap aerial imagery poses significant challenges to traditional photogrammetric methods, which rely heavily on high image overlap to produce accurate and complete mapping products. In this study, we propose a novel workflow based on monocular depth estimation to address the limitations of conventional techniques. Our method leverages tie points obtained from aerial triangulation to establish a relationship between monocular depth and metric depth, thus transforming the original depth map into a metric depth map, enabling the generation of dense depth information and the comprehensive reconstruction of the scene. For the experiments, a high-overlap drone dataset containing 296 images is processed using Metashape to generate depth maps and DSMs as ground truth. Subsequently, we create a low-overlap dataset by selecting 20 images for experimental evaluation. Results demonstrate that while the recovered depth maps and resulting DSMs achieve meter-level accuracy, they provide significantly better completeness compared to traditional methods, particularly in regions covered by single images. This study showcases the potential of monocular depth estimation in low-overlap aerial photogrammetry.