Lightweight framework for underground pipeline recognition and spatial localization based on multi-view 2D GPR images
作者: Haotian Lv, Chao Li, Jiangbo Dai, Yuhui Zhang, Zepeng Fan, Yiqiu Tan, Dawei Wang, Binglei Xie
分类: cs.CV, cs.AI
发布日期: 2025-12-24
期刊: IEEE Transactions on Geoscience and Remote Sensing, 2025, 63, 5110115
DOI: 10.1109/TGRS.2025.3645032
💡 一句话要点
提出DCO-YOLO框架,解决地下管线多视角GPR图像识别与定位难题
🎯 匹配领域: 支柱六:视频提取与匹配 (Video Extraction)
关键词: 地下管线检测 GPR图像 深度学习 目标检测 多视角融合
📋 核心要点
- 现有3D GPR管线检测方法在多视角特征关联、小目标识别和复杂场景鲁棒性方面存在不足。
- 提出DCO-YOLO框架,融合DySample、CGLU和OutlookAttention机制,增强小尺度管线特征提取能力,并采用3D-DIoU进行多视角特征匹配。
- 实验结果表明,该方法在复杂场景下准确率、召回率和平均精度均值分别提升2.0%、2.1%和0.9%。
📝 摘要(中文)
为解决3D GPR地下管线检测中多视角特征关联性弱、小目标识别精度低以及复杂场景鲁棒性不足等问题,本文提出了一种3D管线智能检测框架。首先,基于B/C/D-Scan三视联合分析策略,通过FDTD正演模拟结果与实际测量数据的交叉验证,建立三维管线三视特征评估方法。其次,提出了DCO-YOLO框架,该框架将DySample、CGLU和OutlookAttention跨维度相关机制集成到原始YOLOv11算法中,显著提高了小尺度管线边缘特征的提取能力。此外,提出了一种3D-DIoU空间特征匹配算法,该算法集成了三维几何约束和中心距离惩罚项,实现了多视角标注的自动关联。三视融合策略解决了单视检测中固有的模糊性。基于真实城市地下管线数据的实验表明,该方法在复杂多管线场景中实现了96.2%的准确率、93.3%的召回率和96.7%的平均精度均值,分别比基线模型高2.0%、2.1%和0.9%。消融实验验证了动态特征增强模块的协同优化效果,Grad-CAM++热图可视化表明改进后的模型显著增强了对管线几何特征的关注能力。本研究将深度学习优化策略与3D GPR的物理特性相结合,为地下管线的智能识别和定位提供了一种高效可靠的新型技术框架。
🔬 方法详解
问题定义:现有基于3D GPR的地下管线检测方法在处理多视角数据时,难以有效关联不同视角下的特征,导致小尺度管线目标的识别精度较低,并且在复杂地下环境中鲁棒性不足。这些问题限制了地下管线检测的准确性和可靠性。
核心思路:本文的核心思路是将深度学习优化策略与3D GPR的物理特性相结合。通过引入跨维度相关机制增强小目标特征提取能力,并利用三维几何约束和中心距离惩罚项实现多视角标注的自动关联,从而提高检测精度和鲁棒性。
技术框架:该框架主要包含以下几个阶段:1) 基于B/C/D-Scan三视联合分析,建立三维管线三视特征评估方法。2) 提出DCO-YOLO框架,用于提取管线特征。3) 采用3D-DIoU空间特征匹配算法,实现多视角标注的自动关联。4) 通过三视融合策略,解决单视检测的模糊性问题。
关键创新:该论文的关键创新在于DCO-YOLO框架的设计,它集成了DySample、CGLU和OutlookAttention跨维度相关机制,显著提升了小尺度管线边缘特征的提取能力。此外,3D-DIoU空间特征匹配算法通过引入三维几何约束和中心距离惩罚项,实现了多视角标注的自动关联,这与传统的特征匹配方法有本质区别。
关键设计:DCO-YOLO框架的关键设计包括:1) DySample动态调整采样策略,关注重要特征。2) CGLU (Contextual Gating and Linear Units) 模块用于增强特征表达能力。3) OutlookAttention机制用于捕捉全局上下文信息。4) 3D-DIoU损失函数,综合考虑了三维几何约束和中心距离,用于优化空间特征匹配。
📊 实验亮点
实验结果表明,所提出的方法在复杂多管线场景中实现了96.2%的准确率、93.3%的召回率和96.7%的平均精度均值,分别比基线模型高2.0%、2.1%和0.9%。消融实验验证了动态特征增强模块的有效性,Grad-CAM++热图可视化结果表明改进后的模型能够更准确地关注管线几何特征。
🎯 应用场景
该研究成果可应用于城市地下管线普查、维护和管理等领域,有助于提高地下管线安全运行水平,减少因管线事故造成的经济损失和社会影响。未来,该技术可进一步推广至其他地下基础设施的检测与定位,例如隧道、电缆等。
📄 摘要(原文)
To address the issues of weak correlation between multi-view features, low recognition accuracy of small-scale targets, and insufficient robustness in complex scenarios in underground pipeline detection using 3D GPR, this paper proposes a 3D pipeline intelligent detection framework. First, based on a B/C/D-Scan three-view joint analysis strategy, a three-dimensional pipeline three-view feature evaluation method is established by cross-validating forward simulation results obtained using FDTD methods with actual measurement data. Second, the DCO-YOLO framework is proposed, which integrates DySample, CGLU, and OutlookAttention cross-dimensional correlation mechanisms into the original YOLOv11 algorithm, significantly improving the small-scale pipeline edge feature extraction capability. Furthermore, a 3D-DIoU spatial feature matching algorithm is proposed, which integrates three-dimensional geometric constraints and center distance penalty terms to achieve automated association of multi-view annotations. The three-view fusion strategy resolves inherent ambiguities in single-view detection. Experiments based on real urban underground pipeline data show that the proposed method achieves accuracy, recall, and mean average precision of 96.2%, 93.3%, and 96.7%, respectively, in complex multi-pipeline scenarios, which are 2.0%, 2.1%, and 0.9% higher than the baseline model. Ablation experiments validated the synergistic optimization effect of the dynamic feature enhancement module and Grad-CAM++ heatmap visualization demonstrated that the improved model significantly enhanced its ability to focus on pipeline geometric features. This study integrates deep learning optimization strategies with the physical characteristics of 3D GPR, offering an efficient and reliable novel technical framework for the intelligent recognition and localization of underground pipelines.