Deep Learning for Crack Detection: A Review of Learning Paradigms, Generalizability, and Datasets

📄 arXiv: 2508.10256v2 📥 PDF

作者: Xinan Zhang, Haolin Wang, Yung-An Hsieh, Zhongyu Yang, Anthony Yezzi, Yi-Chang Tsai

分类: cs.CV

发布日期: 2025-08-14 (更新: 2025-09-17)

备注: under review

🔗 代码/项目: GITHUB


💡 一句话要点

综述深度学习裂缝检测:学习范式、泛化性与数据集分析

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 裂缝检测 深度学习 综述 泛化性 数据集 半监督学习 弱监督学习

📋 核心要点

  1. 现有裂缝检测方法在泛化性和数据依赖性方面存在挑战,难以适应复杂场景和新领域。
  2. 本文系统性地回顾了深度学习在裂缝检测中的应用,重点关注学习范式、泛化性和数据集的演变趋势。
  3. 论文贡献了一个新的3D裂缝数据集3DCrack,并对常用深度学习方法进行了基准测试,为未来研究提供参考。

📝 摘要(中文)

裂缝检测在土木基础设施(包括路面、建筑物等检测)中起着至关重要的作用,近年来深度学习显著推动了该领域的发展。虽然该领域已存在大量技术论文和综述,但新兴趋势正在重塑格局。这些转变包括学习范式的演变(从完全监督学习到半监督、弱监督、无监督、小样本、领域自适应和微调基础模型),泛化性的提升(从单数据集性能到跨数据集评估),以及数据集获取的多样化(从RGB图像到基于专用传感器的数据)。本综述系统地分析了这些趋势并重点介绍了代表性工作。此外,我们引入了一个使用3D激光扫描收集的新标注数据集3DCrack,以支持未来的研究,并进行了广泛的基准实验,为常用的深度学习方法(包括最近的基础模型)建立基线。我们的发现为基于深度学习的裂缝检测的演进方法和未来方向提供了见解。

🔬 方法详解

问题定义:现有裂缝检测方法通常依赖于大量标注数据,且在不同场景下的泛化能力有限。痛点在于如何减少对标注数据的依赖,并提高模型在不同数据集和环境下的鲁棒性。

核心思路:本文的核心思路是系统性地分析深度学习在裂缝检测中的应用,并关注学习范式、泛化性和数据集的演变趋势。通过分析不同学习范式(如半监督、弱监督等)的优缺点,以及不同数据集的特点,为研究者提供指导。

技术框架:本文主要是一个综述性质的工作,没有提出新的技术框架。但是,它对现有方法进行了分类和总结,并分析了它们的优缺点。此外,论文还介绍了一个新的3D裂缝数据集3DCrack,并进行了基准测试。

关键创新:本文的创新点在于对深度学习裂缝检测领域的最新进展进行了系统性的总结和分析,并提出了未来研究方向。此外,3DCrack数据集的发布也为该领域的研究提供了新的资源。

关键设计:本文没有涉及具体的模型设计或参数设置。但是,论文对不同学习范式(如半监督、弱监督等)的适用场景进行了分析,并对不同数据集的特点进行了总结。这些分析可以为研究者在选择合适的模型和数据集时提供参考。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文贡献了3DCrack数据集,并对常用深度学习方法进行了基准测试。这些基准测试结果为未来研究提供了参考,可以帮助研究者评估新方法的性能,并选择合适的模型和参数。具体性能数据未知,但论文强调了对包括最新基础模型在内的深度学习方法进行了基准测试。

🎯 应用场景

该研究成果可广泛应用于土木工程领域,例如桥梁、道路、建筑物的裂缝检测与维护。通过提升裂缝检测的自动化和智能化水平,可以降低人工检测成本,提高检测效率和准确性,从而保障基础设施的安全运行,具有重要的实际应用价值和深远的社会影响。

📄 摘要(原文)

Crack detection plays a crucial role in civil infrastructures, including inspection of pavements, buildings, etc., and deep learning has significantly advanced this field in recent years. While numerous technical and review papers exist in this domain, emerging trends are reshaping the landscape. These shifts include transitions in learning paradigms (from fully supervised learning to semi-supervised, weakly-supervised, unsupervised, few-shot, domain adaptation and fine-tuning foundation models), improvements in generalizability (from single-dataset performance to cross-dataset evaluation), and diversification in dataset acquisition (from RGB images to specialized sensor-based data). In this review, we systematically analyze these trends and highlight representative works. Additionally, we introduce a new annotated dataset collected with 3D laser scans, 3DCrack, to support future research and conduct extensive benchmarking experiments to establish baselines for commonly used deep learning methodologies, including recent foundation models. Our findings provide insights into the evolving methodologies and future directions in deep learning-based crack detection. Project page: https://github.com/nantonzhang/Awesome-Crack-Detection