Industrial3D: A Terrestrial LiDAR Point Cloud Dataset and CrossParadigm Benchmark for Industrial Infrastructure

📄 arXiv: 2603.28660v1 📥 PDF

作者: Chao Yin, Hongzhe Yue, Qing Han, Difeng Hu, Zhenyu Liang, Fangzhou Lin, Bing Sun, Boyu Wang, Mingkai Li, Wei Yao, Jack C. P. Cheng

分类: cs.CV

发布日期: 2026-03-30

备注: 49 pages, 8 figure, 14 tables

🔗 代码/项目: GITHUB


💡 一句话要点

提出Industrial3D数据集,用于工业基础设施点云语义理解与跨范式基准测试。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 点云语义分割 工业场景 激光雷达 数据集 基准测试

📋 核心要点

  1. 工业MEP设施点云语义理解面临几何歧义、严重遮挡和类别极度不平衡等挑战,现有架构基准无法充分代表。
  2. 构建了大规模Industrial3D数据集,并建立了首个工业跨范式基准,评估了多种学习范式下的点云语义分割方法。
  3. 实验表明,现有方法在Industrial3D数据集上性能显著下降,揭示了工业场景点云理解中领域迁移和数据不平衡带来的挑战。

📝 摘要(中文)

本文提出了Industrial3D,一个包含来自13个水处理设施的6.12亿个带专家标注的、分辨率为6毫米的地面激光雷达点云数据集。该数据集规模是现有同类MEP数据集的6.6倍,为工业3D场景理解提供了迄今为止最大、最具挑战性的测试平台。此外,本文还建立了首个工业跨范式基准,在统一的基准协议下评估了九种具有代表性的方法,涵盖了完全监督、弱监督、无监督和基础模型设置。最佳监督方法实现了55.74%的mIoU,而零样本Point-SAM仅达到15.79%,存在39.95个百分点的差距,量化了工业TLS数据中未解决的领域迁移挑战。系统分析表明,这种差距源于双重危机:统计稀有性(215:1的不平衡,比S3DIS严重3.5倍)和几何模糊性(尾部类别点与头部类别管道共享圆柱形基元),仅靠基于频率的重加权无法解决。Industrial3D数据集、基准代码和预训练模型将在GitHub上公开。

🔬 方法详解

问题定义:论文旨在解决工业环境中机械、电气和管道(MEP)设施的三维点云语义理解问题。现有方法在处理工业场景的激光雷达数据时,面临着严重的几何歧义、遮挡以及类别不平衡等挑战,导致性能显著下降。现有的建筑数据集(如S3DIS或ScanNet)无法充分代表工业场景的复杂性,因此需要专门的数据集和基准来推动该领域的研究。

核心思路:论文的核心思路是构建一个大规模、高质量的工业场景点云数据集,并在此基础上建立一个跨范式的基准测试,以评估不同学习范式(如完全监督、弱监督、无监督和基础模型)下的点云语义分割方法。通过对不同方法的性能进行比较分析,揭示现有方法在工业场景点云理解中存在的不足,并为未来的研究提供指导。

技术框架:论文的技术框架主要包括以下几个部分:1) 数据采集与标注:使用地面激光雷达扫描仪采集了13个水处理设施的点云数据,并进行了专家标注。2) 数据集构建:将采集到的点云数据整理成Industrial3D数据集,并对数据集的统计特性进行了分析。3) 基准测试建立:选择了九种具有代表性的点云语义分割方法,涵盖了不同的学习范式,并在Industrial3D数据集上进行了评估。4) 性能分析:对不同方法的性能进行了比较分析,并探讨了影响性能的关键因素。

关键创新:论文的关键创新在于:1) 构建了迄今为止规模最大、最具挑战性的工业场景点云数据集Industrial3D。2) 建立了首个工业跨范式基准测试,为不同学习范式下的点云语义分割方法提供了一个公平的评估平台。3) 对现有方法在Industrial3D数据集上的性能进行了深入分析,揭示了工业场景点云理解中存在的挑战。

关键设计:论文的关键设计包括:1) 数据集的规模和分辨率:Industrial3D数据集包含6.12亿个点,分辨率为6毫米,能够充分反映工业场景的细节。2) 类别不平衡的处理:论文分析了Industrial3D数据集的类别不平衡情况,并探讨了基于频率的重加权方法在解决类别不平衡问题上的局限性。3) 基准测试的评估指标:论文使用了mIoU作为评估指标,能够综合反映不同方法的性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,在Industrial3D数据集上,最佳监督方法实现了55.74%的mIoU,而零样本Point-SAM仅达到15.79%,两者之间存在39.95个百分点的差距。这一结果突显了现有方法在工业场景点云理解中面临的领域迁移挑战。同时,数据集的类别不平衡程度远高于S3DIS等现有数据集,对算法的鲁棒性提出了更高的要求。

🎯 应用场景

该研究成果可应用于Scan-to-BIM流程、数字孪生构建和竣工验证等领域,助力建筑行业的数字化转型。通过提升工业场景点云的语义理解能力,可以实现自动化建模、智能巡检、故障诊断等功能,提高生产效率和安全性。未来,该数据集和基准测试可以促进更多针对工业场景的点云处理算法的研究和开发。

📄 摘要(原文)

Automated semantic understanding of dense point clouds is a prerequisite for Scan-to-BIM pipelines, digital twin construction, and as-built verification--core tasks in the digital transformation of the construction industry. Yet for industrial mechanical, electrical, and plumbing (MEP) facilities, this challenge remains largely unsolved: TLS acquisitions of water treatment plants, chiller halls, and pumping stations exhibit extreme geometric ambiguity, severe occlusion, and extreme class imbalance that architectural benchmarks (e.g., S3DIS or ScanNet) cannot adequately represent. We present Industrial3D, a terrestrial LiDAR dataset comprising 612 million expertly labelled points at 6 mm resolution from 13 water treatment facilities. At 6.6x the scale of the closest comparable MEP dataset, Industrial3D provides the largest and most demanding testbed for industrial 3D scene understanding to date. We further establish the first industrial cross-paradigm benchmark, evaluating nine representative methods across fully supervised, weakly supervised, unsupervised, and foundation model settings under a unified benchmark protocol. The best supervised method achieves 55.74% mIoU, whereas zero-shot Point-SAM reaches only 15.79%--a 39.95 percentage-point gap that quantifies the unresolved domain-transfer challenge for industrial TLS data. Systematic analysis reveals that this gap originates from a dual crisis: statistical rarity (215:1 imbalance, 3.5x more severe than S3DIS) and geometric ambiguity (tail-class points share cylindrical primitives with head-class pipes) that frequency-based re-weighting alone cannot resolve. Industrial3D, along with benchmark code and pre-trained models, will be publicly available at https://github.com/pointcloudyc/Industrial3D.