Label-Efficient Point Cloud Segmentation with Active Learning

📄 arXiv: 2512.05759v1 📥 PDF

作者: Johannes Meyer, Jasper Hoffmann, Felix Schulz, Dominik Merkle, Daniel Buescher, Alexander Reiterer, Joschka Boedecker, Wolfram Burgard

分类: cs.CV, cs.RO

发布日期: 2025-12-05


💡 一句话要点

提出基于2D网格划分和网络集成的点云主动学习分割方法,提升标注效率。

🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)

关键词: 点云分割 主动学习 语义分割 网络集成 不确定性估计

📋 核心要点

  1. 现有3D点云主动学习方法依赖复杂启发式算法分割和选择标注区域,计算成本高,实现复杂。
  2. 提出一种基于2D网格划分点云的简单策略,并使用网络集成估计不确定性,选择待标注数据。
  3. 在多个数据集上的实验表明,该方法性能与现有方法相当甚至更好,且标注区域比标注点数更有效。

📝 摘要(中文)

三维点云数据的语义分割通常伴随着高昂的标注成本。主动学习能够自动选择需要标注的数据,从而减少达到理想性能所需的标注总量。目前三维点云主动学习方法通常依赖于复杂的启发式算法,既用于将点云分割成可标注区域,又用于选择对神经网络训练最有益的区域。本文提出了一种新颖且易于实现的策略来分割点云,利用2D网格将点云划分为列。为了确定下一个需要标注的数据,我们采用网络集成来估计网络输出的不确定性。我们在S3DIS数据集、Toronto-3D数据集以及弗莱堡市的大规模城市三维点云(我们手动标注了部分)上评估了我们的方法。广泛的评估表明,我们的方法在所有数据集上都达到了与复杂的最先进方法相当甚至更好的性能。此外,我们提供的结果表明,在点云的上下文中,标注区域可以成为比标注点数更有意义的主动学习算法的衡量标准。

🔬 方法详解

问题定义:三维点云语义分割需要大量标注数据,成本高昂。现有主动学习方法在选择最具信息量的样本进行标注时,通常采用复杂的启发式算法,导致计算开销大,实现难度高。这些方法在分割点云为可标注区域时也存在效率问题。

核心思路:论文的核心思路是简化点云分割和选择过程。通过将点云投影到2D平面并使用网格划分,可以快速将点云分割成易于标注的列。然后,利用网络集成来估计每个区域的不确定性,选择不确定性最高的区域进行标注。这种方法降低了计算复杂度,并使主动学习过程更加高效。

技术框架:该方法主要包含以下几个阶段:1) 点云预处理;2) 2D网格划分:将点云投影到2D平面,并使用网格将其划分为列;3) 不确定性估计:使用网络集成预测每个网格列的语义标签,并计算预测结果的不确定性;4) 样本选择:选择不确定性最高的网格列进行标注;5) 模型训练:使用新标注的数据重新训练分割模型。

关键创新:该方法的主要创新在于使用2D网格划分简化了点云分割过程,并使用网络集成进行不确定性估计。与复杂的启发式算法相比,这种方法更加简单高效,并且易于实现。此外,论文还提出了使用标注区域作为主动学习算法的衡量标准,而不是传统的标注点数。

关键设计:论文使用了一种标准的点云分割网络作为基础模型。网络集成由多个具有不同初始化的相同网络组成。不确定性通过计算网络集成预测结果的方差或熵来估计。2D网格的大小是一个关键参数,需要根据点云的密度和大小进行调整。损失函数采用标准的交叉熵损失函数。

📊 实验亮点

该方法在S3DIS、Toronto-3D和弗莱堡城市点云数据集上进行了评估,结果表明,该方法性能与复杂的最先进方法相当甚至更好。实验还表明,在点云的上下文中,标注区域可以成为比标注点数更有意义的主动学习算法的衡量标准。具体性能数据在论文中详细给出。

🎯 应用场景

该研究成果可应用于自动驾驶、机器人导航、城市建模等领域。通过主动学习,可以显著减少标注工作量,降低三维场景理解的成本,加速相关技术的落地和应用。尤其是在大规模点云数据处理中,该方法具有重要的实际价值。

📄 摘要(原文)

Semantic segmentation of 3D point cloud data often comes with high annotation costs. Active learning automates the process of selecting which data to annotate, reducing the total amount of annotation needed to achieve satisfactory performance. Recent approaches to active learning for 3D point clouds are often based on sophisticated heuristics for both, splitting point clouds into annotatable regions and selecting the most beneficial for further neural network training. In this work, we propose a novel and easy-to-implement strategy to separate the point cloud into annotatable regions. In our approach, we utilize a 2D grid to subdivide the point cloud into columns. To identify the next data to be annotated, we employ a network ensemble to estimate the uncertainty in the network output. We evaluate our method on the S3DIS dataset, the Toronto-3D dataset, and a large-scale urban 3D point cloud of the city of Freiburg, which we labeled in parts manually. The extensive evaluation shows that our method yields performance on par with, or even better than, complex state-of-the-art methods on all datasets. Furthermore, we provide results suggesting that in the context of point clouds the annotated area can be a more meaningful measure for active learning algorithms than the number of annotated points.