CASL: Curvature-Augmented Self-supervised Learning for 3D Anomaly Detection
作者: Yaohua Zha, Xue Yuerong, Chunlin Fan, Yuansong Wang, Tao Dai, Ke Chen, Shu-Tao Xia
分类: cs.CV
发布日期: 2025-11-17
备注: Accepted to AAAI 2026
🔗 代码/项目: GITHUB
💡 一句话要点
提出CASL:一种曲率增强的自监督学习框架,用于提升3D异常检测性能。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知 (Perception & SLAM)
关键词: 3D异常检测 自监督学习 点云重建 曲率特征 工业制造
📋 核心要点
- 现有3D异常检测方法泛化性不足,而通用自监督模型在异常检测任务中表现欠佳。
- 提出CASL框架,利用多尺度曲率信息指导点云重建,提升模型对异常的敏感度。
- 实验表明,CASL在异常检测任务上取得了领先性能,且具有良好的泛化能力。
📝 摘要(中文)
基于深度学习的3D异常检测方法在工业制造中展现出巨大潜力。然而,许多方法是专门为异常检测任务设计的,限制了它们在其他3D理解任务中的泛化能力。相比之下,自监督点云模型旨在进行通用表示学习,但我们的研究表明,这些经典模型在统一的微调范式下,其异常检测效果并不理想。这促使我们开发一种更通用的3D模型,该模型可以有效地检测异常,而无需依赖于特定于任务的设计。有趣的是,我们发现仅使用每个点的曲率作为其异常分数,就已经优于几种经典的自监督和专用异常检测模型,突出了曲率在3D异常检测中的关键作用。在本文中,我们提出了一种基于重建范式的曲率增强自监督学习(CASL)框架。我们的方法基于经典的U-Net架构,引入了多尺度曲率提示,以指导解码器预测每个点的空间坐标。在不依赖任何专用异常检测机制的情况下,它通过直接的异常分类微调实现了领先的检测性能。此外,学习到的表示可以很好地推广到标准的3D理解任务,例如点云分类。
🔬 方法详解
问题定义:论文旨在解决3D点云异常检测问题。现有方法要么是针对特定任务设计的,泛化能力差;要么是通用的自监督学习方法,但在异常检测任务上的表现不佳。这些方法未能充分利用3D数据的几何特征,特别是曲率信息,导致对细微异常的检测能力不足。
核心思路:论文的核心思路是利用点云的曲率信息来增强自监督学习过程,从而提高模型对异常的敏感度。作者发现,仅使用曲率作为异常评分,就能取得不错的效果,这表明曲率在异常检测中扮演着重要角色。因此,论文提出了一种曲率增强的自监督学习框架,通过将曲率信息融入到点云重建任务中,使模型能够更好地学习点云的结构特征,从而更有效地检测异常。
技术框架:CASL框架基于经典的U-Net架构,采用编码器-解码器结构。编码器负责提取点云的特征表示,解码器负责根据特征表示重建原始点云。为了将曲率信息融入到重建过程中,论文引入了多尺度曲率提示。具体来说,首先计算每个点的曲率值,然后将曲率值作为额外的输入,与编码器的特征表示一起输入到解码器中。解码器在重建点云时,会受到曲率信息的引导,从而更加关注点云的几何细节。
关键创新:论文的关键创新在于将曲率信息融入到自监督学习框架中,从而提高了模型对异常的敏感度。与现有方法相比,CASL不需要专门设计异常检测机制,而是通过通用的点云重建任务来学习点云的结构特征,从而实现高效的异常检测。此外,CASL还引入了多尺度曲率提示,可以更好地捕捉点云的局部几何特征。
关键设计:CASL的关键设计包括:1) 多尺度曲率提示的计算方法,论文采用了不同的尺度来计算曲率,以捕捉不同尺度的几何特征;2) 曲率提示与特征表示的融合方式,论文将曲率值与编码器的特征表示进行拼接,然后输入到解码器中;3) 重建损失函数的选择,论文采用了Chamfer Distance作为重建损失函数,以衡量重建点云与原始点云之间的差异。
📊 实验亮点
实验结果表明,CASL在3D异常检测任务上取得了领先的性能。例如,在MVTec 3D-AD数据集上,CASL的平均AUROC达到了98.5%,显著优于其他自监督学习方法和专门的异常检测方法。此外,CASL在点云分类任务上也表现出良好的泛化能力,证明了其学习到的表示具有通用性。
🎯 应用场景
CASL在工业制造领域具有广泛的应用前景,例如产品质量检测、缺陷识别等。通过检测3D扫描数据中的异常,可以及时发现生产过程中的问题,提高产品质量和生产效率。此外,CASL还可以应用于医疗影像分析、自动驾驶等领域,例如检测医学图像中的病灶、识别自动驾驶场景中的障碍物。
📄 摘要(原文)
Deep learning-based 3D anomaly detection methods have demonstrated significant potential in industrial manufacturing. However, many approaches are specifically designed for anomaly detection tasks, which limits their generalizability to other 3D understanding tasks. In contrast, self-supervised point cloud models aim for general-purpose representation learning, yet our investigation reveals that these classical models are suboptimal at anomaly detection under the unified fine-tuning paradigm. This motivates us to develop a more generalizable 3D model that can effectively detect anomalies without relying on task-specific designs. Interestingly, we find that using only the curvature of each point as its anomaly score already outperforms several classical self-supervised and dedicated anomaly detection models, highlighting the critical role of curvature in 3D anomaly detection. In this paper, we propose a Curvature-Augmented Self-supervised Learning (CASL) framework based on a reconstruction paradigm. Built upon the classical U-Net architecture, our approach introduces multi-scale curvature prompts to guide the decoder in predicting the spatial coordinates of each point. Without relying on any dedicated anomaly detection mechanisms, it achieves leading detection performance through straightforward anomaly classification fine-tuning. Moreover, the learned representations generalize well to standard 3D understanding tasks such as point cloud classification. The code is available at https://github.com/zyh16143998882/CASL.