SubspaceAD: Training-Free Few-Shot Anomaly Detection via Subspace Modeling

📄 arXiv: 2602.23013 📥 PDF

作者: Camile Lendering, Erkut Akdag, Egor Bondarev

分类: cs.CV, cs.LG

发布日期: 2026-04-07


💡 一句话要点

SubspaceAD:基于子空间建模的免训练少样本异常检测方法

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 异常检测 少样本学习 免训练 子空间建模 主成分分析

📋 核心要点

  1. 现有少样本异常检测方法依赖记忆库或微调,复杂度高,SubspaceAD旨在简化流程,探索基础模型特征的潜力。
  2. SubspaceAD利用冻结的DINOv2提取特征,通过PCA建模正常样本的低维子空间,基于重建残差进行异常检测。
  3. SubspaceAD无需训练,在MVTec-AD和VisA数据集上超越现有方法,图像级和像素级AUROC均达到领先水平。

📝 摘要(中文)

在工业检测中,视觉异常检测通常需要在每个类别仅有少量正常图像的情况下进行训练。最近的少样本方法利用基础模型特征取得了显著成果,但通常依赖于记忆库、辅助数据集或视觉-语言模型的多模态微调。鉴于视觉基础模型的特征表示能力,本文质疑这种复杂性是否必要。为此,我们提出了SubspaceAD,一种免训练方法,它在两个简单阶段运行。首先,通过冻结的DINOv2骨干网络从少量正常图像中提取patch级别的特征。其次,将主成分分析(PCA)模型拟合到这些特征,以估计正常变化的低维子空间。在推理时,通过相对于该子空间的重建残差来检测异常,从而产生可解释且具有统计基础的异常分数。尽管其简单性,SubspaceAD在单样本和少样本设置中实现了最先进的性能,无需训练、提示调整或记忆库。在单样本异常检测设置中,SubspaceAD在MVTec-AD数据集上实现了97.1%的图像级AUROC和97.5%的像素级AUROC,在VisA数据集上分别实现了93.4%和98.2%的AUROC,超过了先前的最先进结果。

🔬 方法详解

问题定义:论文旨在解决工业视觉检测中,仅有少量正常样本时,如何高效准确地检测异常的问题。现有方法通常需要复杂的训练流程,例如依赖记忆库、辅助数据集或多模态微调,这增加了计算成本和部署难度。这些方法的痛点在于过度依赖训练数据和复杂的模型结构,而忽略了预训练视觉模型本身所蕴含的强大特征表达能力。

核心思路:论文的核心思路是利用预训练的视觉基础模型(DINOv2)提取图像特征,并通过主成分分析(PCA)对正常样本的特征进行子空间建模。异常样本的特征与正常样本子空间的偏差(即重建误差)越大,则越可能是异常。这种方法的核心在于假设正常样本的特征分布在一个低维子空间内,而异常样本则偏离这个子空间。

技术框架:SubspaceAD的整体流程分为两个阶段:特征提取和异常检测。首先,使用预训练的DINOv2模型提取正常样本图像的patch级别的特征。DINOv2模型被冻结,不进行任何训练。然后,将提取的特征用于训练一个PCA模型,该模型用于估计正常样本特征的低维子空间。在推理阶段,对于待检测的图像,同样提取patch级别的特征,并将其投影到PCA模型学习到的子空间中。计算原始特征与重构特征之间的残差,作为异常得分。

关键创新:SubspaceAD的关键创新在于提出了一种免训练的少样本异常检测方法,它充分利用了预训练视觉基础模型的特征表达能力,避免了复杂的训练流程和额外的资源需求。与现有方法相比,SubspaceAD无需记忆库、辅助数据集或多模态微调,大大简化了异常检测流程。

关键设计:SubspaceAD的关键设计包括:1) 使用DINOv2作为特征提取器,利用其强大的视觉表征能力;2) 使用PCA进行子空间建模,有效降低特征维度并提取正常样本的主要特征;3) 基于重建残差计算异常得分,简单有效且具有统计意义。论文没有特别提及关键的参数设置或损失函数,因为该方法是免训练的。DINOv2的网络结构是预定义的,PCA的参数由正常样本的特征决定。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SubspaceAD在MVTec-AD数据集上取得了显著的性能提升,图像级AUROC达到97.1%,像素级AUROC达到97.5%。在VisA数据集上,图像级AUROC达到93.4%,像素级AUROC达到98.2%。这些结果均超越了现有的最先进方法,证明了SubspaceAD在少样本异常检测任务中的有效性。

🎯 应用场景

SubspaceAD适用于工业制造中的产品缺陷检测、医疗影像分析中的疾病诊断、以及安全监控中的异常事件识别等领域。该方法无需训练,部署简单,能够快速适应新的检测类别,具有很高的实际应用价值。未来,SubspaceAD可以扩展到其他模态的数据,例如声音或时间序列数据,以实现更广泛的异常检测应用。

📄 摘要(原文)

Detecting visual anomalies in industrial inspection often requires training with only a few normal images per category. Recent few-shot methods achieve strong results employing foundation-model features, but typically rely on memory banks, auxiliary datasets, or multi-modal tuning of vision-language models. We therefore question whether such complexity is necessary given the feature representations of vision foundation models. To answer this question, we introduce SubspaceAD, a training-free method, that operates in two simple stages. First, patch-level features are extracted from a small set of normal images by a frozen DINOv2 backbone. Second, a Principal Component Analysis (PCA) model is fit to these features to estimate the low-dimensional subspace of normal variations. At inference, anomalies are detected via the reconstruction residual with respect to this subspace, producing interpretable and statistically grounded anomaly scores. Despite its simplicity, SubspaceAD achieves state-of-the-art performance across one-shot and few-shot settings without training, prompt tuning, or memory banks. In the one-shot anomaly detection setting, SubspaceAD achieves image-level and pixel-level AUROC of 97.1% and 97.5% on the MVTec-AD dataset, and 93.4% and 98.2% on the VisA dataset, respectively, surpassing prior state-of-the-art results. Code and demo are available atthis https URL.