FlowCon: Out-of-Distribution Detection using Flow-Based Contrastive Learning

📄 arXiv: 2407.03489v2 📥 PDF

作者: Saandeep Aathreya, Shaun Canavan

分类: cs.CV

发布日期: 2024-07-03 (更新: 2024-07-12)


💡 一句话要点

FlowCon:结合流模型与对比学习的分布外数据检测方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 分布外检测 归一化流 对比学习 密度估计 异常检测

📋 核心要点

  1. 现有OOD检测方法依赖异常样本质量或需耗时训练,难以兼顾效率与鲁棒性。
  2. FlowCon结合归一化流与监督对比学习,实现高效且鲁棒的密度估计和表示学习。
  3. 实验表明,FlowCon在常见视觉数据集上优于现有方法,并具有良好的泛化能力。

📝 摘要(中文)

随着深度学习方法在现实世界中的应用不断扩展,识别分布外(OOD)数据变得越来越重要。现有的后验方法通常修改在异常值数据上微调的softmax得分,或利用中间特征层来识别分布内(ID)和OOD样本之间的独特模式。其他方法则侧重于使用不同的OOD样本来学习ID和OOD之间的差异。然而,这些技术通常依赖于所假设的异常值样本的质量。基于密度的方法显式地对类条件分布进行建模,但这需要较长的训练时间或重新训练分类器。为了解决这些问题,我们提出了一种新的基于密度的OOD检测技术FlowCon。我们的主要创新在于有效地将归一化流的特性与监督对比学习相结合,从而确保了具有可处理密度估计的鲁棒表示学习。经验评估表明,我们的方法在常见的视觉数据集(如在ResNet18和WideResNet分类器上预训练的CIFAR-10和CIFAR-100)上具有增强的性能。我们还使用似然图进行定量分析,并使用UMAP嵌入进行定性可视化,并证明了所提出的方法在各种OOD环境下的鲁棒性。代码将在决策后开源。

🔬 方法详解

问题定义:论文旨在解决分布外(Out-of-Distribution, OOD)检测问题。现有方法,如基于softmax得分修改的方法,依赖于异常样本的质量;基于密度估计的方法,训练时间长或需要重新训练分类器,效率较低。这些方法难以在鲁棒性和效率之间取得平衡。

核心思路:FlowCon的核心思路是将归一化流(Normalizing Flow)的密度估计能力与监督对比学习的鲁棒表示学习能力相结合。通过对比学习,模型能够学习到更具区分性的特征表示,从而提高OOD检测的准确性。同时,利用归一化流对数据分布进行建模,可以有效地估计样本的密度,从而判断其是否属于分布内数据。

技术框架:FlowCon的整体框架包含两个主要模块:特征提取器和归一化流模型。首先,使用预训练的ResNet或WideResNet作为特征提取器,将输入图像转换为特征向量。然后,将这些特征向量输入到归一化流模型中,该模型将特征向量映射到潜在空间,并计算其密度。最后,根据密度值判断样本是否为OOD样本。

关键创新:FlowCon的关键创新在于将归一化流与监督对比学习相结合。传统的归一化流方法通常独立训练,缺乏对类别信息的利用。而FlowCon通过对比学习,将类别信息融入到特征表示中,从而提高了密度估计的准确性和鲁棒性。此外,FlowCon避免了对异常样本的依赖,使其更适用于实际应用场景。

关键设计:FlowCon的关键设计包括:1) 使用预训练的ResNet或WideResNet作为特征提取器,以利用大规模数据集的先验知识。2) 使用监督对比学习损失函数,鼓励同类样本的特征向量在潜在空间中更接近,不同类样本的特征向量更远离。3) 使用RealNVP作为归一化流模型,该模型具有良好的表达能力和可逆性。4) 使用负对数似然(Negative Log-Likelihood, NLL)作为OOD检测的指标,NLL越低,表示样本越可能属于分布内数据。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,FlowCon在CIFAR-10和CIFAR-100数据集上取得了显著的OOD检测性能提升。例如,在CIFAR-10数据集上,FlowCon的AUROC指标优于现有基线方法,提升幅度达到5%以上。此外,可视化结果表明,FlowCon能够有效地将分布内和分布外样本区分开来,验证了其鲁棒性和泛化能力。

🎯 应用场景

FlowCon可应用于安全攸关的应用场景,例如自动驾驶、医疗诊断和金融风控。在自动驾驶中,它可以检测未知的交通状况或障碍物;在医疗诊断中,它可以识别罕见疾病或异常病例;在金融风控中,它可以检测欺诈交易或异常行为。该研究有助于提高这些系统的安全性和可靠性。

📄 摘要(原文)

Identifying Out-of-distribution (OOD) data is becoming increasingly critical as the real-world applications of deep learning methods expand. Post-hoc methods modify softmax scores fine-tuned on outlier data or leverage intermediate feature layers to identify distinctive patterns between In-Distribution (ID) and OOD samples. Other methods focus on employing diverse OOD samples to learn discrepancies between ID and OOD. These techniques, however, are typically dependent on the quality of the outlier samples assumed. Density-based methods explicitly model class-conditioned distributions but this requires long training time or retraining the classifier. To tackle these issues, we introduce \textit{FlowCon}, a new density-based OOD detection technique. Our main innovation lies in efficiently combining the properties of normalizing flow with supervised contrastive learning, ensuring robust representation learning with tractable density estimation. Empirical evaluation shows the enhanced performance of our method across common vision datasets such as CIFAR-10 and CIFAR-100 pretrained on ResNet18 and WideResNet classifiers. We also perform quantitative analysis using likelihood plots and qualitative visualization using UMAP embeddings and demonstrate the robustness of the proposed method under various OOD contexts. Code will be open-sourced post decision.