Learning Transferable Negative Prompts for Out-of-Distribution Detection
作者: Tianqi Li, Guansong Pang, Xiao Bai, Wenjun Miao, Jin Zheng
分类: cs.CV
发布日期: 2024-04-04
备注: Accepted at CVPR 2024
🔗 代码/项目: GITHUB
💡 一句话要点
提出NegPrompt以解决OOD检测中的假阳性问题
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 分布外检测 负提示学习 开放词汇学习 图像分类 深度学习
📋 核心要点
- 现有方法在OOD检测中缺乏有效的负样本,导致高假阳性率。
- NegPrompt通过学习负提示来划定ID与OOD图像的边界,且仅依赖ID数据。
- 实验表明,NegPrompt在多个ImageNet基准上超越了现有方法,尤其在困难的OOD检测中表现优异。
📝 摘要(中文)
现有的提示学习方法在分布外(OOD)检测中表现出一定能力,但由于目标数据集中缺乏OOD图像,导致OOD图像与内部分布(ID)类别之间的不匹配,从而产生高假阳性率。为了解决这一问题,本文提出了一种新颖的OOD检测方法NegPrompt,旨在学习一组负提示,每个负提示代表给定类别标签的负面含义,以划定ID和OOD图像之间的边界。该方法仅依赖ID数据进行负提示的学习,无需外部异常数据。此外,当前方法假设所有ID类别样本均可用,这在推理阶段可能包含训练时未出现的新ID类别时显得无效。相较之下,我们学习的负提示可迁移到新类别标签。实验结果表明,NegPrompt在各种ImageNet基准测试中超越了现有的基于提示学习的OOD检测方法,并在封闭和开放词汇分类场景中的困难OOD检测中保持领先。
🔬 方法详解
问题定义:本文旨在解决现有OOD检测方法在缺乏OOD样本时导致的高假阳性率问题。现有方法通常依赖于所有ID类别的样本,这在开放词汇学习场景中显得不够有效。
核心思路:NegPrompt的核心思想是通过学习一组负提示来明确区分ID和OOD图像,这些负提示是基于ID数据生成的,避免了对外部OOD数据的依赖。
技术框架:该方法的整体架构包括负提示的生成模块和分类模块。首先,通过对ID数据进行分析,生成负提示;然后,利用这些负提示进行OOD检测。
关键创新:NegPrompt的主要创新在于其负提示的可迁移性,使得在推理阶段能够处理未见过的新ID类别,这一特性在现有方法中是缺乏的。
关键设计:在技术细节上,NegPrompt采用特定的损失函数来优化负提示的学习过程,并设计了适应性强的网络结构,以确保其在不同场景下的有效性。具体的参数设置和网络结构细节在论文中有详细描述。
📊 实验亮点
实验结果显示,NegPrompt在多个ImageNet基准测试中表现优异,尤其在困难的OOD检测任务中,相较于现有的最先进方法,假阳性率显著降低,提升幅度达到XX%。
🎯 应用场景
该研究的潜在应用领域包括自动驾驶、医疗影像分析和安全监控等场景,能够有效提高模型在未知环境下的鲁棒性和准确性。未来,该方法有望推动OOD检测技术的发展,提升智能系统的安全性和可靠性。
📄 摘要(原文)
Existing prompt learning methods have shown certain capabilities in Out-of-Distribution (OOD) detection, but the lack of OOD images in the target dataset in their training can lead to mismatches between OOD images and In-Distribution (ID) categories, resulting in a high false positive rate. To address this issue, we introduce a novel OOD detection method, named 'NegPrompt', to learn a set of negative prompts, each representing a negative connotation of a given class label, for delineating the boundaries between ID and OOD images. It learns such negative prompts with ID data only, without any reliance on external outlier data. Further, current methods assume the availability of samples of all ID classes, rendering them ineffective in open-vocabulary learning scenarios where the inference stage can contain novel ID classes not present during training. In contrast, our learned negative prompts are transferable to novel class labels. Experiments on various ImageNet benchmarks show that NegPrompt surpasses state-of-the-art prompt-learning-based OOD detection methods and maintains a consistent lead in hard OOD detection in closed- and open-vocabulary classification scenarios. Code is available at https://github.com/mala-lab/negprompt.