Selective Test-Time Adaptation for Unsupervised Anomaly Detection using Neural Implicit Representations
作者: Sameer Ambekar, Julia A. Schnabel, Cosmin I. Bercea
分类: cs.LG
发布日期: 2024-10-04 (更新: 2024-10-25)
备注: MICCAIw ADSMI 2024 [Best Paper Award]
💡 一句话要点
提出选择性测试时自适应方法,利用神经隐式表示提升无监督异常检测效果
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 无监督异常检测 测试时自适应 神经隐式表示 医学影像分析 选择性自适应
📋 核心要点
- 现有异常检测方法难以适应新的临床环境,直接应用会导致性能下降。
- 利用预训练特征,通过神经隐式表示进行选择性自适应,避免学习到异常。
- 在脑部异常检测任务上,该方法显著提升了脑室扩大和水肿的检测率。
📝 摘要(中文)
医学影像中的深度学习模型在适应训练时未见的新临床环境时面临挑战。测试时自适应为优化模型以适应这些未见领域提供了一种有前景的方法,但其在异常检测(AD)中的应用仍未被充分探索。异常检测旨在有效地识别与正常分布的偏差;然而,包括病理变化的完全自适应可能会无意中学习到它想要检测的异常。我们引入了一种新颖的选择性测试时自适应概念,该概念利用深度预训练特征的固有特性,以零样本方式选择性地适应来自未见领域的任何测试图像。这种方法采用了一个与模型无关的轻量级多层感知器来实现神经隐式表示,从而能够在不改变源训练模型的情况下,自适应任何基于重建的AD方法的输出。在脑部AD中的严格验证表明,我们的策略大大提高了多种条件和不同目标分布的检测精度。具体而言,我们的方法将脑室扩大的检测率提高了高达78%,将水肿的检测率提高了24%。
🔬 方法详解
问题定义:医学图像分析中的异常检测任务,面临着模型在新的临床环境中泛化能力不足的问题。现有的测试时自适应方法如果进行完全自适应,可能会将病理变化也学习到,从而降低异常检测的准确性。因此,如何在测试时自适应的同时,避免学习到异常,是本文要解决的关键问题。
核心思路:本文的核心思路是进行选择性的测试时自适应。具体来说,利用深度预训练特征的固有特性,只对正常样本的特征进行自适应,而避免对异常样本的特征进行调整。这样可以在适应新环境的同时,保持模型对异常的敏感性。
技术框架:整体框架包含以下几个主要步骤:1) 使用预训练的深度学习模型提取图像特征;2) 使用一个轻量级的多层感知器(MLP)来学习神经隐式表示,该MLP将图像坐标作为输入,输出对应的特征向量;3) 在测试时,通过优化MLP的参数,使其能够更好地重建正常样本的特征,从而实现对新环境的自适应。这个过程是选择性的,因为MLP只对正常样本的特征进行优化。
关键创新:本文的关键创新在于提出了选择性测试时自适应的概念,并将其应用于异常检测任务中。与传统的测试时自适应方法不同,本文的方法不是对所有样本的特征进行调整,而是只对正常样本的特征进行优化,从而避免了学习到异常。此外,使用神经隐式表示可以灵活地对特征进行重建和调整,而无需修改原始的预训练模型。
关键设计:本文使用了一个轻量级的MLP作为神经隐式表示的模型。MLP的输入是图像坐标,输出是对应的特征向量。在训练时,MLP的目标是重建正常样本的特征。在测试时,通过优化MLP的参数,使其能够更好地重建新环境中的正常样本的特征。损失函数通常采用均方误差(MSE)或类似的重建损失。具体的网络结构和参数设置需要根据具体的任务和数据集进行调整。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在脑部异常检测任务上取得了显著的性能提升。对于脑室扩大,检测率提高了高达78%;对于水肿,检测率提高了24%。这些结果表明,该方法能够有效地适应新的临床环境,并提高异常检测的准确性。此外,该方法是模型无关的,可以应用于各种基于重建的异常检测方法。
🎯 应用场景
该研究成果可广泛应用于医学影像分析领域,例如脑部疾病诊断、肿瘤检测、眼底病变筛查等。通过提升模型在不同临床环境下的泛化能力,可以减少对大量标注数据的依赖,降低医疗成本,并提高诊断效率和准确性。未来,该方法有望推广到其他类型的异常检测任务中,例如工业缺陷检测、网络安全入侵检测等。
📄 摘要(原文)
Deep learning models in medical imaging often encounter challenges when adapting to new clinical settings unseen during training. Test-time adaptation offers a promising approach to optimize models for these unseen domains, yet its application in anomaly detection (AD) remains largely unexplored. AD aims to efficiently identify deviations from normative distributions; however, full adaptation, including pathological shifts, may inadvertently learn the anomalies it intends to detect. We introduce a novel concept of selective test-time adaptation that utilizes the inherent characteristics of deep pre-trained features to adapt selectively in a zero-shot manner to any test image from an unseen domain. This approach employs a model-agnostic, lightweight multi-layer perceptron for neural implicit representations, enabling the adaptation of outputs from any reconstruction-based AD method without altering the source-trained model. Rigorous validation in brain AD demonstrated that our strategy substantially enhances detection accuracy for multiple conditions and different target distributions. Specifically, our method improves the detection rates by up to 78% for enlarged ventricles and 24% for edemas.