Mixture Prototype Flow Matching for Open-Set Supervised Anomaly Detection
作者: Fuyun Wang, Yuanzhi Wang, Xu Guo, Sujia Huang, Tong Zhang, Dan Wang, Hui Yan, Xin Liu, Zhen Cui
分类: cs.CV, cs.LG
发布日期: 2026-05-04
备注: Accepted by ICML 2026
💡 一句话要点
提出混合原型流匹配(MPFM)框架,解决开放集监督异常检测中多模态建模问题。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 开放集异常检测 流匹配 高斯混合模型 原型学习 互信息最大化 异常检测 监督学习
📋 核心要点
- 现有开放集异常检测方法难以捕捉正常数据的多模态特性,导致决策边界模糊,影响检测精度。
- MPFM框架通过学习正常特征到高斯混合原型空间的连续变换,显式建模速度场为高斯混合先验,实现模式感知的分布传输。
- 引入互信息最大化正则化器(MIMR)防止原型崩溃,并提升正常数据与异常数据的可分离性,实验证明MPFM性能领先。
📝 摘要(中文)
开放集监督异常检测(OSAD)旨在利用有限的异常监督来识别未见过的异常。现有的基于原型的方法通常使用单峰高斯先验来建模正常数据,无法捕捉固有的多模态性,导致决策边界模糊。为了解决这个问题,我们提出了混合原型流匹配(MPFM),该框架学习从正常特征分布到结构化高斯混合原型空间的连续变换。与依赖于单个速度向量的传统基于流的方法不同,MPFM将速度场显式地建模为高斯混合先验,其中每个分量对应于一个不同的正常类别。这种设计有助于模式感知和语义连贯的分布传输。此外,我们引入了互信息最大化正则化器(MIMR)来防止原型崩溃并最大化正常-异常可分离性。大量实验表明,MPFM在单异常和多异常设置下的各种基准测试中都实现了最先进的性能。
🔬 方法详解
问题定义:开放集监督异常检测(OSAD)旨在仅使用少量异常样本来识别未知的异常样本。现有基于原型的方法通常假设正常数据服从单峰高斯分布,这无法捕捉到正常数据的多模态特性,导致模型对正常数据的表示不够准确,最终影响异常检测的性能。决策边界因此变得模糊,难以区分正常和异常样本。
核心思路:MPFM的核心思路是将正常数据的特征分布通过一个连续的变换映射到一个结构化的高斯混合原型空间。这个变换过程通过流匹配(Flow Matching)来实现,但与传统方法不同的是,MPFM将速度场建模为一个高斯混合模型,每个高斯分量对应一个不同的正常类别。这样可以更好地捕捉正常数据的多模态特性,并实现模式感知的分布传输。
技术框架:MPFM框架主要包含以下几个关键模块:1) 特征提取器:用于提取输入数据的特征表示。2) 流匹配模块:学习一个连续的变换,将正常数据的特征分布映射到高斯混合原型空间。该模块的核心是学习一个速度场,该速度场由一个高斯混合模型表示。3) 高斯混合原型空间:由多个高斯原型组成,每个原型代表一个不同的正常类别。4) 异常评分模块:计算输入样本与高斯混合原型空间之间的距离,作为异常评分。
关键创新:MPFM的关键创新在于:1) 使用高斯混合模型来建模速度场,从而实现模式感知的分布传输。这与传统的流匹配方法使用单一速度向量有本质区别。2) 引入互信息最大化正则化器(MIMR)来防止原型崩溃,并最大化正常-异常可分离性。MIMR鼓励原型之间的差异性,并促使原型更好地代表其对应的正常类别。
关键设计:MPFM的关键设计包括:1) 高斯混合模型的参数设置:需要确定高斯分量的数量、均值和方差。2) 互信息最大化正则化器的设计:需要选择合适的互信息估计方法,并调整正则化系数。3) 异常评分函数的选择:可以选择基于距离的评分函数,例如马氏距离或欧氏距离。4) 网络结构:特征提取器和流匹配模块可以使用各种神经网络结构,例如卷积神经网络或Transformer。
🖼️ 关键图片
📊 实验亮点
MPFM在多个基准数据集上取得了state-of-the-art的性能。例如,在单异常设置下,MPFM在CIFAR-10数据集上相比现有最佳方法提升了超过2%。在多异常设置下,MPFM同样表现出色,证明了其在复杂场景下的有效性。MIMR正则化器的引入显著提升了模型的性能,验证了其在防止原型崩溃和提高可分离性方面的作用。
🎯 应用场景
MPFM在工业异常检测、医疗图像分析、金融欺诈检测等领域具有广泛的应用前景。通过准确识别异常数据,可以帮助企业提高生产效率、降低运营成本、保障产品质量,在医疗领域辅助医生进行疾病诊断,在金融领域有效防范欺诈风险。该研究的未来影响在于推动开放集异常检测技术的发展,使其在更多实际场景中得到应用。
📄 摘要(原文)
Open-set supervised anomaly detection (OSAD) aims to identify unseen anomalies using limited anomalous supervision. However, existing prototype-based methods typically model normal data via a unimodal Gaussian prior, failing to capture inherent multi-modality and resulting in blurred decision boundaries. To address this, we propose Mixture Prototype Flow Matching (MPFM), a framework that learns a continuous transformation from normal feature distributions to a structured Gaussian mixture prototype space. Departing from traditional flow-based approaches that rely on a single velocity vector, MPFM explicitly models the velocity field as a Gaussian mixture prior where each component corresponds to a distinct normal class. This design facilitates mode-aware and semantically coherent distribution transport. Furthermore, we introduce a Mutual Information Maximization Regularizer (MIMR) to prevent prototype collapse and maximize normal-anomaly separability. Extensive experiments demonstrate that MPFM achieves state-of-the-art performance across diverse benchmarks under both single- and multi-anomaly settings.