Generalist Graph Anomaly Detection via Prototype-Based Distillation

作者: Yiming Xu, Zihan Chen, Zhen Peng, Song Wang, Bin Shi, Bo Dong, Chao Shen

分类: cs.LG

发布日期: 2026-05-26

备注: Accepted by ICML 2026

💡 一句话要点

提出ProMoS，一种基于原型蒸馏的通用图异常检测无监督框架

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture)

关键词: 图异常检测 无监督学习 知识蒸馏 原型学习 零样本学习

📋 核心要点

现有通用图异常检测方法依赖标注数据或少样本支持，限制了对未知异常的鲁棒性。
ProMoS通过知识蒸馏，从自监督GNN教师模型中提取正常性先验知识到学生模型，实现无监督学习。
实验表明ProMoS在零样本异常检测中有效且高效，无需标注数据即可泛化到新图。

📝 摘要（中文）

针对高风险领域中图异常检测(GAD)的迫切需求，通用GAD范式（训练单个检测器，可迁移到新图）日益受到关注。然而，现有方法通常依赖于稀缺且昂贵的标注进行训练，有时甚至需要在推理时进行少样本支持，这限制了它们对各种未见过的异常模式的鲁棒性。为了解决这个限制，我们引入了ProMoS，这是第一个无监督通用GAD框架，它通过建模未标记数据中丰富的正常性来检测异常。ProMoS采用知识蒸馏范式，将来自冻结的自监督图神经网络(GNN)教师的正常性先验知识提炼到具有共享全局和轻量级个性化分支的混合学生模型中，从而无需从头开始学习即可实现高效且富有表现力的正常性建模。我们进一步提出了原型引导的软标签蒸馏，以在共享原型空间中对齐教师和学生，从而增强跨图泛化能力。在推理过程中，ProMoS通过蒸馏偏差和原型几何偏差对未见过的图执行零样本异常检测。大量实验表明了ProMoS的有效性和效率，为无标签、零样本通用GAD开辟了一条切实可行的道路。

🔬 方法详解

问题定义：现有的通用图异常检测方法主要依赖于有监督学习或少样本学习，需要大量的标注数据或者在推理阶段提供少量带标签的样本。这在实际应用中存在局限性，因为异常样本通常难以获取，且标注成本高昂。此外，现有方法在面对未知的异常模式时，泛化能力较弱。

核心思路：ProMoS的核心思路是通过无监督学习的方式，建模图数据的正常模式，并利用知识蒸馏技术，将正常模式的先验知识从一个预训练的教师模型传递到一个学生模型。学生模型通过学习正常模式的表示，从而能够区分正常节点和异常节点。该方法无需任何标注数据，即可实现零样本的图异常检测。

技术框架：ProMoS框架主要包含三个部分：一个预训练的自监督GNN教师模型，一个混合学生模型，以及一个原型引导的软标签蒸馏模块。教师模型负责提取图数据的通用特征表示，学生模型负责学习正常模式的表示，原型引导的软标签蒸馏模块负责将教师模型的知识传递给学生模型。在推理阶段，通过计算节点在学生模型中的表示与正常原型之间的距离，来判断节点是否为异常节点。

关键创新：ProMoS的关键创新在于提出了一个基于原型引导的软标签蒸馏方法，用于将教师模型的知识传递给学生模型。该方法通过在原型空间中对齐教师模型和学生模型的表示，从而增强了学生模型的泛化能力。此外，ProMoS是第一个无监督的通用图异常检测框架，无需任何标注数据即可实现零样本的图异常检测。

关键设计：ProMoS使用一个预训练的自监督GNN（例如GraphCL）作为教师模型。学生模型采用混合结构，包含一个共享的全局分支和一个轻量级的个性化分支，以兼顾通用性和适应性。原型引导的软标签蒸馏损失函数旨在最小化教师模型和学生模型在原型空间中的KL散度。推理时，利用蒸馏偏差（distillation bias）和原型几何偏差（prototype geometric deviation）来判断异常。

🖼️ 关键图片

📊 实验亮点

ProMoS在多个图异常检测数据集上进行了实验，结果表明ProMoS在零样本设置下，显著优于现有的无监督和少样本图异常检测方法。例如，在某些数据集上，ProMoS的AUC指标比最佳基线方法提高了10%以上，证明了其有效性和泛化能力。

🎯 应用场景

ProMoS可应用于金融欺诈检测、网络安全异常检测、社交网络异常行为识别等领域。该方法无需标注数据，降低了应用成本，并提高了对未知异常的检测能力。未来，该研究可扩展到更大规模的图数据，并与其他异常检测技术相结合，进一步提高检测精度。

📄 摘要（原文）

Driven by the pressing demand for graph anomaly detection (GAD) in high-stakes domains, the generalist GAD paradigm, which trains a single detector transferable across new graphs, has recently gained growing attention. However, existing methods often rely on scarce and costly annotations for training and sometimes even require few-shot support at inference, which limits their robustness to diverse and unseen anomaly patterns. To address this limitation, we introduce ProMoS, the first unsupervised generalist GAD framework, which detects anomalies by modeling the abundant normality in unlabeled data. ProMoS adopts a knowledge-distillation paradigm to distill normality priors from a frozen self-supervised graph neural network (GNN) teacher to a mixture-of-students model with shared global and lightweight personalized branches, enabling efficient and expressive normality modeling without learning from scratch. We further propose prototype-guided soft-label distillation to align teacher and student in a shared prototype space, enhancing cross-graph generalizability. During inference, ProMoS performs zero-shot anomaly detection on unseen graphs via distillation bias and prototype geometric deviation. Extensive experiments show the effectiveness and efficiency of ProMoS, charting a practical path toward label-free, zero-shot generalist GAD.

Generalist Graph Anomaly Detection via Prototype-Based Distillation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理