GFM4GA: Graph Foundation Model for Group Anomaly Detection

📄 arXiv: 2601.10193v1 📥 PDF

作者: Jiujiu Chen, Weijun Zeng, Shaofeng Hu, Sihong Xie, Hui Xiong

分类: cs.AI

发布日期: 2026-01-15


💡 一句话要点

提出GFM4GA:用于群体异常检测的图基础模型,解决小样本学习难题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 图神经网络 图基础模型 群体异常检测 对比学习 小样本学习

📋 核心要点

  1. 现有群体异常检测方法难以应对多样化的异常模式,且标注成本高昂,限制了其应用。
  2. GFM4GA通过双层对比学习预训练,捕捉群体异常结构和特征不一致性,提升模型泛化能力。
  3. 实验结果表明,GFM4GA在AUROC和AUPRC指标上显著优于现有方法,提升效果明显。

📝 摘要(中文)

群体异常检测在许多网络应用中至关重要,但面临着多样化异常模式的挑战。受自然语言处理中大型语言模型(LLMs)成功的启发,图基础模型(GFMs)被提出以处理标签数据较少的小样本学习任务。GFMs已成功应用于个体异常检测,但无法推广到群体异常,因为群体异常模式必须作为一个整体来检测,并且异常群体中的个体可能看起来相当正常。因此,我们提出GFM4GA,一种用于群体异常检测的新型图基础模型。该流程通过基于特征估计和群体提取的双层对比学习进行预训练,以捕获潜在的群体异常结构和特征不一致性。在下游任务中,该流程在参数约束和群体异常比例加权的少样本设置中进行微调,并通过标记的异常邻居确定的群体上下文来扩展其对未见过的群体异常的适应能力。实验表明,GFM4GA超越了群体异常检测器和用于个体异常的GFM,在AUROC和AUPRC方面平均提高了2.85%和2.55%。

🔬 方法详解

问题定义:论文旨在解决群体异常检测问题,现有方法难以有效识别群体异常,因为群体异常需要作为一个整体进行识别,且异常群体中的个体可能表现正常。此外,现有方法通常需要大量的标注数据,标注成本高昂。

核心思路:论文的核心思路是利用图基础模型(GFM)的预训练能力,通过对比学习捕获群体异常的潜在结构和特征不一致性。通过预训练,模型能够学习到通用的图结构和节点特征表示,从而在下游任务中仅需少量标注数据即可实现有效的群体异常检测。

技术框架:GFM4GA包含预训练和微调两个阶段。在预训练阶段,采用双层对比学习,分别基于特征估计和群体提取进行对比学习,以学习群体异常的结构和特征表示。在微调阶段,采用参数约束和群体异常比例加权的少样本学习设置,并利用标记的异常邻居确定的群体上下文来增强模型的适应能力。

关键创新:GFM4GA的关键创新在于其双层对比学习预训练策略,该策略能够有效地捕获群体异常的结构和特征不一致性。此外,GFM4GA还采用了参数约束和群体异常比例加权的少样本学习设置,以及基于异常邻居的群体上下文增强方法,进一步提升了模型的性能。

关键设计:预训练阶段的双层对比学习包括:1) 基于特征的对比学习,旨在区分正常节点和异常节点;2) 基于群体的对比学习,旨在区分正常群体和异常群体。微调阶段,采用参数约束,限制模型参数的变化范围,防止过拟合。群体异常比例加权损失函数,平衡不同类别样本的贡献。基于异常邻居的群体上下文增强,利用邻居信息提升模型对异常群体的识别能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,GFM4GA在群体异常检测任务上显著优于现有的群体异常检测器和用于个体异常的GFM。具体来说,GFM4GA在AUROC指标上平均提高了2.85%,在AUPRC指标上平均提高了2.55%。这些结果表明,GFM4GA能够有效地捕获群体异常的结构和特征不一致性,并具有良好的泛化能力。

🎯 应用场景

GFM4GA可应用于金融欺诈检测、社交网络异常行为识别、工业设备故障诊断等领域。通过检测异常群体,可以及时发现潜在的风险和威胁,保障系统安全和稳定运行。该研究有助于降低人工标注成本,提高异常检测效率,具有重要的实际应用价值。

📄 摘要(原文)

Group anomaly detection is crucial in many network applications, but faces challenges due to diverse anomaly patterns. Motivated by the success of large language models (LLMs) in natural language processing, graph foundation models (GFMs) is proposed to handle few-shot learning task with fewer labeling efforts. GFMs have been successfully applied to detection of individual anomalies but cannot be generalized to group anomalies, as group anomaly patterns must be detected as a whole and individuals in an abnormal group can look rather normal. Therefore, we propose GFM4GA, a novel graph foundation model for group anomaly detection. The pipeline is pretrained via dual-level contrastive learning based on feature-based estimation and group extraction, to capture potential group anomaly structure and feature inconsistencies. In the downstream tasks, the pipeline is finetuned in parameter-constrained and group-anomaly-proportion weighted few-shot settings, and its adaptive ability to unseen group anomalies expanded via group contexts determined by labeled anomaly neighbors. Experiments show that GFM4GA surpasses group anomaly detectors and GFMs for individual anomalies, achieving average improvements of 2.85% in AUROC and 2.55% in AUPRC.