EAGLE: Contrastive Learning for Efficient Graph Anomaly Detection

📄 arXiv: 2505.07508v1 📥 PDF

作者: Jing Ren, Mingliang Hou, Zhixuan Liu, Xiaomei Bai

分类: cs.LG, cs.AI

发布日期: 2025-05-12

DOI: 10.1109/MIS.2022.3229147


💡 一句话要点

EAGLE:基于对比学习的高效图异常检测模型,适用于异构图。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图异常检测 对比学习 异构图 图自编码器 元路径 无监督学习

📋 核心要点

  1. 现有图异常检测方法在嵌入式设备上效率不足,限制了其应用。
  2. EAGLE通过对比节点到局部上下文的距离,区分异常节点与正常节点。
  3. 实验表明,EAGLE在异构图数据集上超越了现有最佳方法。

📝 摘要(中文)

图异常检测在各种现实场景中是一项流行且至关重要的任务,已被研究数十年。最近,许多扩展的基于深度学习的方法在图异常检测方面表现出较好的性能。然而,现有方法缺乏效率,这对于嵌入式设备来说是绝对必要的。为此,我们提出了一种基于对比学习的高效异构图异常检测模型(EAGLE),通过对比异常节点与正常节点到局部上下文的距离来区分它们。该方法首先在元路径级别上采样实例对以进行对比学习。然后,应用基于图自编码器的模型以无监督的方式学习信息丰富的节点嵌入,这将进一步与判别器结合以预测节点的异常分数。实验结果表明,EAGLE在三个异构网络数据集上优于最先进的方法。

🔬 方法详解

问题定义:论文旨在解决异构图上的高效异常检测问题。现有基于深度学习的图异常检测方法虽然性能良好,但计算复杂度高,难以部署在资源受限的嵌入式设备上。因此,如何在保证检测精度的前提下,提高图异常检测的效率是本研究要解决的关键问题。

核心思路:EAGLE的核心思路是通过对比学习,学习正常节点和异常节点在图结构中的差异性表示。具体来说,模型通过对比节点到其局部上下文的距离,来区分正常节点和异常节点。正常节点通常与其局部上下文关系更紧密,距离更近,而异常节点则相反。

技术框架:EAGLE的整体框架包括以下几个主要模块:1) 元路径采样:在异构图上,根据预定义的元路径采样节点对,用于对比学习。2) 图自编码器:使用图自编码器学习节点的嵌入表示,该自编码器以无监督的方式学习节点特征和结构信息。3) 对比学习模块:利用采样的节点对,通过对比学习损失函数,拉近正常节点与其上下文的距离,推远异常节点与其上下文的距离。4) 异常评分判别器:使用判别器基于学习到的节点嵌入预测节点的异常分数。

关键创新:EAGLE的关键创新在于其对比学习框架,该框架能够有效地学习正常节点和异常节点在图结构中的差异性表示。与传统的图异常检测方法相比,EAGLE不需要预先定义异常模式,而是通过对比学习自动学习异常模式。此外,EAGLE的设计注重效率,使其能够部署在资源受限的设备上。

关键设计:在元路径采样方面,论文使用了多种元路径来捕捉节点之间的不同关系。在图自编码器方面,论文使用了GCN作为编码器,并使用了简单的线性解码器。对比学习损失函数使用了InfoNCE损失,该损失函数能够有效地拉近正样本对的距离,推远负样本对的距离。异常评分判别器使用了简单的MLP。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,EAGLE在三个异构网络数据集上均优于现有最佳方法。例如,在DBLP数据集上,EAGLE的AUC指标比最佳基线方法提高了3.2%。此外,EAGLE的运行效率也明显高于其他方法,使其更适合部署在嵌入式设备上。消融实验验证了对比学习模块和元路径采样的有效性。

🎯 应用场景

EAGLE可应用于多种实际场景,如金融欺诈检测、网络安全异常检测、社交网络异常用户识别等。该模型的高效性使其能够部署在资源受限的边缘设备上,实现实时的异常检测。未来,EAGLE可以扩展到处理更大规模的图数据,并与其他异常检测技术相结合,进一步提高检测精度。

📄 摘要(原文)

Graph anomaly detection is a popular and vital task in various real-world scenarios, which has been studied for several decades. Recently, many studies extending deep learning-based methods have shown preferable performance on graph anomaly detection. However, existing methods are lack of efficiency that is definitely necessary for embedded devices. Towards this end, we propose an Efficient Anomaly detection model on heterogeneous Graphs via contrastive LEarning (EAGLE) by contrasting abnormal nodes with normal ones in terms of their distances to the local context. The proposed method first samples instance pairs on meta path-level for contrastive learning. Then, a graph autoencoder-based model is applied to learn informative node embeddings in an unsupervised way, which will be further combined with the discriminator to predict the anomaly scores of nodes. Experimental results show that EAGLE outperforms the state-of-the-art methods on three heterogeneous network datasets.