Bi-directional Curriculum Learning for Graph Anomaly Detection: Dual Focus on Homogeneity and Heterogeneity

📄 arXiv: 2501.14197v1 📥 PDF

作者: Yitong Hao, Enbo He, Yue Zhang, Guisheng Yin

分类: cs.LG, cs.SI, stat.ML

发布日期: 2025-01-24

备注: 8pages, 5 figures


💡 一句话要点

提出双向课程学习(BCL)策略,提升图异常检测模型性能。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图异常检测 课程学习 双向学习 同质性 异质性

📋 核心要点

  1. 现有图异常检测方法忽略了节点对训练的不同贡献,平等对待所有节点。
  2. 提出双向课程学习(BCL)策略,分别关注图的同质性和异质性,选择简单样本。
  3. 实验结果表明,BCL能显著提升现有图异常检测模型在多个数据集上的性能。

📝 摘要(中文)

图异常检测(GAD)旨在从图中识别与正常模式显著不同的节点。以往研究多为模型驱动,侧重于通过改进模型结构来增强检测效果。然而,这些方法通常平等对待所有节点,忽略了不同节点对训练的不同贡献。因此,我们引入图课程学习作为一个简单有效的即插即用模块来优化GAD方法。现有的图课程学习主要关注图的同质性,并将具有高同质性的节点视为简单节点。事实上,GAD模型不仅可以处理图的同质性,还可以处理异质性,这导致了现有方法的不适用性。为了解决这个问题,我们提出了一种创新的双向课程学习策略(BCL),该策略分别将与相邻节点具有较高和较低相似度的节点视为关注同质性和关注异质性方向上的简单节点,并优先训练它们。大量实验表明,BCL可以快速集成到现有的检测流程中,并显著提高十个GAD异常检测模型在七个常用数据集上的性能。

🔬 方法详解

问题定义:图异常检测旨在识别图中与正常模式显著不同的节点。现有方法主要集中在改进模型结构上,但忽略了不同节点对模型训练的贡献程度不同。现有图课程学习方法主要关注图的同质性,将高同质性的节点视为简单样本,忽略了图的异质性信息,导致模型训练效率低下。

核心思路:论文的核心思路是提出一种双向课程学习策略(BCL),同时考虑图的同质性和异质性。BCL认为,与邻居节点相似度高的节点(同质性)和相似度低的节点(异质性)都可以被认为是简单样本,应该优先进行训练。通过分别关注同质性和异质性,BCL可以更有效地指导模型学习,提高异常检测的性能。

技术框架:BCL作为一个即插即用模块,可以集成到现有的图异常检测流程中。其主要流程包括:1)计算节点之间的相似度;2)根据相似度,分别在同质性和异质性两个方向上对节点进行排序;3)根据课程学习策略,选择简单样本进行优先训练;4)更新模型参数。该框架可以灵活地与各种图神经网络模型结合使用。

关键创新:BCL最重要的创新点在于其双向课程学习策略,它同时考虑了图的同质性和异质性,并根据不同的学习方向选择简单样本。这与现有的图课程学习方法只关注同质性有本质区别。通过双向学习,BCL可以更全面地利用图结构信息,提高异常检测的准确性和鲁棒性。

关键设计:BCL的关键设计包括:1)相似度度量方式的选择,可以使用余弦相似度、欧氏距离等;2)课程学习策略的选择,可以使用线性递增、指数递增等方式来调整简单样本的比例;3)损失函数的设计,可以采用交叉熵损失、对比损失等。论文中具体使用了何种相似度度量、课程学习策略和损失函数未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,BCL可以显著提高现有图异常检测模型的性能。在七个常用数据集上,BCL能够提升十个GAD模型的检测效果。具体的性能提升数据未知,但论文强调了BCL的有效性和通用性,能够快速集成到现有流程中。

🎯 应用场景

该研究成果可应用于金融风控、社交网络安全、工业异常检测等领域。通过识别图结构中的异常节点,可以有效预防欺诈行为、恶意攻击和设备故障,具有重要的实际应用价值。未来,该方法可以进一步扩展到动态图异常检测、多关系图异常检测等更复杂场景。

📄 摘要(原文)

Graph anomaly detection (GAD) aims to identify nodes from a graph that are significantly different from normal patterns. Most previous studies are model-driven, focusing on enhancing the detection effect by improving the model structure. However, these approaches often treat all nodes equally, neglecting the different contributions of various nodes to the training. Therefore, we introduce graph curriculum learning as a simple and effective plug-and-play module to optimize GAD methods. The existing graph curriculum learning mainly focuses on the homogeneity of graphs and treats nodes with high homogeneity as easy nodes. In fact, GAD models can handle not only graph homogeneity but also heterogeneity, which leads to the unsuitability of these existing methods. To address this problem, we propose an innovative Bi-directional Curriculum Learning strategy (BCL), which considers nodes with higher and lower similarity to neighbor nodes as simple nodes in the direction of focusing on homogeneity and focusing on heterogeneity, respectively, and prioritizes their training. Extensive experiments show that BCL can be quickly integrated into existing detection processes and significantly improves the performance of ten GAD anomaly detection models on seven commonly used datasets.