Bounded and Uniform Energy-based Out-of-distribution Detection for Graphs

📄 arXiv: 2504.13429v1 📥 PDF

作者: Shenzhi Yang, Bin Liang, An Liu, Lin Gui, Xingkai Yao, Xiaofang Zhang

分类: cs.LG, cs.AI

发布日期: 2025-04-18

备注: arXiv admin note: text overlap with arXiv:2302.02914 by other authors


💡 一句话要点

NODESAFE:通过有界能量和缓解logit偏移提升图神经网络的OOD节点检测

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 图神经网络 分布外检测 OOD检测 负能量模型 节点分类 异常检测 图数据安全

📋 核心要点

  1. 现有GNN的OOD检测方法,如GNNSAFE,在节点间聚合能量分数时易受极端值影响,导致检测精度下降。
  2. NODESAFE通过引入有界负能量分数和缓解logit偏移的优化项,减少极端分数的生成,提升OOD检测的鲁棒性。
  3. 实验表明,NODESAFE在节点级OOD检测任务中,显著优于现有方法,FPR95指标降低高达28.4%。

📝 摘要(中文)

图结构在现实世界应用中扮演着关键角色,并具有高安全性需求。因此,提高图神经网络(GNNs)检测分布外(OOD)数据的能力是一个紧迫的研究问题。最近的GNNSAFE工作提出了一个基于负能量分数聚合的框架,显著提高了GNNs检测节点级OOD数据的性能。然而,我们的研究发现,由于负能量分数的无界性和logit偏移,节点间的分数聚合容易受到极端值的影响,这严重限制了GNNs检测节点级OOD数据的准确性。在本文中,我们提出了NODESAFE:通过添加两个优化项来减少节点的极端分数生成,使负能量分数有界并减轻logit偏移。实验结果表明,我们的方法显著提高了GNNs在节点级别检测OOD数据的能力。例如,在结构操纵引起的OOD数据检测中,在没有(有)OOD数据暴露的情况下,FPR95指标(越低越好)从当前SOTA降低了28.4%(22.7%)。

🔬 方法详解

问题定义:论文旨在解决图神经网络在节点级别的分布外(OOD)数据检测问题。现有的基于负能量分数聚合的方法,如GNNSAFE,存在一个关键的痛点:由于负能量分数可能无界,且存在logit偏移现象,导致节点间聚合的分数容易受到极端值的影响,从而降低了OOD检测的准确性。这意味着模型容易将正常节点误判为OOD节点,或者反之。

核心思路:NODESAFE的核心思路是通过约束负能量分数的范围,并减轻logit偏移,从而减少极端值的产生。具体来说,论文添加了两个优化项:一个用于限制负能量分数的上下界,使其在一个可控的范围内;另一个用于缓解logit偏移,使得模型对于正常数据的预测更加稳定。通过这种方式,可以提高OOD检测的鲁棒性和准确性。

技术框架:NODESAFE的整体框架可以概括为:首先,使用图神经网络对节点进行嵌入表示;然后,计算每个节点的负能量分数;接着,通过引入两个优化项,对负能量分数进行约束和调整,以减少极端值的产生;最后,使用调整后的负能量分数进行OOD检测。该框架主要包含三个阶段:节点嵌入、能量分数计算与优化、OOD检测。

关键创新:NODESAFE最重要的技术创新点在于引入了两个优化项,分别用于约束负能量分数的范围和缓解logit偏移。这两个优化项的引入,有效地解决了现有方法中存在的极端值问题,从而提高了OOD检测的准确性和鲁棒性。与现有方法的本质区别在于,NODESAFE不仅仅依赖于负能量分数的聚合,而是更加注重对负能量分数本身的约束和调整。

关键设计:NODESAFE的关键设计包括:1) 负能量分数的上下界约束:通过添加一个损失函数,使得负能量分数尽可能地落在预定义的上下界范围内。2) Logit偏移缓解:通过添加一个损失函数,使得模型对于正常数据的预测结果更加稳定,减少logit值的波动。3) 损失函数的权重:需要仔细调整两个优化项的损失函数权重,以平衡约束负能量分数和缓解logit偏移之间的关系。具体的网络结构可以根据具体的图神经网络模型进行选择,例如GCN、GAT等。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,NODESAFE在节点级别的OOD检测任务中取得了显著的性能提升。例如,在结构操纵引起的OOD数据检测中,在没有(有)OOD数据暴露的情况下,FPR95指标从当前SOTA降低了28.4%(22.7%)。这表明NODESAFE能够更准确地识别OOD节点,降低误报率。

🎯 应用场景

NODESAFE可应用于对安全性要求高的图数据场景,如社交网络异常用户检测、金融交易欺诈检测、生物网络异常基因检测等。该研究有助于提高图神经网络在实际应用中的可靠性和安全性,降低因OOD数据带来的风险,具有重要的实际价值和广泛的应用前景。

📄 摘要(原文)

Given the critical role of graphs in real-world applications and their high-security requirements, improving the ability of graph neural networks (GNNs) to detect out-of-distribution (OOD) data is an urgent research problem. The recent work GNNSAFE proposes a framework based on the aggregation of negative energy scores that significantly improves the performance of GNNs to detect node-level OOD data. However, our study finds that score aggregation among nodes is susceptible to extreme values due to the unboundedness of the negative energy scores and logit shifts, which severely limits the accuracy of GNNs in detecting node-level OOD data. In this paper, we propose NODESAFE: reducing the generation of extreme scores of nodes by adding two optimization terms that make the negative energy scores bounded and mitigate the logit shift. Experimental results show that our approach dramatically improves the ability of GNNs to detect OOD data at the node level, e.g., in detecting OOD data induced by Structure Manipulation, the metric of FPR95 (lower is better) in scenarios without (with) OOD data exposure are reduced from the current SOTA by 28.4% (22.7%).