NoiseHGNN: Synthesized Similarity Graph-Based Neural Network For Noised Heterogeneous Graph Representation Learning

📄 arXiv: 2412.18267v1 📥 PDF

作者: Xiong Zhang, Cheng Xie, Haoran Duan, Beibei Yu

分类: cs.LG

发布日期: 2024-12-24

备注: AAAI2025

🔗 代码/项目: GITHUB


💡 一句话要点

提出NoiseHGNN以解决有噪声的异构图表示学习问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 异构图 图神经网络 噪声处理 相似性图 表示学习 深度学习 数据挖掘

📋 核心要点

  1. 现有方法在处理有噪声的异构图时面临重大挑战,传统的相似性图合成方法无法有效纠正噪声。
  2. 本文提出的NoiseHGNN通过合成相似性图来增强异构图的表示能力,利用相似性感知编码器进行嵌入。
  3. 在多个真实数据集上进行的实验表明,该方法在有噪声的异构图学习任务中实现了5%至6%的性能提升,超越了现有的最先进方法。

📝 摘要(中文)

现实世界的图数据环境中固有噪声(如链接和结构错误),不可避免地影响图表示和下游学习任务的有效性。针对异构图,本文提出了一种新颖的基于合成相似性图的图神经网络NoiseHGNN。该方法首先计算所有节点的原始特征相似性,以合成高阶相似性图。然后,提出了一种相似性感知编码器,使用共享参数嵌入原始图和合成图。通过同步监督原始图和合成图的嵌入来预测相同标签,最终在多个真实数据集上实现了最先进的性能。

🔬 方法详解

问题定义:本文旨在解决有噪声的异构图表示学习问题。现有方法主要基于同质图的假设,无法有效处理异构图中相似节点缺乏直接链接的情况。

核心思路:NoiseHGNN通过计算节点的原始特征相似性来合成高阶相似性图,进而利用相似性感知编码器对原始图和合成图进行嵌入,克服了传统方法的局限性。

技术框架:整体架构包括两个主要模块:相似性图合成模块和相似性感知编码器。首先,计算所有节点的特征相似性,合成高阶相似性图;然后,使用共享参数的编码器对原始图和合成图进行嵌入,并进行同步监督。

关键创新:最重要的创新点在于提出了一种新的合成相似性图生成方法,能够有效处理异构图中的噪声问题,与现有方法相比,显著提升了图表示的准确性。

关键设计:在参数设置上,采用共享参数的编码器设计,以减少模型复杂度;损失函数设计为同步监督原始图和合成图的嵌入,确保模型学习到的特征具有一致性。整体网络结构经过优化,以适应异构图的特性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

在多个真实数据集上的实验结果表明,NoiseHGNN在有噪声的异构图学习任务中实现了显著的性能提升,相较于之前的最先进方法,提升幅度达5%至6%。这些结果展示了该方法在处理复杂图数据时的有效性和优越性。

🎯 应用场景

该研究在社交网络分析、推荐系统和生物信息学等领域具有广泛的应用潜力。通过有效处理有噪声的异构图数据,NoiseHGNN能够提升信息提取和模式识别的准确性,为实际应用提供更可靠的支持。未来,该方法可能推动更多复杂图数据分析任务的发展。

📄 摘要(原文)

Real-world graph data environments intrinsically exist noise (e.g., link and structure errors) that inevitably disturb the effectiveness of graph representation and downstream learning tasks. For homogeneous graphs, the latest works use original node features to synthesize a similarity graph that can correct the structure of the noised graph. This idea is based on the homogeneity assumption, which states that similar nodes in the homogeneous graph tend to have direct links in the original graph. However, similar nodes in heterogeneous graphs usually do not have direct links, which can not be used to correct the original noise graph. This causes a significant challenge in noised heterogeneous graph learning. To this end, this paper proposes a novel synthesized similarity-based graph neural network compatible with noised heterogeneous graph learning. First, we calculate the original feature similarities of all nodes to synthesize a similarity-based high-order graph. Second, we propose a similarity-aware encoder to embed original and synthesized graphs with shared parameters. Then, instead of graph-to-graph supervising, we synchronously supervise the original and synthesized graph embeddings to predict the same labels. Meanwhile, a target-based graph extracted from the synthesized graph contrasts the structure of the metapath-based graph extracted from the original graph to learn the mutual information. Extensive experiments in numerous real-world datasets show the proposed method achieves state-of-the-art records in the noised heterogeneous graph learning tasks. In highlights, +5$\sim$6\% improvements are observed in several noised datasets compared with previous SOTA methods. The code and datasets are available at https://github.com/kg-cc/NoiseHGNN.