Rethinking Dimensional Rationale in Graph Contrastive Learning from Causal Perspective

📄 arXiv: 2312.10401v3 📥 PDF

作者: Qirui Ji, Jiangmeng Li, Jie Hu, Rui Wang, Changwen Zheng, Fanjiang Xu

分类: cs.LG, cs.AI

发布日期: 2023-12-16 (更新: 2024-04-08)

备注: Accepted by AAAI2024

🔗 代码/项目: GITHUB


💡 一句话要点

提出维度理性图对比学习方法,从因果视角提升图表示的判别性和迁移性

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图对比学习 维度理性 因果推断 元学习 图神经网络

📋 核心要点

  1. 现有图对比学习方法侧重于结构理性,可能导致模型误学习噪声和任务无关的信息,干扰图预测。
  2. 论文提出维度理性感知的图对比学习方法,通过可学习网络获取维度理性,并施加冗余减少约束。
  3. 实验表明,该方法在判别性和迁移性方面优于现有方法,并在多个基准测试中取得了显著的性能提升。

📝 摘要(中文)

图对比学习是一种通用的学习范式,擅长从图的各种扰动中捕获不变信息。最近的研究侧重于探索图的结构理性,从而提高不变信息的可区分性。然而,这些方法可能导致图模型在图的可解释性方面出现误学习,从而使学习到的噪声和任务无关的信息干扰图的预测。为此,为了探索图的内在理性,我们相应地提出从图中捕获维度理性,而这在文献中尚未得到充分重视。探索性实验证明了上述路线图的可行性。为了阐明维度理性带来的性能提升背后的内在机制,我们从因果角度重新思考图对比学习中的维度理性,并进一步形式化预训练阶段变量之间的因果关系,以构建相应的结构因果模型。在理解结构因果模型的基础上,我们提出了一种维度理性感知的图对比学习方法,该方法引入了一个可学习的维度理性获取网络和一个冗余减少约束。可学习的维度理性获取网络通过利用双层元学习技术进行更新,而冗余减少约束在学习过程中通过去相关过程解开冗余特征。经验表明,与最先进的方法相比,我们的方法在判别性和可迁移性方面可以在各种基准测试中产生显著的性能提升。该方法的代码实现在https://github.com/ByronJi/DRGCL。

🔬 方法详解

问题定义:现有图对比学习方法主要关注图的结构信息,忽略了维度信息的重要性。这种过度依赖结构信息可能导致模型学习到噪声和任务无关的特征,从而影响模型的泛化能力和预测性能。因此,如何有效地利用图的维度信息,提升图表示的质量,是一个亟待解决的问题。

核心思路:论文的核心思路是从因果角度出发,重新审视图对比学习中的维度理性。通过构建结构因果模型,显式地建模维度信息与图表示之间的因果关系,从而指导模型的学习过程。具体而言,论文提出了一种维度理性感知的图对比学习方法,该方法旨在学习对下游任务更有用的维度特征,并减少冗余信息。

技术框架:该方法主要包含两个核心模块:维度理性获取网络和冗余减少约束。维度理性获取网络负责从图中提取维度信息,并将其融入到图表示中。该网络通过双层元学习技术进行训练,以适应不同的下游任务。冗余减少约束则通过去相关过程,减少图表示中冗余特征的影响,从而提高模型的泛化能力。整体流程为:首先,利用维度理性获取网络提取维度信息;然后,将维度信息与结构信息融合,得到增强的图表示;最后,通过对比学习目标和冗余减少约束,优化模型参数。

关键创新:该方法的关键创新在于从因果角度审视图对比学习中的维度理性,并提出了维度理性获取网络和冗余减少约束。与现有方法相比,该方法能够更有效地利用图的维度信息,并减少冗余特征的影响,从而提高图表示的质量。此外,利用双层元学习训练维度理性获取网络,使其能够适应不同的下游任务,增强了模型的迁移能力。

关键设计:维度理性获取网络的设计采用了可学习的架构,可以根据不同的图结构和任务自适应地调整维度信息的提取方式。冗余减少约束通过计算特征之间的协方差矩阵,并对其进行正则化,从而减少冗余特征的影响。双层元学习的目标是最小化验证集上的损失,从而找到最优的维度理性获取网络参数。损失函数包括对比学习损失和冗余减少损失,通过平衡这两个损失,可以同时提高模型的判别性和泛化能力。

📊 实验亮点

实验结果表明,该方法在多个图分类和节点分类基准数据集上取得了显著的性能提升。例如,在某些数据集上,该方法相比于最先进的基线方法,准确率提升了5%以上。此外,实验还验证了该方法在迁移学习场景下的有效性,表明其具有良好的泛化能力。消融实验证明了维度理性获取网络和冗余减少约束的有效性。

🎯 应用场景

该研究成果可应用于各种图相关的任务,例如社交网络分析、生物信息学、知识图谱推理等。通过提升图表示的质量,可以提高这些任务的性能,例如更准确地预测用户行为、发现新的药物靶点、进行更有效的知识推理。该研究还有助于提升图神经网络的可解释性,为图数据的分析和应用提供更深入的理解。

📄 摘要(原文)

Graph contrastive learning is a general learning paradigm excelling at capturing invariant information from diverse perturbations in graphs. Recent works focus on exploring the structural rationale from graphs, thereby increasing the discriminability of the invariant information. However, such methods may incur in the mis-learning of graph models towards the interpretability of graphs, and thus the learned noisy and task-agnostic information interferes with the prediction of graphs. To this end, with the purpose of exploring the intrinsic rationale of graphs, we accordingly propose to capture the dimensional rationale from graphs, which has not received sufficient attention in the literature. The conducted exploratory experiments attest to the feasibility of the aforementioned roadmap. To elucidate the innate mechanism behind the performance improvement arising from the dimensional rationale, we rethink the dimensional rationale in graph contrastive learning from a causal perspective and further formalize the causality among the variables in the pre-training stage to build the corresponding structural causal model. On the basis of the understanding of the structural causal model, we propose the dimensional rationale-aware graph contrastive learning approach, which introduces a learnable dimensional rationale acquiring network and a redundancy reduction constraint. The learnable dimensional rationale acquiring network is updated by leveraging a bi-level meta-learning technique, and the redundancy reduction constraint disentangles the redundant features through a decorrelation process during learning. Empirically, compared with state-of-the-art methods, our method can yield significant performance boosts on various benchmarks with respect to discriminability and transferability. The code implementation of our method is available at https://github.com/ByronJi/DRGCL.