TACENR: Task-Agnostic Contrastive Explanations for Node Representations

📄 arXiv: 2604.19372v1 📥 PDF

作者: Vasiliki Papanikou, Evaggelia Pitoura

分类: cs.LG, cs.AI

发布日期: 2026-04-21

备注: Accepted at the XAI 2026 Conference. 24 pages, 10 figures


💡 一句话要点

提出TACENR,用于图节点表示的任务无关对比解释

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图神经网络 节点表示学习 可解释性 对比学习 图数据分析

📋 核心要点

  1. 现有图节点表示方法缺乏可解释性,难以理解节点表示的整体结构,阻碍了其在实际应用中的信任度。
  2. TACENR利用对比学习,学习表示空间中的相似性函数,从而识别对节点表示贡献最大的属性、邻近和结构特征。
  3. 实验结果表明,邻近和结构特征对节点表示至关重要,并且TACENR在监督场景下与任务特定方法性能相当。

📝 摘要(中文)

图表示学习在将图结构数据编码到潜在向量空间方面取得了显著成功,从而支持了广泛的下游任务。然而,这些节点表示仍然是不透明且难以解释的。现有的可解释性方法主要集中在监督设置或解释单个表示维度上,在解释节点表示的整体结构方面存在关键差距。本文提出了TACENR(Task-Agnostic Contrastive Explanations for Node Representations),一种局部解释方法,它不仅识别属性特征,还识别在表示空间中贡献最大的邻近和结构特征。TACENR建立在对比学习的基础上,通过对比学习,我们在表示空间中学习相似性函数,揭示哪些特征在节点表示中起重要作用。虽然我们的重点是任务无关的解释,但TACENR也可以应用于监督场景。实验结果表明,邻近和结构特征在塑造节点表示方面起着重要作用,并且我们的监督变体在识别最具影响力的特征方面与现有的任务特定方法具有可比性。

🔬 方法详解

问题定义:现有图节点表示学习方法生成的节点嵌入缺乏可解释性,用户难以理解哪些特征对节点表示起关键作用。现有的解释方法主要集中在监督学习场景或解释单个维度,无法提供节点表示全局结构的解释。因此,需要一种任务无关的方法来解释节点表示,揭示影响节点表示的关键因素。

核心思路:TACENR的核心思路是利用对比学习,在节点表示空间中学习一个相似性函数。通过这个相似性函数,可以识别出对节点表示贡献最大的特征,包括属性特征、邻近特征和结构特征。对比学习能够有效地学习节点之间的关系,从而更好地解释节点表示。

技术框架:TACENR主要包含以下几个阶段:1) 节点表示学习:使用现有的图神经网络或其他方法学习节点的嵌入表示。2) 对比学习:构建正负样本对,通过对比学习训练一个相似性函数,该函数能够衡量节点表示之间的相似度。3) 特征重要性评估:利用学习到的相似性函数,评估不同特征对节点表示的影响,从而识别出最重要的特征。

关键创新:TACENR的关键创新在于其任务无关性。与现有的任务特定解释方法不同,TACENR不需要预先定义下游任务,可以直接用于解释节点表示。此外,TACENR不仅考虑了属性特征,还考虑了邻近特征和结构特征,从而能够更全面地解释节点表示。

关键设计:TACENR的关键设计包括:1) 对比学习损失函数:使用InfoNCE损失函数来训练相似性函数,该损失函数能够有效地区分正负样本对。2) 特征选择方法:使用梯度信息或扰动分析来评估不同特征对相似性函数的影响,从而选择最重要的特征。3) 邻近和结构特征的提取:设计特定的算法来提取节点的邻近和结构特征,例如节点的度、聚类系数等。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,TACENR能够有效地识别对节点表示贡献最大的特征,包括属性特征、邻近特征和结构特征。在监督场景下,TACENR的监督变体与现有的任务特定方法性能相当,甚至在某些情况下优于现有方法。这表明TACENR具有良好的泛化能力和实用价值。

🎯 应用场景

TACENR可应用于多种图数据分析场景,例如社交网络分析、生物网络分析和知识图谱推理。通过解释节点表示,可以帮助用户理解节点之间的关系,发现潜在的模式和规律,从而支持决策制定和知识发现。此外,TACENR还可以用于评估节点表示学习方法的质量,提高模型的可信度和可靠性。

📄 摘要(原文)

Graph representation learning has achieved notable success in encoding graph-structured data into latent vector spaces, enabling a wide range of downstream tasks. However, these node representations remain opaque and difficult to interpret. Existing explainability methods primarily focus on supervised settings or on explaining individual representation dimensions, leaving a critical gap in explaining the overall structure of node representations. In this paper, we propose TACENR (Task-Agnostic Contrastive Explanations for Node Representations), a local explanation method that identifies not only attribute features but also proximity and structural ones that contribute the most in the representation space. TACENR builds on contrastive learning, through which we learn a similarity function in the representation space, revealing which are the features that play an important role in the representation of a node. While our focus is on task-agnostic explanations, TACENR can be applied to supervised scenarios as well. Experimental results demonstrate that proximity and structural features play a significant role in shaping node representations and that our supervised variant performs comparably to existing task-specific approaches in identifying the most impactful features.