Explaining Temporal Graph Predictions With Shapley Values
作者: Lea-Marie Sussek, Stefan Heindorf
分类: cs.LG
发布日期: 2026-04-27
💡 一句话要点
提出基于Shapley值的时序图神经网络可解释性方法
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 时序图神经网络 可解释性 Shapley值 Owen值 模型解释 图神经网络 局部解释
📋 核心要点
- 现有的时序图神经网络缺乏可解释性,难以理解模型预测的依据,可能导致模型偏差或错误。
- 论文提出基于Shapley值的事件级别和特征级别解释器,用于理解TGNN的预测行为和特征重要性。
- 实验表明,提出的解释器优于现有方法,并能发现TGAT实现中时间戳提取的错误,提升模型理解。
📝 摘要(中文)
时序图神经网络(TGNNs)近年来因其结合空间和时间信息而具有卓越的预测性能而日益普及。然而,这些模型如何利用信息进行预测的研究相对较少,这可能导致模型存在缺陷或偏差。本文提出了两种新的模型无关的解释器,用于TGNN的局部解释,它们基于Shapley值和Owen值。第一种方法是事件级别(边级别)的Shapley解释器,它应用KernelSHAP算法来估计单个时序事件的贡献分数,从而为模型行为提供可解释的描述。第二种方法是特征级别的Shapley解释器,它通过将事件级别的Shapley值分解为Owen值来扩展此框架,从而揭示事件及其特征的层次依赖关系。解释器在不同的指标和数据集上优于SOTA解释器。此外,特征解释器揭示了常用TGAT实现中实际时间戳提取的错误,有助于进一步理解非常稀疏解释时的性能下降。
🔬 方法详解
问题定义:时序图神经网络(TGNNs)在预测任务中表现出色,但其内部机制复杂,缺乏可解释性。现有方法难以理解TGNN如何利用时序信息进行预测,这限制了模型的可信度和调试能力。论文旨在解决TGNN的可解释性问题,特别是针对局部预测的解释。
核心思路:论文的核心思路是利用Shapley值来量化每个时序事件和特征对TGNN预测结果的贡献。Shapley值是一种博弈论概念,能够公平地分配合作博弈中每个参与者的贡献。通过计算事件级别和特征级别的Shapley值,可以揭示哪些事件和特征对模型的预测起关键作用。
技术框架:论文提出了两种解释器:事件级别Shapley解释器和特征级别Shapley解释器。事件级别解释器使用KernelSHAP算法来估计每个时序事件的贡献分数。特征级别解释器进一步将事件级别的Shapley值分解为Owen值,从而揭示事件和特征之间的层次依赖关系。整体流程包括:1) 输入时序图数据和TGNN模型;2) 使用KernelSHAP计算事件级别的Shapley值;3) 使用Owen值分解事件级别的Shapley值,得到特征级别的贡献分数。
关键创新:论文的关键创新在于将Shapley值和Owen值应用于时序图神经网络的可解释性分析。与现有方法相比,该方法能够提供更细粒度的解释,不仅可以解释哪些事件重要,还可以解释哪些特征重要。此外,该方法是模型无关的,可以应用于各种TGNN模型。
关键设计:事件级别解释器使用KernelSHAP算法,需要定义一个合适的核函数来衡量不同事件组合之间的相似度。特征级别解释器使用Owen值分解,需要定义特征之间的层次结构。具体实现中,论文使用了常用的TGAT模型,并针对其时间戳提取的错误进行了分析。损失函数方面,主要关注Shapley值的准确性和解释的有效性。
🖼️ 关键图片
📊 实验亮点
实验结果表明,提出的解释器在不同的指标和数据集上优于现有方法。特征解释器成功揭示了常用TGAT实现中时间戳提取的错误,解释器能够有效识别对预测结果影响最大的事件和特征,为模型调试和优化提供了重要依据。
🎯 应用场景
该研究成果可应用于金融风控、社交网络分析、交通预测等领域。通过解释TGNN的预测结果,可以提高模型的可信度,辅助决策者理解模型背后的逻辑,并发现潜在的模型偏差或错误。未来,该方法可以扩展到其他类型的图神经网络和时序数据分析任务。
📄 摘要(原文)
Temporal Graph Neural Networks (TGNNs) have become increasingly popular in recent years due to their superior predictive performance by combining both spatial and temporal information. However, how these models utilize the information to make predictions is rather unexplored, leading to potentially faulty or biased models. This work introduces two novel model-agnostic explainers for local explanations of TGNNs based on Shapley and Owen values. The first method, an event-level (edge-level) Shapley explainer, applies the KernelSHAP algorithm to estimate contribution scores for individual temporal events, providing interpretable descriptions for model behavior. The second, a feature-level Shapley explainer, extends this framework by decomposing event-level Shapley values into Owen values, and thereby uncovers hierarchical dependencies of the event and its features. The explainers outperform SOTA explainers on different metrics and datasets. Additionally, the Feature Explainer reveals a faulty extraction of actual timestamps of a commonly used TGAT implementation, helping to further understand performance drops on very sparse explanations.