What Are Good Positional Encodings for Directed Graphs?

📄 arXiv: 2407.20912v2 📥 PDF

作者: Yinan Huang, Haoyu Wang, Pan Li

分类: cs.LG

发布日期: 2024-07-30 (更新: 2024-10-04)

🔗 代码/项目: GITHUB


💡 一句话要点

针对有向图,提出Multi-q磁拉普拉斯位置编码以提升图神经网络性能

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting)

关键词: 有向图 位置编码 图神经网络 磁拉普拉斯 Walk Profile

📋 核心要点

  1. 现有位置编码方法在有向图上的表现力不足,难以捕捉有向图特有的结构信息,例如walk profile。
  2. 提出Multi-q磁拉普拉斯位置编码,通过引入多个势因子扩展磁拉普拉斯特征向量,从而有效表达有向图的walk profile。
  3. 实验证明,该方法在排序网络可满足性问题和通用电路基准测试中表现出色,验证了其有效性和优越性。

📝 摘要(中文)

位置编码(PEs)对于构建强大且富有表现力的图神经网络和图Transformer至关重要,因为它们有效地捕捉了节点之间的相对空间关系。虽然在无向图的PE方面已经进行了广泛的研究,但有向图的PE仍然相对未被探索。这项工作旨在解决这一差距。我们首先介绍了Walk Profile的概念,它是针对有向图的walk-counting序列的推广。Walk Profile包含许多对于有向图相关应用至关重要的结构特征,例如程序分析和电路性能预测。我们发现了现有PE方法在表示Walk Profile方面的局限性,并提出了一种新的Multi-q磁拉普拉斯PE,它通过结合多个势因子来扩展基于磁拉普拉斯特征向量的PE。新的PE可以被证明能够表达Walk Profile。此外,我们推广了先前的基不变神经网络,以实现新的PE在复数域中的稳定使用。我们的数值实验验证了所提出的PE的表现力,并证明了它们在解决排序网络可满足性问题和在通用电路基准测试中表现良好。

🔬 方法详解

问题定义:论文旨在解决有向图神经网络中位置编码不足的问题。现有位置编码方法,特别是为无向图设计的,无法充分捕捉有向图的关键结构信息,例如不同长度和方向的路径信息(Walk Profile)。这限制了图神经网络在处理有向图相关任务时的性能,例如程序分析和电路性能预测。现有方法无法有效区分具有不同walk profile的节点,导致信息传递受阻。

核心思路:论文的核心思路是设计一种能够有效表达有向图walk profile的位置编码。Walk profile包含了节点之间不同长度和方向的路径信息,是描述有向图结构的关键特征。为了捕捉这些信息,论文扩展了磁拉普拉斯位置编码,引入了多个势因子(Multi-q),从而能够更全面地描述节点之间的关系。这种设计使得新的位置编码能够区分具有不同walk profile的节点,从而提升图神经网络的性能。

技术框架:整体框架包括以下几个主要步骤:1) 定义有向图的Walk Profile,作为目标表达的结构信息。2) 构建Multi-q磁拉普拉斯矩阵,该矩阵通过引入多个势因子来扩展传统的磁拉普拉斯矩阵。3) 计算Multi-q磁拉普拉斯矩阵的特征向量,作为节点的位置编码。4) 将位置编码输入到基不变神经网络中进行训练和预测。为了保证位置编码在复数域中的稳定使用,论文还推广了先前的基不变神经网络。

关键创新:最重要的技术创新点在于Multi-q磁拉普拉斯位置编码的设计。与传统的磁拉普拉斯位置编码相比,Multi-q方法引入了多个势因子,从而能够更全面地捕捉有向图的walk profile。这种设计使得新的位置编码能够区分具有不同walk profile的节点,从而提升图神经网络的表达能力。此外,论文还推广了基不变神经网络,使其能够稳定地处理复数域的位置编码。

关键设计:Multi-q磁拉普拉斯位置编码的关键设计在于势因子的选择和数量(q)。论文中具体如何选择和设置这些参数未知。此外,基不变神经网络的推广也需要仔细设计,以保证其在复数域中的稳定性和有效性。损失函数和网络结构的选择也需要根据具体的应用场景进行调整。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,所提出的Multi-q磁拉普拉斯位置编码在排序网络可满足性问题和通用电路基准测试中表现出色。具体性能数据未知,但论文强调了该方法在这些任务上的有效性,并验证了其优于现有位置编码方法的潜力。代码已开源,方便研究人员复现和进一步研究。

🎯 应用场景

该研究成果可广泛应用于需要处理有向图数据的领域,例如程序分析(漏洞检测、代码优化)、电路性能预测(时序分析、功耗估计)、知识图谱推理、社交网络分析等。通过更有效地捕捉有向图的结构信息,可以提升相关任务的性能,并为未来的图神经网络研究提供新的思路。

📄 摘要(原文)

Positional encodings (PEs) are essential for building powerful and expressive graph neural networks and graph transformers, as they effectively capture the relative spatial relationships between nodes. Although extensive research has been devoted to PEs in undirected graphs, PEs for directed graphs remain relatively unexplored. This work seeks to address this gap. We first introduce the notion of Walk Profile, a generalization of walk-counting sequences for directed graphs. A walk profile encompasses numerous structural features crucial for directed graph-relevant applications, such as program analysis and circuit performance prediction. We identify the limitations of existing PE methods in representing walk profiles and propose a novel Multi-q Magnetic Laplacian PE, which extends the Magnetic Laplacian eigenvector-based PE by incorporating multiple potential factors. The new PE can provably express walk profiles. Furthermore, we generalize prior basis-invariant neural networks to enable the stable use of the new PE in the complex domain. Our numerical experiments validate the expressiveness of the proposed PEs and demonstrate their effectiveness in solving sorting network satisfiability and performing well on general circuit benchmarks. Our code is available at https://github.com/Graph-COM/Multi-q-Maglap.