Graph Alignment via Dual-Pass Spectral Encoding and Latent Space Communication

📄 arXiv: 2509.09597v2 📥 PDF

作者: Maysam Behmanesh, Erkan Turan, Maks Ovsjanikov

分类: cs.LG, cs.AI, cs.CV

发布日期: 2025-09-11 (更新: 2025-09-27)

备注: 23 pages


💡 一句话要点

提出双通道谱编码与潜在空间通信的图对齐框架,提升节点区分性并保证几何一致性。

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting)

关键词: 图对齐 谱编码 潜在空间 几何感知 函数映射

📋 核心要点

  1. 现有图对齐方法受限于GNN的过平滑问题,导致节点区分性降低,难以准确识别对应节点。
  2. 论文提出双通道谱编码器,结合低通和高通滤波器,生成既有结构感知又具区分性的节点嵌入。
  3. 引入几何感知函数映射模块,学习图嵌入间的双射等距变换,保证潜在空间几何关系一致性,实验效果显著。

📝 摘要(中文)

图对齐是识别多个图之间对应节点的问题,在众多应用中至关重要。现有无监督方法通常将节点特征嵌入到潜在表示中,以实现无需真实对应关系的跨图比较。然而,这些方法存在两个主要局限:基于GNN的嵌入导致过平滑,降低了节点区分性;结构噪声、特征异构性和训练不稳定性导致潜在空间错位,最终导致节点对应关系不可靠。我们提出了一种新的图对齐框架,该框架同时增强节点区分性并强制潜在空间中的几何一致性。我们的方法引入了一个双通道编码器,它结合了低通和高通谱滤波器,以生成既具有结构感知能力又具有高度区分性的嵌入。为了解决潜在空间错位问题,我们结合了一个几何感知函数映射模块,该模块学习图嵌入之间的双射和等距变换,从而确保不同表示之间的一致几何关系。在图基准上的大量实验表明,我们的方法始终优于现有的无监督对齐基线,对结构不一致和具有挑战性的对齐场景表现出卓越的鲁棒性。此外,在使用各种预训练模型对视觉-语言基准进行的全面评估表明,我们的框架有效地推广到图领域之外,从而能够对视觉和语言表示进行无监督对齐。

🔬 方法详解

问题定义:图对齐旨在识别多个图结构中具有对应关系的节点。现有无监督图对齐方法依赖于将节点嵌入到潜在空间,然后进行跨图比较。然而,这些方法容易受到GNN的过平滑影响,导致节点特征区分度降低,难以区分相似节点。此外,不同图之间的结构噪声、特征异构性以及训练过程的不稳定性会导致潜在空间错位,使得学习到的节点对应关系不可靠。

核心思路:论文的核心思路是同时解决节点区分性不足和潜在空间错位问题。通过设计双通道谱编码器来增强节点特征的区分性,并利用几何感知函数映射模块来对齐不同图的潜在空间。这种双管齐下的方法旨在提高图对齐的准确性和鲁棒性。

技术框架:该框架包含两个主要模块:双通道谱编码器和几何感知函数映射模块。首先,双通道谱编码器利用低通和高通滤波器提取节点特征,生成既具有结构感知能力又具有高度区分性的嵌入。然后,几何感知函数映射模块学习不同图嵌入之间的双射和等距变换,从而对齐潜在空间。整个流程旨在建立更准确和鲁棒的节点对应关系。

关键创新:该论文的关键创新在于同时关注节点区分性和潜在空间对齐。双通道谱编码器的设计能够有效缓解过平滑问题,增强节点特征的区分度。几何感知函数映射模块则通过学习双射和等距变换,保证了不同图的潜在空间具有一致的几何关系。这种结合使得该方法在图对齐任务中表现出色。

关键设计:双通道谱编码器使用低通滤波器来捕获图的全局结构信息,同时使用高通滤波器来保留节点特征的局部细节。几何感知函数映射模块通过最小化几何失真来学习双射和等距变换。损失函数的设计旨在平衡节点区分性和潜在空间对齐,从而实现最佳的图对齐性能。具体的网络结构和参数设置根据不同的数据集和任务进行调整。

📊 实验亮点

实验结果表明,该方法在多个图对齐基准数据集上显著优于现有无监督方法。例如,在结构不一致性较强的图上,该方法表现出更强的鲁棒性。此外,该方法还成功应用于视觉-语言表示的无监督对齐,证明了其良好的泛化能力。具体性能提升幅度根据数据集和对比基线而有所不同,但总体而言,该方法在准确性和鲁棒性方面均有显著提升。

🎯 应用场景

该研究成果可广泛应用于社交网络分析、生物信息学、知识图谱融合等领域。例如,在社交网络中,可以用于识别不同平台上的相同用户;在生物信息学中,可以用于对齐不同物种的蛋白质相互作用网络;在知识图谱中,可以用于融合来自不同来源的知识。该研究有助于提升跨图信息整合和分析的能力,具有重要的实际价值和广阔的应用前景。

📄 摘要(原文)

Graph alignment, the problem of identifying corresponding nodes across multiple graphs, is fundamental to numerous applications. Most existing unsupervised methods embed node features into latent representations to enable cross-graph comparison without ground-truth correspondences. However, these methods suffer from two critical limitations: the degradation of node distinctiveness due to oversmoothing in GNN-based embeddings, and the misalignment of latent spaces across graphs caused by structural noise, feature heterogeneity, and training instability, ultimately leading to unreliable node correspondences. We propose a novel graph alignment framework that simultaneously enhances node distinctiveness and enforces geometric consistency across latent spaces. Our approach introduces a dual-pass encoder that combines low-pass and high-pass spectral filters to generate embeddings that are both structure-aware and highly discriminative. To address latent space misalignment, we incorporate a geometry-aware functional map module that learns bijective and isometric transformations between graph embeddings, ensuring consistent geometric relationships across different representations. Extensive experiments on graph benchmarks demonstrate that our method consistently outperforms existing unsupervised alignment baselines, exhibiting superior robustness to structural inconsistencies and challenging alignment scenarios. Additionally, comprehensive evaluation on vision-language benchmarks using diverse pretrained models shows that our framework effectively generalizes beyond graph domains, enabling unsupervised alignment of vision and language representations.