Prior-Informed Flow Matching for Graph Reconstruction

📄 arXiv: 2601.22107v1 📥 PDF

作者: Harvey Chen, Nicolas Zilberstein, Santiago Segarra

分类: cs.LG

发布日期: 2026-01-29


💡 一句话要点

提出Prior-Informed Flow Matching (PIFM)用于图重建,提升重建精度。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 图重建 流匹配 图嵌入 生成模型 结构先验

📋 核心要点

  1. 现有图嵌入方法缺乏全局一致性,生成模型难以有效利用结构先验知识。
  2. PIFM结合了基于嵌入的先验知识与连续时间流匹配,实现更精确的图重建。
  3. 实验表明,PIFM能够有效提升经典嵌入方法的性能,并在图重建精度上超越现有方法。

📝 摘要(中文)

本文提出了一种名为Prior-Informed Flow Matching (PIFM)的条件流模型,用于图重建。从部分观测中重建图仍然是一个关键挑战;经典的嵌入方法通常缺乏全局一致性,而现代生成模型难以整合结构先验。PIFM通过将基于嵌入的先验与连续时间流匹配相结合,弥合了这一差距。该方法基于置换等变版本的失真-感知理论,首先使用诸如图子或GraphSAGE/node2vec之类的先验,基于局部信息形成邻接矩阵的知情初始估计。然后,它应用修正的流匹配来细化此估计,将其传输到干净图的真实分布,并学习全局耦合。在不同数据集上的实验表明,PIFM始终增强了经典嵌入,在重建精度方面优于它们和最先进的生成基线。

🔬 方法详解

问题定义:论文旨在解决从部分观测数据中重建图结构的问题。现有方法,如传统图嵌入方法,往往缺乏全局一致性,难以捕捉图的整体结构信息。而现代生成模型虽然具备强大的生成能力,但在图重建任务中,难以有效利用已知的图结构先验知识,导致重建效果不佳。

核心思路:PIFM的核心思路是将图嵌入方法提供的局部结构信息作为先验知识,融入到连续时间流匹配模型中。通过这种方式,模型可以在生成图结构的过程中,同时利用局部信息和全局信息,从而提高图重建的准确性和一致性。该方法基于失真-感知理论,旨在找到一个从先验分布到目标分布的平滑映射。

技术框架:PIFM的整体框架包含两个主要阶段:先验估计阶段和流匹配阶段。在先验估计阶段,利用诸如GraphSAGE或node2vec等图嵌入方法,从部分观测数据中提取节点的局部结构信息,并基于这些信息构建邻接矩阵的初始估计。在流匹配阶段,利用连续时间流匹配模型,将初始估计逐步refined,使其逼近真实的图结构分布。该模型学习一个时间依赖的向量场,将先验分布平滑地转换为目标分布。

关键创新:PIFM的关键创新在于将图嵌入方法与连续时间流匹配模型相结合,从而实现了对图结构先验知识的有效利用。与传统的图生成模型相比,PIFM能够更好地利用已知的图结构信息,从而提高图重建的准确性和一致性。此外,PIFM还引入了置换等变性,保证了模型对节点顺序的不变性。

关键设计:PIFM的关键设计包括:1) 使用图嵌入方法(如GraphSAGE、node2vec)生成邻接矩阵的初始估计;2) 使用连续时间流匹配模型学习从初始估计到真实图结构的映射;3) 引入置换等变性,保证模型对节点顺序的不变性;4) 使用修正的流匹配损失函数,优化模型的训练过程。具体的损失函数设计和网络结构细节在论文中有详细描述,但摘要中未明确给出。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,PIFM在多个数据集上均优于传统的图嵌入方法和最先进的生成模型。具体而言,PIFM能够显著提高图重建的准确性,并能够更好地捕捉图的全局结构信息。虽然摘要中没有给出具体的性能数据和提升幅度,但强调了PIFM在不同数据集上的一致性提升。

🎯 应用场景

PIFM可应用于社交网络分析、生物信息学、推荐系统等领域。例如,在社交网络中,可以利用PIFM从部分用户关系数据中重建完整的社交网络结构,从而进行用户行为预测和社区发现。在生物信息学中,可以利用PIFM从基因表达数据中重建基因调控网络,从而研究基因之间的相互作用关系。该研究有助于提升图数据分析和挖掘的效率和准确性。

📄 摘要(原文)

We introduce Prior-Informed Flow Matching (PIFM), a conditional flow model for graph reconstruction. Reconstructing graphs from partial observations remains a key challenge; classical embedding methods often lack global consistency, while modern generative models struggle to incorporate structural priors. PIFM bridges this gap by integrating embedding-based priors with continuous-time flow matching. Grounded in a permutation equivariant version of the distortion-perception theory, our method first uses a prior, such as graphons or GraphSAGE/node2vec, to form an informed initial estimate of the adjacency matrix based on local information. It then applies rectified flow matching to refine this estimate, transporting it toward the true distribution of clean graphs and learning a global coupling. Experiments on different datasets demonstrate that PIFM consistently enhances classical embeddings, outperforming them and state-of-the-art generative baselines in reconstruction accuracy.