Flowette: Flow Matching with Graphette Priors for Graph Generation
作者: Asiri Wijesinghe, Sevvandi Kandanaarachchi, Daniel M. Steinberg, Cheng Soon Ong
分类: cs.LG, cs.AI
发布日期: 2026-02-27
备注: 37 Pages
💡 一句话要点
Flowette:结合Graphette先验的Flow Matching图生成模型
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 图生成 Flow Matching 图神经网络 结构先验 Graphette
📋 核心要点
- 现有图生成模型难以有效捕捉图中重复出现的子图结构(motif),限制了生成复杂图的能力。
- Flowette利用Flow Matching框架,结合图神经网络Transformer学习图表示上的速度场,并引入graphettes作为结构先验。
- 实验表明,Flowette在合成图和小分子图生成任务上表现出一致的性能提升,验证了结构先验与流模型结合的有效性。
📝 摘要(中文)
本文研究了具有重复子图模体的图的生成建模。我们提出了Flowette,一个连续的flow matching框架,它采用基于图神经网络的Transformer来学习定义在具有节点和边属性的图表示上的速度场。我们的模型通过基于最优传输的耦合来保持拓扑结构,并通过正则化来保持长程结构依赖性。为了结合领域驱动的结构先验,我们引入了graphettes,一种新的概率图结构模型族,它通过对环、星和树等模体的受控结构编辑来推广graphons。我们从理论上分析了所提出框架的耦合、不变性和结构特性,并在合成图和小分子图生成任务上对其进行了实证评估。Flowette展示了一致的改进,突出了将结构先验与基于流的训练相结合来建模复杂图分布的有效性。
🔬 方法详解
问题定义:论文旨在解决图生成任务中,现有方法难以有效建模图中普遍存在的子图模体(graphettes)的问题。现有方法通常忽略这些结构信息,导致生成的图结构不够真实,缺乏特定领域的结构特征。
核心思路:论文的核心思路是将图生成过程建模为一个连续的流,通过学习一个速度场,将一个简单的初始图逐步演化为目标图。同时,利用graphettes作为结构先验,引导生成过程朝着具有特定子图模体的方向发展。这种方法结合了流模型的灵活性和结构先验的领域知识。
技术框架:Flowette框架包含以下主要模块:1) 图表示模块:使用图神经网络(GNN)Transformer将图结构和节点/边属性编码为图表示。2) 速度场学习模块:利用Flow Matching训练目标,学习一个速度场,该速度场定义了从初始图到目标图的连续变换。3) Graphette先验模块:引入graphettes作为结构先验,通过正则化项约束速度场,鼓励生成具有特定子图模体的图。4) 最优传输耦合:使用最优传输理论来建立初始图和目标图之间的耦合关系,从而保持图的拓扑结构。
关键创新:论文的关键创新在于:1) 提出了Flowette框架,将Flow Matching应用于图生成任务,并结合了结构先验。2) 引入了graphettes,一种新的概率图结构模型族,可以灵活地表示各种子图模体。3) 将最优传输理论应用于图生成,以保持图的拓扑结构。
关键设计:GNN Transformer用于学习图表示,其结构细节(层数、隐藏层维度等)需要根据具体任务进行调整。Flow Matching损失函数用于训练速度场,同时添加正则化项来引入graphettes先验。最优传输的计算复杂度较高,需要采用近似算法来提高效率。Graphette的选择和参数设置需要根据领域知识进行调整。
🖼️ 关键图片
📊 实验亮点
Flowette在合成图和小分子图生成任务上均取得了显著的性能提升。例如,在小分子图生成任务中,Flowette生成的分子图的有效性和独特性均优于现有方法。实验结果表明,结合结构先验的Flow Matching框架可以有效地建模复杂图分布。
🎯 应用场景
Flowette在药物发现、材料设计、社交网络建模等领域具有广泛的应用前景。它可以用于生成具有特定结构特征的分子图,从而加速新药的研发过程。此外,Flowette还可以用于生成具有特定社交模式的社交网络,从而帮助我们更好地理解社交行为。
📄 摘要(原文)
We study generative modeling of graphs with recurring subgraph motifs. We propose Flowette, a continuous flow matching framework, that employs a graph neural network based transformer to learn a velocity field defined over graph representations with node and edge attributes. Our model preserves topology through optimal transport based coupling, and long-range structural dependencies through regularisation. To incorporate domain driven structural priors, we introduce graphettes, a new probabilistic family of graph structure models that generalize graphons via controlled structural edits for motifs like rings, stars and trees. We theoretically analyze the coupling, invariance, and structural properties of the proposed framework, and empirically evaluate it on synthetic and small-molecule graph generation tasks. Flowette demonstrates consistent improvements, highlighting the effectiveness of combining structural priors with flow-based training for modeling complex graph distributions.