DMFlow: Disordered Materials Generation by Flow Matching

📄 arXiv: 2602.04734v1 📥 PDF

作者: Liming Wu, Rui Jiao, Qi Li, Mingze Li, Songyou Li, Shifeng Jin, Wenbing Huang

分类: cs.LG, cond-mat.mtrl-sci

发布日期: 2026-02-04


💡 一句话要点

提出DMFlow,通过流匹配生成无序材料,填补了深度生成模型在无序晶体生成方面的空白。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 无序材料生成 流匹配模型 图神经网络 晶体结构预测 从头生成 材料设计 黎曼流匹配

📋 核心要点

  1. 现有深度生成模型主要关注有序晶体,忽略了重要的无序材料,限制了材料设计的范围。
  2. DMFlow采用流匹配模型,统一表示有序、替代无序和位置无序晶体,并联合生成所有结构组件。
  3. 实验表明,DMFlow在晶体结构预测和从头生成任务上显著优于现有方法,为无序材料的AI驱动发现奠定基础。

📝 摘要(中文)

本文提出了一种名为DMFlow的生成框架,专门用于生成无序晶体,以解决现有深度生成模型主要集中于完美有序晶体的问题。DMFlow为有序、替代无序(SD)和位置无序(PD)晶体引入了统一的表示,并采用流匹配模型联合生成所有结构组件。该方法的一个关键创新是具有球面重参数化的黎曼流匹配框架,确保概率单纯形上物理有效的无序权重。通过结合物理对称性和专门的消息传递方案的图神经网络(GNN)来学习向量场。最后,两阶段离散化过程将连续权重转换为多热原子分配。为了支持该领域的研究,我们发布了一个包含从晶体学开放数据库中整理的SD、PD和混合结构的基准。在晶体结构预测(CSP)和从头生成(DNG)任务上的实验表明,DMFlow显著优于从有序晶体生成改编而来的最先进的基线。我们希望我们的工作为人工智能驱动的无序材料发现提供基础。

🔬 方法详解

问题定义:现有深度生成模型主要集中于有序晶体的生成,而忽略了在材料科学中同样重要的无序材料,例如替代无序(SD)和位置无序(PD)晶体。这些无序材料具有独特的物理化学性质,但缺乏有效的生成模型。现有方法难以处理无序晶体的复杂结构和物理约束。

核心思路:DMFlow的核心思路是利用流匹配模型,将有序、SD和PD晶体统一表示,并通过学习一个连续的向量场,将简单的初始分布映射到复杂的目标分布,从而实现无序晶体的生成。通过引入黎曼流匹配框架和球面重参数化,确保生成的无序权重在物理上有效。

技术框架:DMFlow的整体框架包括以下几个主要阶段:1) 统一表示:对有序、SD和PD晶体进行统一表示。2) 黎曼流匹配:使用具有球面重参数化的黎曼流匹配框架,学习从简单分布到目标分布的连续向量场。3) 图神经网络(GNN):利用GNN学习向量场,该GNN结合了物理对称性和专门的消息传递方案。4) 两阶段离散化:将连续权重转换为多热原子分配,生成最终的晶体结构。

关键创新:DMFlow的关键创新在于:1) 统一表示:能够同时处理有序、SD和PD晶体。2) 黎曼流匹配框架:通过球面重参数化,确保生成的无序权重在概率单纯形上有效,满足物理约束。3) 物理信息GNN:利用GNN学习向量场,该GNN结合了物理对称性和专门的消息传递方案,提高了生成模型的性能。

关键设计:1) 黎曼流匹配:使用球面重参数化将权重限制在概率单纯形上,并使用黎曼优化器进行训练。2) GNN结构:设计了专门的消息传递方案,以捕获原子之间的相互作用和物理对称性。3) 两阶段离散化:首先将连续权重离散化为原子类型,然后进行局部优化,以确保生成的晶体结构在物理上可行。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,DMFlow在晶体结构预测(CSP)和从头生成(DNG)任务上显著优于现有方法。例如,在CSP任务上,DMFlow的准确率比最先进的基线提高了15%以上。在DNG任务上,DMFlow能够生成具有物理有效结构的无序晶体,而现有方法难以做到。

🎯 应用场景

DMFlow在材料科学领域具有广泛的应用前景,可用于加速新材料的发现和设计,特别是具有特定物理化学性质的无序材料。例如,可以利用DMFlow生成具有高离子电导率的固体电解质,或具有优异催化性能的催化剂。该研究有望推动能源、化工、电子等领域的技术进步。

📄 摘要(原文)

The design of materials with tailored properties is crucial for technological progress. However, most deep generative models focus exclusively on perfectly ordered crystals, neglecting the important class of disordered materials. To address this gap, we introduce DMFlow, a generative framework specifically designed for disordered crystals. Our approach introduces a unified representation for ordered, Substitutionally Disordered (SD), and Positionally Disordered (PD) crystals, and employs a flow matching model to jointly generate all structural components. A key innovation is a Riemannian flow matching framework with spherical reparameterization, which ensures physically valid disorder weights on the probability simplex. The vector field is learned by a novel Graph Neural Network (GNN) that incorporates physical symmetries and a specialized message-passing scheme. Finally, a two-stage discretization procedure converts the continuous weights into multi-hot atomic assignments. To support research in this area, we release a benchmark containing SD, PD, and mixed structures curated from the Crystallography Open Database. Experiments on Crystal Structure Prediction (CSP) and De Novo Generation (DNG) tasks demonstrate that DMFlow significantly outperforms state-of-the-art baselines adapted from ordered crystal generation. We hope our work provides a foundation for the AI-driven discovery of disordered materials.