ChargeFlow: Flow-Matching Refinement of Charge-Conditioned Electron Densities

📄 arXiv: 2603.23943v1 📥 PDF

作者: Tri Minh Nguyen, Sherif Abdulkader Tawfik, Truyen Tran, Svetha Venkatesh

分类: cond-mat.mtrl-sci, cs.LG

发布日期: 2026-03-25


💡 一句话要点

提出ChargeFlow,通过流匹配细化电荷条件下的电子密度,加速材料科学计算。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 流匹配 电子密度 密度泛函理论 材料科学 电荷密度 U-Net 材料筛选

📋 核心要点

  1. 现有基于密度泛函理论(DFT)的电荷密度计算方法,计算成本高昂,限制了其在大规模材料筛选中的应用。
  2. ChargeFlow利用流匹配模型,将电荷条件下的原子密度叠加转化为DFT电子密度,实现快速且准确的密度预测。
  3. 实验表明,ChargeFlow在非局部电荷重新分布和电荷态外推问题上表现出色,显著提高了密度预测的准确性。

📝 摘要(中文)

精确的电荷密度是电子结构理论的核心,但使用密度泛函理论计算电荷态相关的密度对于大规模筛选和缺陷工作流程来说仍然过于昂贵。我们提出了ChargeFlow,一个流匹配细化模型,它使用3D U-Net速度场将电荷条件下的原子密度叠加转换为本地周期性实空间网格上相应的DFT电子密度。ChargeFlow在9,502个带电的Materials Project衍生计算上进行训练,并在包含钙钛矿、带电缺陷、金刚石缺陷、金属有机框架和有机晶体的1,671个结构的外部基准上进行评估。虽然ChargeFlow在每个同分布类别上并非都是最优的,但在非局部电荷重新分布和电荷态外推问题上表现最强,相对于ResNet基线,形变密度误差从3.62%提高到3.21%,电荷响应余弦相似度从0.571提高到0.655。预测的密度在下游分析中仍然具有化学实用性,在所有1,671个基准结构上成功进行Bader分割,并产生高保真静电势,这使得流匹配成为带电材料的一种实用的密度细化策略。

🔬 方法详解

问题定义:论文旨在解决在材料科学中,使用密度泛函理论(DFT)计算带电材料的精确电荷密度时计算成本过高的问题。现有的DFT方法虽然准确,但在处理大规模材料筛选和缺陷分析等任务时,其计算复杂度成为瓶颈,限制了研究效率。尤其是在需要考虑多种电荷态的情况下,计算量会显著增加。

核心思路:论文的核心思路是利用流匹配(Flow Matching)模型,学习一个从简单的电荷条件下的原子密度叠加到复杂的DFT电子密度的映射。通过训练一个神经网络来预测一个速度场,该速度场能够将初始密度逐步演化为目标密度。这种方法避免了直接求解DFT方程,从而显著降低了计算成本。

技术框架:ChargeFlow的整体框架包括以下几个主要步骤:1) 构建训练数据集,包含带电材料的结构和对应的DFT电子密度;2) 对每个结构,计算电荷条件下的原子密度叠加作为输入;3) 使用一个3D U-Net神经网络来预测速度场,该速度场描述了从原子密度叠加到DFT电子密度的演化过程;4) 使用流匹配损失函数训练神经网络,使得预测的速度场能够准确地将初始密度演化为目标密度;5) 使用训练好的模型预测新的带电材料的电子密度。

关键创新:该论文最重要的技术创新点在于将流匹配模型应用于电子密度预测问题。与传统的基于神经网络的密度预测方法相比,流匹配模型能够更好地捕捉密度演化的连续性,从而提高预测的准确性和稳定性。此外,该方法还能够处理电荷态外推问题,即预测在训练数据中未出现的电荷态的电子密度。

关键设计:ChargeFlow的关键设计包括:1) 使用3D U-Net作为速度场预测器,以充分利用材料结构的3D空间信息;2) 使用流匹配损失函数,该损失函数鼓励预测的速度场能够将初始密度平滑地演化为目标密度;3) 在训练过程中,使用数据增强技术,例如随机旋转和缩放,以提高模型的泛化能力;4) 采用残差连接和跳跃连接等技术,以提高网络的训练效率和性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

ChargeFlow在包含1,671个结构的外部基准测试中表现出色。相对于ResNet基线,形变密度误差从3.62%降低到3.21%,电荷响应余弦相似度从0.571提高到0.655。此外,ChargeFlow预测的密度在下游分析中仍然具有化学实用性,在所有1,671个基准结构上成功进行Bader分割,并产生高保真静电势。这些结果表明,ChargeFlow是一种有效的密度细化策略,可以用于带电材料的研究。

🎯 应用场景

ChargeFlow在材料科学领域具有广泛的应用前景。它可以用于加速大规模材料筛选,例如寻找具有特定电学性质的材料。此外,它还可以用于缺陷分析,例如研究带电缺陷对材料性能的影响。该方法还可以应用于电化学领域,例如预测电极材料的电子结构和电化学性质。未来,ChargeFlow有望成为材料设计和发现的重要工具。

📄 摘要(原文)

Accurate charge densities are central to electronic-structure theory, but computing charge-state-dependent densities with density functional theory remains too expensive for large-scale screening and defect workflows. We present ChargeFlow, a flow-matching refinement model that transforms a charge-conditioned superposition of atomic densities into the corresponding DFT electron density on the native periodic real-space grid using a 3D U-Net velocity field. Trained on 9,502 charged Materials Project-derived calculations and evaluated on an external 1,671-structure benchmark spanning perovskites, charged defects, diamond defects, metal-organic frameworks, and organic crystals, ChargeFlow is not uniformly best on every in-distribution class but is strongest on problems dominated by nonlocal charge redistribution and charge-state extrapolation, improving deformation-density error from 3.62% to 3.21% and charge- response cosine similarity from 0.571 to 0.655 relative to a ResNet baseline. The predicted densities remain chemically useful under downstream analysis, yielding successful Bader partitioning on all 1,671 benchmark structures and high-fidelity electrostatic potentials, which positions flow matching as a practical density-refinement strategy for charged materials.