A large language model-type architecture for high-dimensional molecular potential energy surfaces

📄 arXiv: 2412.03831v2 📥 PDF

作者: Xiao Zhu, Srinivasan S. Iyengar

分类: cs.LG, physics.atm-clus, physics.chem-ph, physics.comp-ph

发布日期: 2024-12-05 (更新: 2025-12-26)

备注: 31 pages, 35 figures

期刊: Phys. Rev. X, 2026


💡 一句话要点

提出基于图神经网络的大语言模型架构,用于高维分子势能面预测。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 分子势能面 图神经网络 大语言模型 计算化学 高维数据 机器学习 反应速率 水簇

📋 核心要点

  1. 计算高维分子势能面是计算化学的难题,传统方法难以兼顾精度和效率,限制了反应速率预测等应用。
  2. 借鉴大语言模型思想,将分子系统表示为图结构,利用图神经网络学习子系统间相互作用,构建高维势能面。
  3. 实验表明,该算法在186维势能面预测中达到亚kcal/mol精度,首次实现了质子化21-水簇全维势能面构建。

📝 摘要(中文)

计算分子系统和材料的高维势能面是计算化学中的一个巨大挑战,对反应速率的基本预测等领域具有潜在影响。本文设计并讨论了一种与生成式AI和自然语言处理中的大型语言模型相似的算法。具体来说,我们将分子系统表示为一个图,其中包含一组节点、边、面等。这些集合之间的相互作用(在我们的例子中代表分子子系统)被用于构建具有51个核维度的合理大小的化学系统的势能面。为此,一系列与图论获得的子系统相关的神经网络完成了这项工作。然后,我们询问是否可以将同一系列的低维图神经网络转换为为186维势能面提供准确的预测。我们发现我们的算法确实为这个更高维度的问题提供了准确的结果,对于更高维度的势能面问题,精度低于kcal/mol。事实上,由于这些发展,我们在此首次尝试以CCSD水平的精度为质子化的21-水簇(186个核维度)生成一个全维势能面。

🔬 方法详解

问题定义:论文旨在解决计算化学中高维分子势能面计算的难题。传统方法,如从头计算方法,计算量巨大,难以应用于大型分子体系。而低精度方法又无法满足反应速率等关键性质的预测需求。因此,如何在保证计算精度的前提下,提高高维势能面的计算效率是一个重要的挑战。

核心思路:论文的核心思路是借鉴自然语言处理中的大语言模型思想,将分子系统表示为图结构,并利用图神经网络学习分子子系统之间的相互作用。通过这种方式,将高维势能面分解为多个低维子问题,从而降低计算复杂度。同时,利用神经网络的非线性拟合能力,提高势能面的预测精度。

技术框架:该方法的技术框架主要包括以下几个步骤:1) 将分子系统表示为图结构,其中节点代表原子,边代表原子之间的连接关系,面代表原子之间的角度关系等。2) 利用图神经网络学习每个子系统的能量贡献。这些图神经网络的输入是子系统的几何信息,输出是子系统的能量。3) 将所有子系统的能量贡献加起来,得到整个分子系统的势能面。

关键创新:论文的关键创新在于将大语言模型的思想引入到分子势能面的计算中。通过将分子系统表示为图结构,并利用图神经网络学习子系统之间的相互作用,实现了高维势能面的高效计算。此外,该方法还具有良好的可扩展性,可以应用于不同大小的分子体系。

关键设计:论文中使用了多种图神经网络结构,例如图卷积网络(GCN)和图注意力网络(GAT)。这些网络结构可以有效地学习图结构数据中的特征。此外,论文还使用了残差连接和批量归一化等技术,以提高神经网络的训练效率和泛化能力。损失函数使用了均方误差(MSE),以衡量预测势能面与真实势能面之间的差异。

🖼️ 关键图片

img_0

📊 实验亮点

该算法在186维势能面预测中实现了亚kcal/mol的精度,显著优于传统方法。首次成功构建了质子化21-水簇的全维势能面,为研究水簇的结构和性质提供了重要工具。实验结果表明,该方法具有良好的可扩展性,可以应用于更大规模的分子体系。

🎯 应用场景

该研究成果可广泛应用于计算化学、材料科学等领域。例如,可以用于预测化学反应的反应速率、研究分子动力学行为、设计新型催化剂和材料等。高精度势能面的构建对于理解和预测分子系统的性质至关重要,该方法有望加速相关领域的研究进展。

📄 摘要(原文)

Computing high-dimensional potential energy surfaces for molecular systems and materials is considered to be a great challenge in computational chemistry with potential impact in a range of areas including the fundamental prediction of reaction rates. In this paper, we design and discuss an algorithm that has similarities to large language models in generative AI and natural language processing. Specifically, we represent a molecular system as a graph which contains a set of nodes, edges, faces, etc. Interactions between these sets, which represent molecular subsystems in our case, are used to construct the potential energy surface for a reasonably sized chemical system with 51 nuclear dimensions. For this purpose, a family of neural networks that pertain to the graph-theoretically obtained subsystems get the job done for this 51 nuclear dimensional system. We then ask if this same family of lower-dimensional graph-based neural networks can be transformed to provide accurate predictions for a 186-dimensional potential energy surface. We find that our algorithm does provide accurate results for this larger-dimensional problem with sub-kcal/mol accuracy for the higher-dimensional potential energy surface problem. Indeed, as a result of these developments, here we produce the first efforts towards a full-dimensional potential energy surface for the protonated 21-water cluster (186 nuclear dimensions) at CCSD level accuracy.