DREAMS: Density Functional Theory Based Research Engine for Agentic Materials Simulation

📄 arXiv: 2507.14267v1 📥 PDF

作者: Ziqi Wang, Hongshuo Huang, Hancheng Zhao, Changwen Xu, Shang Zhu, Jan Janssen, Venkatasubramanian Viswanathan

分类: cs.AI, cond-mat.mtrl-sci

发布日期: 2025-07-18

备注: 34 pages, 28 pages of Supporting Information


💡 一句话要点

DREAMS:基于密度泛函理论的智能体材料模拟研究引擎

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 密度泛函理论 材料模拟 大型语言模型 多智能体系统 自动化 高通量计算 材料发现

📋 核心要点

  1. 传统DFT模拟依赖专家经验,参数调优繁琐且易出错,限制了材料发现的效率和可及性。
  2. DREAMS采用分层多智能体框架,利用LLM进行规划和领域任务处理,实现DFT模拟的自动化。
  3. 实验表明,DREAMS在晶格常数预测和吸附能计算方面达到专家水平,并能进行不确定性量化。

📝 摘要(中文)

材料发现依赖于高通量、高保真的模拟技术,如密度泛函理论(DFT),但它需要多年的培训、广泛的参数微调和系统的错误处理。为了解决这些挑战,我们引入了基于DFT的研究引擎DREAMS,这是一个用于DFT模拟的分层多智能体框架,它将中央大型语言模型(LLM)规划器智能体与领域特定的LLM智能体相结合,用于原子结构生成、系统DFT收敛测试、高性能计算(HPC)调度和错误处理。此外,共享画布帮助LLM智能体组织讨论,保持上下文并防止幻觉。我们在Sol27LC晶格常数基准上验证了DREAMS的能力,与人类DFT专家的结果相比,平均误差低于1%。此外,我们将DREAMS应用于长期存在的CO/Pt(111)吸附难题,证明了其长期和复杂的问题解决能力。该框架再次重现了专家级别的文献吸附能差异。最后,DREAMS被用于量化函数驱动的不确定性,通过贝叶斯集成抽样,确认了广义梯度近似(GGA) DFT水平下的面心立方(FCC)位点偏好。总之,DREAMS接近L3级自动化——自主探索定义的设计空间——并显著减少了对人类专业知识和干预的依赖,为民主化、高通量、高保真的计算材料发现提供了一条可扩展的路径。

🔬 方法详解

问题定义:论文旨在解决材料科学中基于密度泛函理论(DFT)模拟的自动化问题。现有的DFT模拟流程高度依赖于领域专家,需要耗费大量时间进行参数调整和错误处理,这限制了高通量材料筛选和新材料发现的效率。现有方法的痛点在于缺乏自动化和智能化,难以应对复杂材料体系的模拟。

核心思路:论文的核心思路是构建一个基于大型语言模型(LLM)的多智能体系统,该系统能够自主地执行DFT模拟的各个步骤,包括结构生成、收敛性测试、HPC调度和错误处理。通过将复杂的模拟任务分解为多个子任务,并分配给不同的智能体协同完成,从而实现DFT模拟的自动化和智能化。

技术框架:DREAMS框架采用分层架构,包含一个中央LLM规划器智能体和多个领域特定的LLM智能体。中央智能体负责制定整体模拟策略,并将任务分配给各个领域智能体。领域智能体负责执行具体的模拟任务,例如原子结构生成、DFT收敛性测试、HPC调度和错误处理。智能体之间通过共享画布进行信息交流和协作,保持上下文一致性,并减少幻觉。

关键创新:DREAMS的关键创新在于将LLM应用于DFT模拟的自动化。通过利用LLM的自然语言处理和知识推理能力,DREAMS能够理解复杂的模拟任务,并自主地制定执行策略。此外,DREAMS的多智能体架构能够有效地分解和并行化模拟任务,从而提高模拟效率。共享画布的设计有助于智能体之间的协作和信息共享,减少错误和不一致性。

关键设计:DREAMS框架的关键设计包括:1) 中央LLM规划器智能体的任务分解和调度策略;2) 领域特定LLM智能体的prompt设计和训练;3) 共享画布的数据结构和访问控制机制;4) 贝叶斯集成抽样方法用于量化函数驱动的不确定性。具体的参数设置、损失函数和网络结构等细节可能依赖于所使用的LLM模型和具体的模拟任务。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

DREAMS在Sol27LC晶格常数基准测试中,平均误差低于1%,与人类DFT专家水平相当。在CO/Pt(111)吸附难题中,DREAMS重现了专家级别的文献吸附能差异。通过贝叶斯集成抽样,DREAMS确认了GGA DFT水平下的FCC位点偏好,验证了其不确定性量化能力。

🎯 应用场景

DREAMS可应用于高通量材料筛选、新材料设计、催化剂开发、电池材料优化等领域。它能够降低DFT模拟的门槛,使更多的研究人员能够利用计算方法进行材料研究。DREAMS有望加速新材料的发现和应用,推动材料科学的发展。

📄 摘要(原文)

Materials discovery relies on high-throughput, high-fidelity simulation techniques such as Density Functional Theory (DFT), which require years of training, extensive parameter fine-tuning and systematic error handling. To address these challenges, we introduce the DFT-based Research Engine for Agentic Materials Screening (DREAMS), a hierarchical, multi-agent framework for DFT simulation that combines a central Large Language Model (LLM) planner agent with domain-specific LLM agents for atomistic structure generation, systematic DFT convergence testing, High-Performance Computing (HPC) scheduling, and error handling. In addition, a shared canvas helps the LLM agents to structure their discussions, preserve context and prevent hallucination. We validate DREAMS capabilities on the Sol27LC lattice-constant benchmark, achieving average errors below 1\% compared to the results of human DFT experts. Furthermore, we apply DREAMS to the long-standing CO/Pt(111) adsorption puzzle, demonstrating its long-term and complex problem-solving capabilities. The framework again reproduces expert-level literature adsorption-energy differences. Finally, DREAMS is employed to quantify functional-driven uncertainties with Bayesian ensemble sampling, confirming the Face Centered Cubic (FCC)-site preference at the Generalized Gradient Approximation (GGA) DFT level. In conclusion, DREAMS approaches L3-level automation - autonomous exploration of a defined design space - and significantly reduces the reliance on human expertise and intervention, offering a scalable path toward democratized, high-throughput, high-fidelity computational materials discovery.