DREAMS: Density Functional Theory Based Research Engine for Agentic Materials Simulation
作者: Ziqi Wang, Hongshuo Huang, Hancheng Zhao, Changwen Xu, Shang Zhu, Jan Janssen, Venkatasubramanian Viswanathan
分类: cs.AI, cond-mat.mtrl-sci
发布日期: 2025-07-18
备注: 34 pages, 28 pages of Supporting Information
💡 一句话要点
DREAMS:基于密度泛函理论的智能体材料模拟研究引擎
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 密度泛函理论 材料模拟 大型语言模型 多智能体系统 自动化 高通量计算 材料发现
📋 核心要点
- 传统DFT模拟依赖专家经验,参数调优繁琐且易出错,限制了材料发现的效率和可及性。
- DREAMS采用分层多智能体框架,利用LLM进行规划和领域任务处理,实现DFT模拟的自动化。
- 实验表明,DREAMS在晶格常数预测和吸附能计算方面达到专家水平,并能进行不确定性量化。
📝 摘要(中文)
材料发现依赖于高通量、高保真的模拟技术,如密度泛函理论(DFT),但它需要多年的培训、广泛的参数微调和系统的错误处理。为了解决这些挑战,我们引入了基于DFT的研究引擎DREAMS,这是一个用于DFT模拟的分层多智能体框架,它将中央大型语言模型(LLM)规划器智能体与领域特定的LLM智能体相结合,用于原子结构生成、系统DFT收敛测试、高性能计算(HPC)调度和错误处理。此外,共享画布帮助LLM智能体组织讨论,保持上下文并防止幻觉。我们在Sol27LC晶格常数基准上验证了DREAMS的能力,与人类DFT专家的结果相比,平均误差低于1%。此外,我们将DREAMS应用于长期存在的CO/Pt(111)吸附难题,证明了其长期和复杂的问题解决能力。该框架再次重现了专家级别的文献吸附能差异。最后,DREAMS被用于量化函数驱动的不确定性,通过贝叶斯集成抽样,确认了广义梯度近似(GGA) DFT水平下的面心立方(FCC)位点偏好。总之,DREAMS接近L3级自动化——自主探索定义的设计空间——并显著减少了对人类专业知识和干预的依赖,为民主化、高通量、高保真的计算材料发现提供了一条可扩展的路径。
🔬 方法详解
问题定义:论文旨在解决材料科学中基于密度泛函理论(DFT)模拟的自动化问题。现有的DFT模拟流程高度依赖于领域专家,需要耗费大量时间进行参数调整和错误处理,这限制了高通量材料筛选和新材料发现的效率。现有方法的痛点在于缺乏自动化和智能化,难以应对复杂材料体系的模拟。
核心思路:论文的核心思路是构建一个基于大型语言模型(LLM)的多智能体系统,该系统能够自主地执行DFT模拟的各个步骤,包括结构生成、收敛性测试、HPC调度和错误处理。通过将复杂的模拟任务分解为多个子任务,并分配给不同的智能体协同完成,从而实现DFT模拟的自动化和智能化。
技术框架:DREAMS框架采用分层架构,包含一个中央LLM规划器智能体和多个领域特定的LLM智能体。中央智能体负责制定整体模拟策略,并将任务分配给各个领域智能体。领域智能体负责执行具体的模拟任务,例如原子结构生成、DFT收敛性测试、HPC调度和错误处理。智能体之间通过共享画布进行信息交流和协作,保持上下文一致性,并减少幻觉。
关键创新:DREAMS的关键创新在于将LLM应用于DFT模拟的自动化。通过利用LLM的自然语言处理和知识推理能力,DREAMS能够理解复杂的模拟任务,并自主地制定执行策略。此外,DREAMS的多智能体架构能够有效地分解和并行化模拟任务,从而提高模拟效率。共享画布的设计有助于智能体之间的协作和信息共享,减少错误和不一致性。
关键设计:DREAMS框架的关键设计包括:1) 中央LLM规划器智能体的任务分解和调度策略;2) 领域特定LLM智能体的prompt设计和训练;3) 共享画布的数据结构和访问控制机制;4) 贝叶斯集成抽样方法用于量化函数驱动的不确定性。具体的参数设置、损失函数和网络结构等细节可能依赖于所使用的LLM模型和具体的模拟任务。
🖼️ 关键图片
📊 实验亮点
DREAMS在Sol27LC晶格常数基准测试中,平均误差低于1%,与人类DFT专家水平相当。在CO/Pt(111)吸附难题中,DREAMS重现了专家级别的文献吸附能差异。通过贝叶斯集成抽样,DREAMS确认了GGA DFT水平下的FCC位点偏好,验证了其不确定性量化能力。
🎯 应用场景
DREAMS可应用于高通量材料筛选、新材料设计、催化剂开发、电池材料优化等领域。它能够降低DFT模拟的门槛,使更多的研究人员能够利用计算方法进行材料研究。DREAMS有望加速新材料的发现和应用,推动材料科学的发展。
📄 摘要(原文)
Materials discovery relies on high-throughput, high-fidelity simulation techniques such as Density Functional Theory (DFT), which require years of training, extensive parameter fine-tuning and systematic error handling. To address these challenges, we introduce the DFT-based Research Engine for Agentic Materials Screening (DREAMS), a hierarchical, multi-agent framework for DFT simulation that combines a central Large Language Model (LLM) planner agent with domain-specific LLM agents for atomistic structure generation, systematic DFT convergence testing, High-Performance Computing (HPC) scheduling, and error handling. In addition, a shared canvas helps the LLM agents to structure their discussions, preserve context and prevent hallucination. We validate DREAMS capabilities on the Sol27LC lattice-constant benchmark, achieving average errors below 1\% compared to the results of human DFT experts. Furthermore, we apply DREAMS to the long-standing CO/Pt(111) adsorption puzzle, demonstrating its long-term and complex problem-solving capabilities. The framework again reproduces expert-level literature adsorption-energy differences. Finally, DREAMS is employed to quantify functional-driven uncertainties with Bayesian ensemble sampling, confirming the Face Centered Cubic (FCC)-site preference at the Generalized Gradient Approximation (GGA) DFT level. In conclusion, DREAMS approaches L3-level automation - autonomous exploration of a defined design space - and significantly reduces the reliance on human expertise and intervention, offering a scalable path toward democratized, high-throughput, high-fidelity computational materials discovery.