DREAMS: Density Functional Theory Based Research Engine for Agentic Materials Simulation

作者: Ziqi Wang, Hongshuo Huang, Hancheng Zhao, Changwen Xu, Shang Zhu, Jan Janssen, Venkatasubramanian Viswanathan

分类: cs.AI, cond-mat.mtrl-sci

发布日期: 2025-07-18

备注: 34 pages, 28 pages of Supporting Information

💡 一句话要点

DREAMS：基于密度泛函理论的智能体材料模拟研究引擎

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 密度泛函理论 材料模拟 大型语言模型 多智能体系统 自动化 高通量计算 材料发现

📋 核心要点

传统DFT模拟依赖专家经验，参数调优繁琐且易出错，限制了材料发现的效率和可及性。
DREAMS采用分层多智能体框架，利用LLM进行规划和领域任务处理，实现DFT模拟的自动化。
实验表明，DREAMS在晶格常数预测和吸附能计算方面达到专家水平，并能进行不确定性量化。

📝 摘要（中文）

材料发现依赖于高通量、高保真的模拟技术，如密度泛函理论(DFT)，但它需要多年的培训、广泛的参数微调和系统的错误处理。为了解决这些挑战，我们引入了基于DFT的研究引擎DREAMS，这是一个用于DFT模拟的分层多智能体框架，它将中央大型语言模型(LLM)规划器智能体与领域特定的LLM智能体相结合，用于原子结构生成、系统DFT收敛测试、高性能计算(HPC)调度和错误处理。此外，共享画布帮助LLM智能体组织讨论，保持上下文并防止幻觉。我们在Sol27LC晶格常数基准上验证了DREAMS的能力，与人类DFT专家的结果相比，平均误差低于1%。此外，我们将DREAMS应用于长期存在的CO/Pt(111)吸附难题，证明了其长期和复杂的问题解决能力。该框架再次重现了专家级别的文献吸附能差异。最后，DREAMS被用于量化函数驱动的不确定性，通过贝叶斯集成抽样，确认了广义梯度近似(GGA) DFT水平下的面心立方(FCC)位点偏好。总之，DREAMS接近L3级自动化——自主探索定义的设计空间——并显著减少了对人类专业知识和干预的依赖，为民主化、高通量、高保真的计算材料发现提供了一条可扩展的路径。

🔬 方法详解

问题定义：论文旨在解决材料科学中基于密度泛函理论（DFT）模拟的自动化问题。现有的DFT模拟流程高度依赖于领域专家，需要耗费大量时间进行参数调整和错误处理，这限制了高通量材料筛选和新材料发现的效率。现有方法的痛点在于缺乏自动化和智能化，难以应对复杂材料体系的模拟。

核心思路：论文的核心思路是构建一个基于大型语言模型（LLM）的多智能体系统，该系统能够自主地执行DFT模拟的各个步骤，包括结构生成、收敛性测试、HPC调度和错误处理。通过将复杂的模拟任务分解为多个子任务，并分配给不同的智能体协同完成，从而实现DFT模拟的自动化和智能化。

技术框架：DREAMS框架采用分层架构，包含一个中央LLM规划器智能体和多个领域特定的LLM智能体。中央智能体负责制定整体模拟策略，并将任务分配给各个领域智能体。领域智能体负责执行具体的模拟任务，例如原子结构生成、DFT收敛性测试、HPC调度和错误处理。智能体之间通过共享画布进行信息交流和协作，保持上下文一致性，并减少幻觉。

关键创新：DREAMS的关键创新在于将LLM应用于DFT模拟的自动化。通过利用LLM的自然语言处理和知识推理能力，DREAMS能够理解复杂的模拟任务，并自主地制定执行策略。此外，DREAMS的多智能体架构能够有效地分解和并行化模拟任务，从而提高模拟效率。共享画布的设计有助于智能体之间的协作和信息共享，减少错误和不一致性。

关键设计：DREAMS框架的关键设计包括：1) 中央LLM规划器智能体的任务分解和调度策略；2) 领域特定LLM智能体的prompt设计和训练；3) 共享画布的数据结构和访问控制机制；4) 贝叶斯集成抽样方法用于量化函数驱动的不确定性。具体的参数设置、损失函数和网络结构等细节可能依赖于所使用的LLM模型和具体的模拟任务。

🖼️ 关键图片

📊 实验亮点

DREAMS在Sol27LC晶格常数基准测试中，平均误差低于1%，与人类DFT专家水平相当。在CO/Pt(111)吸附难题中，DREAMS重现了专家级别的文献吸附能差异。通过贝叶斯集成抽样，DREAMS确认了GGA DFT水平下的FCC位点偏好，验证了其不确定性量化能力。

🎯 应用场景

DREAMS可应用于高通量材料筛选、新材料设计、催化剂开发、电池材料优化等领域。它能够降低DFT模拟的门槛，使更多的研究人员能够利用计算方法进行材料研究。DREAMS有望加速新材料的发现和应用，推动材料科学的发展。

📄 摘要（原文）

Materials discovery relies on high-throughput, high-fidelity simulation techniques such as Density Functional Theory (DFT), which require years of training, extensive parameter fine-tuning and systematic error handling. To address these challenges, we introduce the DFT-based Research Engine for Agentic Materials Screening (DREAMS), a hierarchical, multi-agent framework for DFT simulation that combines a central Large Language Model (LLM) planner agent with domain-specific LLM agents for atomistic structure generation, systematic DFT convergence testing, High-Performance Computing (HPC) scheduling, and error handling. In addition, a shared canvas helps the LLM agents to structure their discussions, preserve context and prevent hallucination. We validate DREAMS capabilities on the Sol27LC lattice-constant benchmark, achieving average errors below 1\% compared to the results of human DFT experts. Furthermore, we apply DREAMS to the long-standing CO/Pt(111) adsorption puzzle, demonstrating its long-term and complex problem-solving capabilities. The framework again reproduces expert-level literature adsorption-energy differences. Finally, DREAMS is employed to quantify functional-driven uncertainties with Bayesian ensemble sampling, confirming the Face Centered Cubic (FCC)-site preference at the Generalized Gradient Approximation (GGA) DFT level. In conclusion, DREAMS approaches L3-level automation - autonomous exploration of a defined design space - and significantly reduces the reliance on human expertise and intervention, offering a scalable path toward democratized, high-throughput, high-fidelity computational materials discovery.

DREAMS: Density Functional Theory Based Research Engine for Agentic Materials Simulation

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理