GENIUS: An Agentic AI Framework for Autonomous Design and Execution of Simulation Protocols
作者: Mohammad Soleymanibrojeni, Roland Aydin, Diego Guedes-Sobrinho, Alexandre C. Dias, Maurício J. Piotrowski, Wolfgang Wenzel, Celso Ricardo Caldeira Rêgo
分类: cs.AI, cond-mat.mtrl-sci, physics.chem-ph
发布日期: 2025-12-06
💡 一句话要点
GENIUS:一个用于自主设计和执行模拟协议的Agentic AI框架
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 材料模拟 AI代理 知识图谱 大型语言模型 自动化 ICME Quantum ESPRESSO
📋 核心要点
- 现有材料模拟工作流依赖专家知识,非专业人士难以使用,阻碍了ICME的发展。
- GENIUS框架利用智能知识图谱和分层LLM,将人类提示转化为可执行的模拟协议,实现自动化。
- 实验表明,GENIUS在大量基准测试中表现出色,显著降低了推理成本,并有效避免了LLM的幻觉问题。
📝 摘要(中文)
预测性原子模拟推动了材料发现,但常规设置和调试仍然需要计算机专家。这种知识鸿沟限制了集成计算材料工程(ICME)的发展,尽管最先进的代码已经存在,但对于非专业人士来说仍然很麻烦。我们用GENIUS解决了这个瓶颈,GENIUS是一个AI-agentic工作流,它融合了一个智能Quantum ESPRESSO知识图谱和一个由有限状态错误恢复机监督的分层大型语言模型。我们展示了GENIUS将自由形式的人工提示转换为经过验证的输入文件,这些文件在约80%的295个不同基准测试中运行完成,其中76%是自主修复的,成功率呈指数衰减至7%的基线。与仅使用LLM的基线相比,GENIUS将推理成本降低了一半,并几乎消除了幻觉。该框架通过智能地自动化协议生成、验证和修复,普及了电子结构DFT模拟,从而在世界各地的学术界和工业界开启了大规模筛选并加速了ICME设计循环。
🔬 方法详解
问题定义:论文旨在解决材料模拟领域中,非专业人士难以设置和调试复杂模拟协议的问题。现有的计算材料工程(ICME)工具虽然强大,但需要专业知识,限制了其应用范围。因此,如何降低使用门槛,让更多研究人员能够利用计算模拟加速材料发现,是本文要解决的核心问题。
核心思路:论文的核心思路是构建一个AI代理框架,该框架能够理解人类的自然语言指令,并将其转化为可执行的模拟协议。通过结合知识图谱和大型语言模型,该框架能够自动完成协议生成、验证和修复等步骤,从而降低了对专业知识的依赖。
技术框架:GENIUS框架包含以下几个主要模块:1) Quantum ESPRESSO知识图谱,用于存储和检索模拟相关的知识;2) 分层大型语言模型,用于理解人类指令并生成初步的模拟协议;3) 有限状态错误恢复机,用于检测和修复协议中的错误。整体流程是:用户输入自然语言指令,LLM根据知识图谱生成初步协议,错误恢复机验证协议并进行修复,最终生成可执行的输入文件。
关键创新:该框架的关键创新在于将知识图谱、分层LLM和错误恢复机相结合,形成一个完整的AI代理。这种架构能够有效地利用领域知识,提高协议生成的准确性和可靠性。此外,分层LLM的设计降低了推理成本,并减少了幻觉问题。
关键设计:论文中没有详细描述具体的参数设置、损失函数或网络结构等技术细节。但是,分层LLM的设计是一个关键的设计选择,它允许框架在不同的抽象层次上处理信息,从而提高了效率和准确性。有限状态错误恢复机的设计也至关重要,它能够自动检测和修复协议中的错误,保证模拟的顺利进行。
🖼️ 关键图片
📊 实验亮点
GENIUS在295个不同的基准测试中,成功率达到约80%,其中76%的错误可以自主修复。与仅使用LLM的基线相比,GENIUS将推理成本降低了一半,并几乎消除了幻觉。这些结果表明,GENIUS框架在自动化模拟协议生成方面具有显著优势。
🎯 应用场景
GENIUS框架可广泛应用于材料科学、化学、物理等领域,加速新材料的发现和设计。它能够降低计算模拟的使用门槛,使更多研究人员能够利用计算工具解决实际问题。该框架还有望促进ICME的发展,实现材料设计和制造的智能化。
📄 摘要(原文)
Predictive atomistic simulations have propelled materials discovery, yet routine setup and debugging still demand computer specialists. This know-how gap limits Integrated Computational Materials Engineering (ICME), where state-of-the-art codes exist but remain cumbersome for non-experts. We address this bottleneck with GENIUS, an AI-agentic workflow that fuses a smart Quantum ESPRESSO knowledge graph with a tiered hierarchy of large language models supervised by a finite-state error-recovery machine. Here we show that GENIUS translates free-form human-generated prompts into validated input files that run to completion on $\approx$80% of 295 diverse benchmarks, where 76% are autonomously repaired, with success decaying exponentially to a 7% baseline. Compared with LLM-only baselines, GENIUS halves inference costs and virtually eliminates hallucinations. The framework democratizes electronic-structure DFT simulations by intelligently automating protocol generation, validation, and repair, opening large-scale screening and accelerating ICME design loops across academia and industry worldwide.