GENIUS: An Agentic AI Framework for Autonomous Design and Execution of Simulation Protocols

作者: Mohammad Soleymanibrojeni, Roland Aydin, Diego Guedes-Sobrinho, Alexandre C. Dias, Maurício J. Piotrowski, Wolfgang Wenzel, Celso Ricardo Caldeira Rêgo

分类: cs.AI, cond-mat.mtrl-sci, physics.chem-ph

发布日期: 2025-12-06

💡 一句话要点

GENIUS：一个用于自主设计和执行模拟协议的Agentic AI框架

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 材料模拟 AI代理 知识图谱 大型语言模型 自动化 ICME Quantum ESPRESSO

📋 核心要点

现有材料模拟工作流依赖专家知识，非专业人士难以使用，阻碍了ICME的发展。
GENIUS框架利用智能知识图谱和分层LLM，将人类提示转化为可执行的模拟协议，实现自动化。
实验表明，GENIUS在大量基准测试中表现出色，显著降低了推理成本，并有效避免了LLM的幻觉问题。

📝 摘要（中文）

预测性原子模拟推动了材料发现，但常规设置和调试仍然需要计算机专家。这种知识鸿沟限制了集成计算材料工程(ICME)的发展，尽管最先进的代码已经存在，但对于非专业人士来说仍然很麻烦。我们用GENIUS解决了这个瓶颈，GENIUS是一个AI-agentic工作流，它融合了一个智能Quantum ESPRESSO知识图谱和一个由有限状态错误恢复机监督的分层大型语言模型。我们展示了GENIUS将自由形式的人工提示转换为经过验证的输入文件，这些文件在约80%的295个不同基准测试中运行完成，其中76%是自主修复的，成功率呈指数衰减至7%的基线。与仅使用LLM的基线相比，GENIUS将推理成本降低了一半，并几乎消除了幻觉。该框架通过智能地自动化协议生成、验证和修复，普及了电子结构DFT模拟，从而在世界各地的学术界和工业界开启了大规模筛选并加速了ICME设计循环。

🔬 方法详解

问题定义：论文旨在解决材料模拟领域中，非专业人士难以设置和调试复杂模拟协议的问题。现有的计算材料工程(ICME)工具虽然强大，但需要专业知识，限制了其应用范围。因此，如何降低使用门槛，让更多研究人员能够利用计算模拟加速材料发现，是本文要解决的核心问题。

核心思路：论文的核心思路是构建一个AI代理框架，该框架能够理解人类的自然语言指令，并将其转化为可执行的模拟协议。通过结合知识图谱和大型语言模型，该框架能够自动完成协议生成、验证和修复等步骤，从而降低了对专业知识的依赖。

技术框架：GENIUS框架包含以下几个主要模块：1) Quantum ESPRESSO知识图谱，用于存储和检索模拟相关的知识；2) 分层大型语言模型，用于理解人类指令并生成初步的模拟协议；3) 有限状态错误恢复机，用于检测和修复协议中的错误。整体流程是：用户输入自然语言指令，LLM根据知识图谱生成初步协议，错误恢复机验证协议并进行修复，最终生成可执行的输入文件。

关键创新：该框架的关键创新在于将知识图谱、分层LLM和错误恢复机相结合，形成一个完整的AI代理。这种架构能够有效地利用领域知识，提高协议生成的准确性和可靠性。此外，分层LLM的设计降低了推理成本，并减少了幻觉问题。

关键设计：论文中没有详细描述具体的参数设置、损失函数或网络结构等技术细节。但是，分层LLM的设计是一个关键的设计选择，它允许框架在不同的抽象层次上处理信息，从而提高了效率和准确性。有限状态错误恢复机的设计也至关重要，它能够自动检测和修复协议中的错误，保证模拟的顺利进行。

🖼️ 关键图片

📊 实验亮点

GENIUS在295个不同的基准测试中，成功率达到约80%，其中76%的错误可以自主修复。与仅使用LLM的基线相比，GENIUS将推理成本降低了一半，并几乎消除了幻觉。这些结果表明，GENIUS框架在自动化模拟协议生成方面具有显著优势。

🎯 应用场景

GENIUS框架可广泛应用于材料科学、化学、物理等领域，加速新材料的发现和设计。它能够降低计算模拟的使用门槛，使更多研究人员能够利用计算工具解决实际问题。该框架还有望促进ICME的发展，实现材料设计和制造的智能化。

📄 摘要（原文）

Predictive atomistic simulations have propelled materials discovery, yet routine setup and debugging still demand computer specialists. This know-how gap limits Integrated Computational Materials Engineering (ICME), where state-of-the-art codes exist but remain cumbersome for non-experts. We address this bottleneck with GENIUS, an AI-agentic workflow that fuses a smart Quantum ESPRESSO knowledge graph with a tiered hierarchy of large language models supervised by a finite-state error-recovery machine. Here we show that GENIUS translates free-form human-generated prompts into validated input files that run to completion on $\approx$80% of 295 diverse benchmarks, where 76% are autonomously repaired, with success decaying exponentially to a 7% baseline. Compared with LLM-only baselines, GENIUS halves inference costs and virtually eliminates hallucinations. The framework democratizes electronic-structure DFT simulations by intelligently automating protocol generation, validation, and repair, opening large-scale screening and accelerating ICME design loops across academia and industry worldwide.

GENIUS: An Agentic AI Framework for Autonomous Design and Execution of Simulation Protocols

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理