ChemGraph-XANES: An Agentic Framework for XANES Simulation and Analysis

📄 arXiv: 2604.16205v1 📥 PDF

作者: Vitor F. Grizzi, Thang Duc Pham, Luke N. Pretzie, Jiayi Xu, Murat Keceli, Cong Liu

分类: cond-mat.mtrl-sci, cs.AI, physics.chem-ph

发布日期: 2026-04-17


💡 一句话要点

ChemGraph-XANES:用于XANES模拟和分析的Agentic框架,简化工作流程并实现高通量计算。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: XANES模拟 计算光谱学 大型语言模型 自动化工作流程 高通量计算

📋 核心要点

  1. 现有计算XANES方法受限于复杂的工作流程,阻碍了其在大规模化学系统中的应用。
  2. ChemGraph-XANES利用LLM代理自动化XANES模拟和分析,简化了任务规范、结构获取和参数选择等步骤。
  3. 该框架支持基于自然语言的任务请求和高通量计算,为XANES数据库生成和机器学习应用提供了可扩展的解决方案。

📝 摘要(中文)

计算X射线吸收近边结构(XANES)被广泛用于探测化学复杂系统中的局部配位环境、氧化态和电子结构。然而,大规模使用计算XANES的瓶颈更多在于工作流程的复杂性,而非底层的模拟方法本身。为了解决这一挑战,我们提出了ChemGraph-XANES,一个用于自动化XANES模拟和分析的agentic框架,它统一了自然语言任务规范、结构获取、FDMNES输入生成、任务并行执行、光谱归一化和可追溯的数据管理。该框架构建于ASE、FDMNES、Parsl和一个基于LangGraph/LangChain的工具接口之上,将XANES工作流程操作作为类型化的Python工具公开,这些工具可以由大型语言模型(LLM)代理进行编排。在多代理模式下,一个检索增强的专家代理查阅FDMNES手册以确定参数选择,而执行器代理将用户请求转换为结构化的工具调用。我们展示了基于文档的参数检索,并表明相同的工作流程支持显式的结构文件输入和化学级别的自然语言请求。由于独立的XANES计算天然是任务并行的,因此该框架非常适合于高性能计算(HPC)系统上的高通量部署,从而能够生成可扩展的XANES数据库,用于下游分析和机器学习应用。因此,ChemGraph-XANES为基于物理的XANES模拟、光谱管理和代理兼容的计算光谱学提供了一个可重现且可扩展的工作流程层。

🔬 方法详解

问题定义:论文旨在解决计算XANES工作流程复杂、效率低下的问题。现有方法需要手动配置大量参数,且难以实现高通量计算,限制了其在复杂化学系统中的应用。

核心思路:论文的核心思路是利用大型语言模型(LLM)构建一个agentic框架,将XANES模拟和分析过程中的各个步骤自动化。通过将XANES工作流程操作封装为Python工具,并由LLM代理进行编排,从而简化用户操作,提高计算效率。

技术框架:ChemGraph-XANES框架包含以下主要模块:1) 自然语言任务规范模块,允许用户使用自然语言描述XANES模拟任务;2) 结构获取模块,用于从各种来源获取分子结构;3) FDMNES输入生成模块,自动生成FDMNES模拟所需的输入文件;4) 任务并行执行模块,利用Parsl实现高通量计算;5) 光谱归一化模块,对模拟得到的光谱进行归一化处理;6) 数据管理模块,用于管理和追溯计算数据。框架基于ASE、FDMNES、Parsl和LangGraph/LangChain构建。

关键创新:该框架的关键创新在于将LLM代理引入到XANES模拟和分析流程中。通过构建一个检索增强的专家代理,可以自动查阅FDMNES手册,并根据用户需求选择合适的参数。此外,该框架还支持基于自然语言的任务请求,降低了用户的使用门槛。

关键设计:框架使用LangGraph/LangChain构建工具接口,将XANES工作流程操作封装为类型化的Python工具。在多代理模式下,检索增强的专家代理负责参数选择,执行器代理负责将用户请求转换为结构化的工具调用。框架利用Parsl实现任务并行,从而支持高通量计算。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文展示了ChemGraph-XANES框架在自动化参数选择和高通量计算方面的能力。实验结果表明,该框架能够根据用户需求自动选择合适的FDMNES参数,并支持基于自然语言的任务请求。此外,该框架还能够利用高性能计算资源实现大规模XANES模拟,为材料科学研究提供有力支持。

🎯 应用场景

ChemGraph-XANES可应用于材料科学、化学、催化等领域,用于研究材料的电子结构、局部配位环境和氧化态。该框架能够加速XANES数据库的构建,为机器学习模型的训练提供数据支持,并促进计算光谱学的发展。未来,该框架可扩展到其他计算光谱学方法,例如EELS和EXAFS。

📄 摘要(原文)

Computational X-ray absorption near-edge structure (XANES) is widely used to probe local coordination environments, oxidation states, and electronic structure in chemically complex systems. However, the use of computational XANES at scale is constrained more by workflow complexity than by the underlying simulation method itself. To address this challenge, we present ChemGraph-XANES, an agentic framework for automated XANES simulation and analysis that unifies natural-language task specification, structure acquisition, FDMNES input generation, task-parallel execution, spectral normalization, and provenance-aware data curation. Built on ASE, FDMNES, Parsl, and a LangGraph/LangChain-based tool interface, the framework exposes XANES workflow operations as typed Python tools that can be orchestrated by large language model (LLM) agents. In multi-agent mode, a retrieval-augmented expert agent consults the FDMNES manual to ground parameter selection, while executor agents translate user requests into structured tool calls. We demonstrate documentation-grounded parameter retrieval and show that the same workflow supports both explicit structure-file inputs and chemistry-level natural-language requests. Because independent XANES calculations are naturally task-parallel, the framework is well suited for high-throughput deployment on high-performance computing (HPC) systems, enabling scalable XANES database generation for downstream analysis and machine-learning applications. ChemGraph-XANES thus provides a reproducible and extensible workflow layer for physics-based XANES simulation, spectral curation, and agent-compatible computational spectroscopy.