CatMaster: An Agentic Autonomous System for Computational Heterogeneous Catalysis Research

📄 arXiv: 2601.13508v1 📥 PDF

作者: Honghao Chen, Jiangjie Qiu, Yi Shen Tew, Xiaonan Wang

分类: cond-mat.mtrl-sci, cs.AI

发布日期: 2026-01-20

备注: 25 pages


💡 一句话要点

CatMaster:基于LLM的自主智能体系统,加速计算异构催化研究

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 计算催化 异构催化 密度泛函理论 大型语言模型 自主智能体 高通量筛选 材料设计

📋 核心要点

  1. 计算异构催化研究面临工作流程复杂、耗时、易出错等挑战,严重影响研究效率和结果可重复性。
  2. CatMaster利用LLM驱动的智能体系统,将自然语言请求转化为完整的计算工作空间,自动处理结构生成、输入准备、任务执行和结果记录。
  3. 实验表明,CatMaster能够有效处理多种催化研究任务,包括表面能计算、吸附位点排序和高通量筛选,并支持超出预定义工具集的任务。

📝 摘要(中文)

密度泛函理论(DFT)被广泛用于连接原子结构与催化行为,但计算异构催化研究通常需要耗时、迭代且对设置选择敏感的复杂工作流程。除了第一性原理计算的固有成本和精度限制外,实际工作流程问题,如保持参考文献一致、准备许多相关输入、从计算集群上的失败运行中恢复以及维护已完成工作的完整记录,都会减慢项目进度并使结果难以重现或扩展。本文提出了CatMaster,一个由大型语言模型(LLM)驱动的智能体系统,可以将自然语言请求转换为完整的计算工作空间,包括结构、输入、输出、日志和简洁的运行记录。CatMaster维护关键事实、约束和文件指针的持久项目记录,以支持检查和可重启性。它与一个多保真度工具库配对,该工具库涵盖快速代理松弛和高保真度DFT计算,以便在需要时进行验证。我们在四个复杂度递增的演示中展示了CatMaster:具有远程执行的O2自旋态检查、具有协议敏感性研究和CO吸附位点排序的BCC Fe表面能、用于析氢反应(HER)描述符的Pt--Ni--Cu合金高通量筛选与代理到DFT验证,以及一个超出预定义工具集的演示,包括BCC Fe的状态方程拟合和CO-FeN4-石墨烯单原子催化剂几何结构制备。通过减少手动脚本编写和记录,同时保留完整的证据链,CatMaster旨在帮助催化研究人员专注于建模选择和化学解释,而不是工作流程管理。

🔬 方法详解

问题定义:计算异构催化研究依赖于DFT,但其工作流程繁琐,涉及大量手动操作,例如准备输入文件、提交任务、监控运行状态、记录结果等。这些操作不仅耗时,而且容易出错,导致研究效率低下,结果难以复现。现有方法缺乏自动化和智能化的支持,无法有效应对这些挑战。

核心思路:CatMaster的核心思路是利用LLM作为智能体,将研究人员的自然语言指令转化为一系列可执行的计算任务。LLM负责理解用户意图,调用合适的工具,并协调整个计算流程。通过自动化和智能化,CatMaster旨在减少手动操作,提高研究效率,并确保结果的可重复性。

技术框架:CatMaster的整体架构包括以下几个主要模块:1) LLM驱动的智能体:负责理解用户指令,规划计算流程,并调用合适的工具。2) 多保真度工具库:包含各种计算工具,例如快速代理模型和高精度DFT计算程序。3) 持久项目记录:用于记录关键信息、约束条件和文件指针,支持任务的检查和重启。4) 工作空间管理:负责创建和管理计算工作空间,包括结构、输入、输出和日志文件。

关键创新:CatMaster最重要的技术创新在于将LLM应用于计算异构催化研究,实现了工作流程的自动化和智能化。与传统方法相比,CatMaster无需手动编写脚本和管理文件,大大简化了研究流程。此外,CatMaster还支持多保真度计算,可以根据任务需求选择合适的计算方法,提高计算效率。

关键设计:CatMaster的关键设计包括:1) LLM的选择和训练:选择合适的LLM,并针对催化研究领域进行微调,提高其理解用户意图的能力。2) 工具库的构建:构建包含各种计算工具的工具库,并提供统一的接口,方便LLM调用。3) 项目记录的设计:设计合理的项目记录格式,用于存储关键信息和文件指针,支持任务的检查和重启。4) 工作空间管理策略:采用高效的工作空间管理策略,确保计算任务的顺利执行。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CatMaster在四个演示案例中表现出色:O2自旋态检查、BCC Fe表面能计算(包含协议敏感性研究)、Pt-Ni-Cu合金HER描述符高通量筛选(包含代理模型到DFT验证),以及超出预定义工具集的BCC Fe状态方程拟合和CO-FeN4-石墨烯单原子催化剂几何结构制备。这些案例证明了CatMaster在处理复杂催化研究任务方面的能力。

🎯 应用场景

CatMaster可应用于各种异构催化剂的设计与优化,例如燃料电池催化剂、CO氧化催化剂、氨合成催化剂等。它能够加速催化剂的筛选和优化过程,降低研发成本,并为新催化剂的发现提供新的思路。该系统还可扩展到其他计算材料科学领域,例如电池材料、半导体材料等。

📄 摘要(原文)

Density functional theory (DFT) is widely used to connect atomic structure with catalytic behavior, but computational heterogeneous catalysis studies often require long workflows that are costly, iterative, and sensitive to setup choices. Besides the intrinsic cost and accuracy limits of first-principles calculations, practical workflow issues such as keeping references consistent, preparing many related inputs, recovering from failed runs on computing clusters, and maintaining a complete record of what was done, can slow down projects and make results difficult to reproduce or extend. Here we present CatMaster, a large-language-model (LLM)-driven agent system that turns natural language requests into complete calculation workspaces, including structures, inputs, outputs, logs, and a concise run record. CatMaster maintains a persistent project record of key facts, constraints, and file pointers to support inspection and restartability. It is paired with a multi-fidelity tool library that covers rapid surrogate relaxations and high-fidelity DFT calculations for validation when needed. We demonstrate CatMaster on four demonstrations of increasing complexity: an O2 spin-state check with remote execution, BCC Fe surface energies with a protocol-sensitivity study and CO adsorption site ranking, high-throughput Pt--Ni--Cu alloy screening for hydrogen evolution reaction (HER) descriptors with surrogate-to-DFT validation, and a demonstration beyond the predefined tool set, including equation-of-state fitting for BCC Fe and CO-FeN4-graphene single-atom catalyst geometry preparation. By reducing manual scripting and bookkeeping while keeping the full evidence trail, CatMaster aims to help catalysis researchers focus on modeling choices and chemical interpretation rather than workflow management.