Agentic Design of Compositional Descriptors via Autoresearch for Materials Science Applications

📄 arXiv: 2605.14671v1 📥 PDF

作者: Matteo Cobelli, Stefano Sanvito

分类: cond-mat.mtrl-sci, cs.AI

发布日期: 2026-05-14


💡 一句话要点

提出Automat框架,利用自主研究设计化学描述符,提升材料性质预测精度。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自主研究 材料描述符 材料性质预测 大型语言模型 特征工程

📋 核心要点

  1. 现有材料性质预测方法依赖手动特征工程,耗时且依赖专家知识,缺乏自动化和泛化能力。
  2. Automat框架利用大型语言模型作为智能体,自动生成和优化化学成分描述符,无需人工干预。
  3. 实验表明,Automat在预测材料带隙和居里温度方面优于传统方法,并生成了可解释的描述符。

📝 摘要(中文)

本文提出了一种名为Automat的自主研究框架,用于自动设计材料科学中的成分描述符。该框架利用大型语言模型作为编码智能体,生成化学化合物的成分描述符,并使用随机森林工作流程评估其性能。智能体仅限于从化学式中提取信息,并迭代地提出、实现和测试化学驱动的描述符策略。作者将Automat应用于预测无机材料的实验带隙和铁磁化合物的居里温度。结果表明,Automat在两个任务中均优于分数成分、Magpie以及组合的分数成分/Magpie基线,同时生成了化学上可解释的描述符族。该研究证明了自主研究智能体可以在运行时生成有竞争力的、特定于任务的材料描述符,而无需手动特征工程。同时也揭示了当前局限性,包括描述符冗余、对贪婪特征扩展的敏感性以及对显式复杂性控制、描述符修剪和更复杂搜索策略的需求。

🔬 方法详解

问题定义:论文旨在解决材料科学中材料性质预测任务中,依赖人工特征工程的问题。现有方法需要领域专家手动设计描述符,过程耗时且主观,难以自动化和泛化。这些手动设计的描述符可能并非最优,且难以适应不同的材料体系和性质预测任务。

核心思路:论文的核心思路是利用自主研究(Autoresearch)范式,让AI智能体自动探索和设计材料描述符。通过定义一个量化的目标函数(例如预测精度),智能体可以迭代地提出、实现、评估和改进候选描述符,从而在没有人工干预的情况下找到更优的描述符。

技术框架:Automat框架包含以下主要模块:1) 编码智能体:基于大型语言模型(例如GPT-5.5),负责生成描述符的Python代码。2) 评估模块:使用随机森林模型评估描述符的预测性能。3) 迭代优化:智能体根据评估结果,调整描述符生成策略,进行迭代优化。整个流程是闭环的,智能体不断学习和改进,最终生成高性能的描述符。

关键创新:最重要的技术创新点在于将大型语言模型应用于材料描述符的自动设计。与传统的特征选择或特征工程方法不同,Automat能够从头开始生成全新的描述符,而不仅仅是选择或组合现有的特征。这种方法具有更大的灵活性和潜力,可以发现人工难以设计的描述符。

关键设计:1) 描述符生成策略:智能体被限制在仅使用化学式信息来生成描述符,以保证描述符的化学可解释性。2) 奖励函数:使用预测精度作为奖励函数,引导智能体生成更准确的描述符。3) 迭代次数:设置迭代次数上限,以控制计算成本。4) 描述符复杂性控制:论文中提到需要显式地控制描述符的复杂性,但具体实现细节未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

Automat框架在预测无机材料的实验带隙和铁磁化合物的居里温度方面,均优于分数成分、Magpie以及组合的分数成分/Magpie基线。这表明自主研究智能体可以在没有人工干预的情况下,生成有竞争力的、特定于任务的材料描述符。虽然具体提升幅度未知,但结果证明了该方法的有效性。

🎯 应用场景

该研究成果可应用于新材料的发现和设计,加速材料研发过程。通过自动生成高性能的材料描述符,可以更准确地预测材料的各种性质,例如带隙、居里温度、机械强度等,从而减少实验试错成本,提高研发效率。该方法还可扩展到其他材料体系和性质预测任务,具有广泛的应用前景。

📄 摘要(原文)

Autoresearch offers a flexible paradigm for automating scientific tasks, in which an AI agent proposes, implements, evaluates, and refines candidate solutions against a quantitative objective. Here, we use composition-based materials-property prediction to test whether such agents can perform a task beyond model selection and hyperparameter optimization: the design of input descriptors. We introduce Automat, an autoresearch framework where a coding agent based on a large language model generates composition-only descriptors for chemical compounds and evaluates them using a random forest workflow. The agent is restricted to information derivable from chemical formulas and iteratively proposes, implements, and tests chemically motivated descriptor strategies. We apply Automat, with OpenAI Codex using GPT-5.5 as the coding agent, to the prediction of experimental band gaps in inorganic materials and Curie temperatures in ferromagnetic compounds. In both tasks, Automat improves over fractional-composition, Magpie, and combined fractional-composition/Magpie baselines, while producing descriptor families that are chemically interpretable. These results provide a demonstration that autoresearch agents can generate competitive, task-specific materials descriptors without manual feature engineering during the run. They also reveal current limitations, including descriptor redundancy, sensitivity to greedy feature expansion, and the need for explicit complexity control, descriptor pruning, and more sophisticated search strategies.