LLM-guided phase diagram construction through high-throughput experimentation
作者: Ryo Tamura, Haruhiko Morito, Yuna Oikawa, Guillaume Deffrennes, Shoichi Matsuda, Naruki Yoshikawa, Tomoaki Takayama, Taichi Abe, Koji Tsuda, Kei Terayama
分类: cond-mat.mtrl-sci, cs.AI
发布日期: 2026-04-22
备注: 39 pages
💡 一句话要点
利用LLM指导高通量实验,加速多元合金相图构建
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 相图构建 高通量实验 材料发现 实验规划
📋 核心要点
- 传统多元合金相图构建依赖大量实验,耗时且效率低,亟需更高效的实验规划方法。
- 利用通用LLM作为实验规划器,迭代建议实验成分,结合高通量合成与表征,构建相图。
- 实验表明,LLM能有效指导实验,发现新相,且优于传统机器学习方法,提升探索效率。
📝 摘要(中文)
构建多元合金相图需要大量的实验测量,耗时较长。本文研究了大型语言模型(LLM)是否可以指导相图构建的实验规划。该框架中,通用LLM作为实验规划器,在闭环中建议测量成分,并结合高通量合成和X射线衍射相鉴定。通过迭代合成和表征,实验构建了900摄氏度下Co-Al-Ge三元相图。比较了两种策略,它们在初始成分选择上有所不同:一种使用在相图数据上训练的领域特定LLM(aLLoyM)的预测,另一种仅依赖于通用LLM。两种策略表现出互补的优势。aLLoyM将初始测量导向三元图内部成分复杂的区域,从而最早发现了仅在三元系统中形成的所有三种新相。相比之下,通用LLM采用了一种教科书式的方法,在更少的循环中有效地识别了更多的相。此外,将LLM与传统机器学习进行比较的模拟基准测试证实,LLM实现了更有效的探索。结果表明,LLM作为相图构建的实验规划器具有很高的潜力。
🔬 方法详解
问题定义:多元合金相图的构建需要大量的实验测量,这是一个耗时且成本高昂的过程。传统的实验方法往往依赖于人工经验或简单的网格搜索,效率低下,难以快速发现新的相。现有机器学习方法在探索复杂相图时也存在局限性,例如需要大量的训练数据,泛化能力不足等。
核心思路:本文的核心思路是利用大型语言模型(LLM)的强大推理和规划能力,将其作为实验规划器,指导高通量实验,从而加速相图的构建过程。LLM能够根据已有的实验数据和领域知识,预测下一个最有希望的实验成分,从而减少不必要的实验,提高实验效率。
技术框架:该框架是一个闭环系统,包含以下主要模块:1) LLM实验规划器:根据已有的实验数据,建议下一个要合成和表征的合金成分。2) 高通量合成:快速合成LLM建议的合金成分。3) X射线衍射(XRD)相鉴定:利用XRD技术确定合成合金的相组成。4) 数据更新:将XRD结果反馈给LLM,用于更新其知识库和改进后续的实验规划。该循环迭代进行,直到构建出完整的相图。
关键创新:该研究的关键创新在于将通用LLM应用于材料科学领域的实验规划。与传统的机器学习方法相比,LLM具有更强的泛化能力和推理能力,能够更好地处理复杂和不确定的实验环境。此外,该研究还探索了两种不同的LLM策略:一种是使用领域特定的LLM(aLLoyM),另一种是使用通用LLM,并比较了它们的优缺点。
关键设计:在实验中,研究人员使用了Co-Al-Ge三元合金体系作为案例研究。他们比较了两种LLM策略:aLLoyM和通用LLM。aLLoyM是在相图数据上训练的领域特定LLM,能够提供更专业的建议。通用LLM则依赖于其自身的通用知识和推理能力。研究人员还设计了一个模拟基准测试,将LLM与传统的机器学习方法进行了比较,以评估LLM的性能。
📊 实验亮点
实验结果表明,LLM能够有效地指导Co-Al-Ge三元相图的构建。aLLoyM能够更快地发现三元体系中的新相,而通用LLM则能够更有效地识别更多的相。模拟基准测试表明,LLM的探索效率优于传统的机器学习方法。例如,LLM在更少的实验次数下,能够达到与传统方法相似的相图覆盖率。
🎯 应用场景
该研究成果可广泛应用于新材料的发现和优化,例如高温合金、磁性材料、催化剂等。通过LLM指导的实验规划,可以显著缩短材料研发周期,降低研发成本,加速新材料的商业化进程。此外,该方法还可以推广到其他需要大量实验探索的科学领域,例如药物发现、化学合成等。
📄 摘要(原文)
Constructing phase diagrams for multicomponent alloys requires extensive experimental measurements and is a time-consuming task. Here we investigate whether large language models (LLMs) can guide experimental planning for phase diagram construction. In our framework, a general-purpose LLM serves as the experimental planner, suggesting compositions for measurement at each cycle in a closed loop with high-throughput synthesis and X-ray diffraction phase identification. Using this framework, we experimentally constructed the ternary phase diagram of the Co-Al-Ge system at 900 degree C through iterative synthesis and characterization. We compared two strategies that differ in how the initial compositions are selected: one uses predictions from a domain-specific LLM trained on phase diagram data (aLLoyM), while the other relies solely on the general-purpose LLM. The two strategies exhibited complementary strengths. aLLoyM directed the initial measurements toward compositionally complex regions in the interior of the ternary diagram, enabling the earliest discovery of all three novel phases that form only in the ternary system. In contrast, the general-purpose LLM adopted a textbook-like approach which efficiently identified a larger number of phases in fewer cycles. In addition, a simulated benchmark comparing the LLM against conventional machine learning confirmed that the LLM achieves more efficient exploration. The results demonstrate that LLMs have high potential as experimental planners for phase diagram construction.