TopoMAS: Large Language Model Driven Topological Materials Multiagent System

📄 arXiv: 2507.04053v1 📥 PDF

作者: Baohua Zhang, Xin Li, Huangchao Xu, Zhong Jin, Quansheng Wu, Ce Li

分类: cond-mat.mtrl-sci, cs.AI

发布日期: 2025-07-05

备注: 13 pages,7 figures,3 tables


💡 一句话要点

TopoMAS:大型语言模型驱动的拓扑材料多智能体系统,加速材料发现。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 拓扑材料 多智能体系统 大型语言模型 材料发现 知识图谱

📋 核心要点

  1. 拓扑材料的设计面临跨尺度挑战和低效的发现流程,阻碍了其在凝聚态物理中的应用。
  2. TopoMAS通过构建多智能体系统,整合多源数据、理论推断和第一性原理验证,实现材料发现流程的自动化。
  3. 实验表明,TopoMAS在保证准确率的同时,显著降低了计算成本,并成功指导发现了新的拓扑相SrSbO3。

📝 摘要(中文)

本文介绍了一种名为TopoMAS(拓扑材料多智能体系统)的交互式人机框架,旨在无缝地协调整个材料发现流程。该流程从用户定义的查询和多源数据检索开始,经过理论推断和晶体结构生成,最终到第一性原理验证。TopoMAS通过将计算结果自主集成到动态知识图谱中,实现闭环并持续改进知识。通过与人类专家的合作,TopoMAS已经指导发现了新的拓扑相SrSbO3,并通过第一性原理计算证实。基准测试表明,TopoMAS在不同的基础大型语言模型上具有强大的适应性,轻量级的Qwen2.5-72B模型实现了94.55%的准确率,同时仅消耗Qwen3-235B的74.3-78.4%的tokens和DeepSeek-V3的83.0%的tokens,并且响应速度是Qwen3-235B的两倍。这种效率使TopoMAS成为计算驱动发现流程的加速器。通过协调理性智能体和自我进化的知识图谱,该框架不仅在拓扑材料方面取得了直接进展,而且为材料科学领域建立了一个可转移、可扩展的范例。

🔬 方法详解

问题定义:拓扑材料的发现和设计是一个复杂且耗时的过程,涉及多尺度模拟和实验验证。现有的材料发现流程效率低下,难以充分利用现有的数据和计算资源。因此,需要一种能够自动化和加速拓扑材料发现流程的框架。

核心思路:TopoMAS的核心思路是利用大型语言模型(LLM)驱动的多智能体系统,将材料发现流程分解为多个可由智能体执行的任务,并通过知识图谱整合和管理材料相关的知识。通过人机协作,可以更有效地探索材料空间,发现新的拓扑材料。

技术框架:TopoMAS的整体架构包含以下几个主要模块:1) 用户查询接口:接收用户定义的材料发现目标。2) 多源数据检索模块:从各种材料数据库和文献中检索相关信息。3) 理论推断模块:利用LLM进行理论预测和筛选。4) 晶体结构生成模块:生成候选材料的晶体结构。5) 第一性原理验证模块:使用第一性原理计算验证候选材料的拓扑性质。6) 知识图谱:存储和管理材料相关的知识,并根据计算结果进行动态更新。

关键创新:TopoMAS的关键创新在于将LLM与多智能体系统相结合,实现材料发现流程的自动化和智能化。通过动态知识图谱,系统能够不断学习和改进,提高材料发现的效率。此外,该框架具有良好的可扩展性,可以方便地集成新的数据源和计算方法。

关键设计:TopoMAS的关键设计包括:1) 智能体的设计:每个智能体负责执行特定的任务,例如数据检索、理论推断或晶体结构生成。智能体之间通过消息传递进行协作。2) 知识图谱的构建:知识图谱存储材料的各种属性和关系,例如晶体结构、电子结构和拓扑性质。3) LLM的选择和训练:选择合适的LLM,并使用材料相关的知识进行微调,以提高其在材料发现任务中的性能。论文中对比了不同LLM的性能,包括Qwen和DeepSeek系列的模型。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,TopoMAS在不同的基础大型语言模型上具有强大的适应性。轻量级的Qwen2.5-72B模型实现了94.55%的准确率,同时仅消耗Qwen3-235B的74.3-78.4%的tokens和DeepSeek-V3的83.0%的tokens,并且响应速度是Qwen3-235B的两倍。此外,TopoMAS成功指导发现了新的拓扑相SrSbO3,并通过第一性原理计算证实。

🎯 应用场景

TopoMAS可应用于拓扑材料、超导材料等新型功能材料的发现与设计,加速新材料的研发进程。该框架还可扩展到其他科学领域,例如药物发现、化学合成等,为科学研究提供强大的自动化工具,具有广阔的应用前景。

📄 摘要(原文)

Topological materials occupy a frontier in condensed-matter physics thanks to their remarkable electronic and quantum properties, yet their cross-scale design remains bottlenecked by inefficient discovery workflows. Here, we introduce TopoMAS (Topological materials Multi-Agent System), an interactive human-AI framework that seamlessly orchestrates the entire materials-discovery pipeline: from user-defined queries and multi-source data retrieval, through theoretical inference and crystal-structure generation, to first-principles validation. Crucially, TopoMAS closes the loop by autonomously integrating computational outcomes into a dynamic knowledge graph, enabling continuous knowledge refinement. In collaboration with human experts, it has already guided the identification of novel topological phases SrSbO3, confirmed by first-principles calculations. Comprehensive benchmarks demonstrate robust adaptability across base Large Language Model, with the lightweight Qwen2.5-72B model achieving 94.55% accuracy while consuming only 74.3-78.4% of tokens required by Qwen3-235B and 83.0% of DeepSeek-V3's usage--delivering responses twice as fast as Qwen3-235B. This efficiency establishes TopoMAS as an accelerator for computation-driven discovery pipelines. By harmonizing rational agent orchestration with a self-evolving knowledge graph, our framework not only delivers immediate advances in topological materials but also establishes a transferable, extensible paradigm for materials-science domain.