A Foundation Model for Non-Destructive Defect Identification from Vibrational Spectra
作者: Mouyang Cheng, Chu-Liang Fu, Bowen Yu, Eunbi Rha, Abhijatmedhi Chotrattanapituk, Douglas L Abernathy, Yongqiang Cheng, Mingda Li
分类: cond-mat.mtrl-sci, cs.LG
发布日期: 2025-05-31
备注: 14 pages, 5 figures
💡 一句话要点
提出DefectNet,通过振动谱实现材料中缺陷的无损识别与定量分析。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 缺陷识别 无损检测 振动光谱 深度学习 材料表征 声子态密度 注意力机制
📋 核心要点
- 现有缺陷表征方法难以无损地识别和量化多种共存的缺陷,限制了材料性能的优化。
- DefectNet通过定制的注意力机制,直接从振动谱预测多种缺陷元素的化学身份和浓度。
- 实验验证表明,DefectNet在SiGe合金和MgB$_2$超导体上表现出良好的准确性和可迁移性。
📝 摘要(中文)
固体的缺陷普遍存在,严重影响材料的机械和功能特性。然而,对缺陷进行无损表征和定量分析,尤其是在多种类型缺陷共存的情况下,仍然是一个长期存在的挑战。本文介绍了一种基础机器学习模型DefectNet,它可以直接从振动谱(特别是声子态密度(PDoS))预测替代点缺陷的化学身份和浓度,其中多种元素共存。DefectNet在来自2000种半导体的超过16000个模拟谱上进行训练,采用定制的注意力机制来识别浓度范围从0.2%到25%的最多六种不同的缺陷元素。该模型可以很好地推广到56种元素中未见过的晶体,并且可以在实验数据上进行微调。使用SiGe合金和MgB$_2$超导体的非弹性散射测量进行的验证证明了其准确性和可迁移性。我们的工作将振动光谱学确立为一种可行的、用于体材料中点缺陷量化的无损探针,并突出了基础模型在数据驱动的缺陷工程中的前景。
🔬 方法详解
问题定义:论文旨在解决固体材料中多种共存点缺陷的无损识别和定量分析难题。现有方法,如透射电子显微镜(TEM)等,通常具有破坏性,且难以有效区分和量化多种缺陷类型。因此,发展一种能够从宏观测量中推断微观缺陷信息的无损方法至关重要。
核心思路:论文的核心思路是利用振动光谱(特别是声子态密度PDoS)作为材料缺陷的指纹,并训练一个深度学习模型(DefectNet)来学习PDoS与缺陷类型和浓度之间的映射关系。通过大量的模拟数据训练,使模型能够泛化到未知的晶体结构和缺陷组合。
技术框架:DefectNet的整体框架包括以下几个主要阶段:1) 生成大规模的缺陷材料的PDoS模拟数据集;2) 构建基于注意力机制的深度学习模型,用于从PDoS谱中提取特征;3) 使用模拟数据训练DefectNet,使其能够预测缺陷元素的化学身份和浓度;4) 在实验数据上对模型进行微调和验证。
关键创新:该论文最重要的技术创新点在于将振动光谱学与深度学习相结合,构建了一个能够进行缺陷无损识别和定量分析的基础模型。与传统方法相比,DefectNet具有无损、高效、可处理多种缺陷共存等优点。此外,定制的注意力机制能够有效提取PDoS谱中的关键特征,提高模型的预测准确性。
关键设计:DefectNet的关键设计包括:1) 使用密度泛函理论(DFT)计算模拟PDoS谱;2) 设计了一种定制的注意力机制,用于从PDoS谱中提取与缺陷相关的特征;3) 使用均方误差(MSE)作为损失函数,优化模型预测的缺陷浓度;4) 模型输入为PDoS谱,输出为缺陷元素的化学身份和浓度。具体网络结构未知。
🖼️ 关键图片
📊 实验亮点
DefectNet在模拟数据上表现出良好的预测准确性,能够识别多达六种不同的缺陷元素,浓度范围从0.2%到25%。在SiGe合金和MgB$_2$超导体上的实验验证表明,DefectNet能够准确预测缺陷浓度,并具有良好的可迁移性。具体性能数据未知。
🎯 应用场景
DefectNet的应用场景广泛,包括材料科学、凝聚态物理、半导体器件等领域。它可以用于新材料的缺陷表征、材料性能优化、器件可靠性评估等方面。通过无损地识别和量化材料中的缺陷,可以加速新材料的研发进程,提高器件的性能和寿命,并为材料的缺陷工程提供数据支撑。
📄 摘要(原文)
Defects are ubiquitous in solids and strongly influence materials' mechanical and functional properties. However, non-destructive characterization and quantification of defects, especially when multiple types coexist, remain a long-standing challenge. Here we introduce DefectNet, a foundation machine learning model that predicts the chemical identity and concentration of substitutional point defects with multiple coexisting elements directly from vibrational spectra, specifically phonon density-of-states (PDoS). Trained on over 16,000 simulated spectra from 2,000 semiconductors, DefectNet employs a tailored attention mechanism to identify up to six distinct defect elements at concentrations ranging from 0.2% to 25%. The model generalizes well to unseen crystals across 56 elements and can be fine-tuned on experimental data. Validation using inelastic scattering measurements of SiGe alloys and MgB$_2$ superconductor demonstrates its accuracy and transferability. Our work establishes vibrational spectroscopy as a viable, non-destructive probe for point defect quantification in bulk materials, and highlights the promise of foundation models in data-driven defect engineering.