AdditiveLLM: Large Language Models Predict Defects in Additive Manufacturing
作者: Peter Pak, Amir Barati Farimani
分类: cs.LG
发布日期: 2025-01-29
期刊: Additive Manufacturing Letters, Vol. 14, July 2025, Article 100292
DOI: 10.1016/j.addlet.2025.100292
💡 一句话要点
AdditiveLLM:利用大语言模型预测增材制造中的缺陷
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 增材制造 缺陷预测 大语言模型 工艺参数优化 自然语言处理
📋 核心要点
- 增材制造中,工艺参数与缺陷之间关系复杂,现有方法难以准确预测缺陷。
- AdditiveLLM通过微调大语言模型,学习工艺参数与缺陷类型之间的映射关系。
- 实验表明,该模型在预测缺陷类型方面表现出色,准确率高达93%。
📝 摘要(中文)
本文研究了大语言模型在预测增材制造缺陷方面的能力,给定一组工艺参数输入,模型能够预测缺陷类型。为此,我们利用工艺参数缺陷数据集对一系列模型(命名为AdditiveLLM)进行微调,以预测潜在的缺陷类型,包括匙孔缺陷、未熔合和球化。我们比较了不同的输入格式化方法,以评估模型在稀疏的基线数据集和自然语言提示数据集上正确预测缺陷类型的性能。结果表明,该模型具有强大的预测能力,在被要求提供与一组工艺参数相关的缺陷类型时,准确率达到93%。自然语言输入的加入进一步简化了工艺参数选择的任务,使用户能够识别特定于其构建的最佳设置。
🔬 方法详解
问题定义:增材制造过程中,工艺参数(如激光功率、扫描速度等)的设置对最终产品的质量至关重要。不合适的参数会导致各种缺陷,如匙孔缺陷、未熔合和球化等。现有方法,例如传统的机器学习模型,在处理高维、稀疏的工艺参数数据时,预测精度往往不高,且泛化能力有限。此外,用户需要具备专业的知识才能选择合适的参数,这增加了增材制造的门槛。
核心思路:本文的核心思路是利用大语言模型(LLM)强大的学习和推理能力,直接从工艺参数数据中学习缺陷预测模型。通过将工艺参数和缺陷类型视为文本数据,并对LLM进行微调,使其能够理解工艺参数与缺陷之间的复杂关系。这种方法无需复杂的特征工程,并且可以利用自然语言提示来简化用户交互。
技术框架:AdditiveLLM的整体框架包括以下几个主要步骤:1) 数据收集与准备:收集包含工艺参数和对应缺陷类型的数据集。2) 输入格式化:将工艺参数数据转换为LLM可以理解的文本格式,包括数值型参数和自然语言描述。3) 模型微调:使用准备好的数据集对预训练的LLM进行微调,使其能够预测给定工艺参数下的缺陷类型。4) 模型评估:使用测试数据集评估微调后的模型的预测准确率。
关键创新:本文的关键创新在于将大语言模型应用于增材制造缺陷预测领域。与传统的机器学习方法相比,LLM具有更强的学习能力和泛化能力,能够更好地处理高维、稀疏的工艺参数数据。此外,通过引入自然语言提示,简化了用户交互,使得非专业人员也能轻松选择合适的工艺参数。
关键设计:在模型微调过程中,采用了交叉熵损失函数来优化模型的预测性能。针对不同的输入格式(数值型参数和自然语言描述),设计了不同的提示模板。实验中,使用了多种预训练的LLM,并比较了它们在缺陷预测任务上的性能。具体参数设置和网络结构细节未在论文中详细描述,属于未知信息。
🖼️ 关键图片
📊 实验亮点
AdditiveLLM在增材制造缺陷预测任务中表现出色,在工艺参数缺陷数据集上实现了93%的预测准确率。该模型能够有效地预测匙孔缺陷、未熔合和球化等常见缺陷类型。此外,通过引入自然语言提示,简化了用户交互,使得非专业人员也能轻松使用该模型。
🎯 应用场景
该研究成果可应用于增材制造的工艺参数优化、缺陷预测和质量控制等领域。通过使用AdditiveLLM,用户可以快速找到合适的工艺参数,减少缺陷的发生,提高产品质量和生产效率。此外,该模型还可以用于在线监测增材制造过程,及时发现潜在的缺陷,并进行调整,从而实现智能化的增材制造。
📄 摘要(原文)
In this work we investigate the ability of large language models to predict additive manufacturing defect regimes given a set of process parameter inputs. For this task we utilize a process parameter defect dataset to fine-tune a collection of models, titled AdditiveLLM, for the purpose of predicting potential defect regimes including Keyholing, Lack of Fusion, and Balling. We compare different methods of input formatting in order to gauge the model's performance to correctly predict defect regimes on our sparse Baseline dataset and our natural language Prompt dataset. The model displays robust predictive capability, achieving an accuracy of 93\% when asked to provide the defect regimes associated with a set of process parameters. The incorporation of natural language input further simplifies the task of process parameters selection, enabling users to identify optimal settings specific to their build.