A preliminary data fusion study to assess the feasibility of Foundation Process-Property Models in Laser Powder Bed Fusion

📄 arXiv: 2503.16667v1 📥 PDF

作者: Oriol Vendrell-Gallart, Nima Negarandeh, Zahra Zanjani Foumani, Mahsa Amiri, Lorenzo Valdevit, Ramin Bostanabad

分类: cs.LG

发布日期: 2025-03-20


💡 一句话要点

针对激光粉末床熔融中数据稀缺问题,提出基于高斯过程的数据融合可行性评估方法。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 激光粉末床熔融 数据融合 高斯过程 工艺-性能建模 增材制造

📋 核心要点

  1. 增材制造工艺优化面临数据稀缺挑战,阻碍了基础工艺-性能模型的构建。
  2. 通过受控实验和高斯过程建模,研究不同材料和属性间信息传递的可行性。
  3. 结果表明,在数据有限情况下,结合领域知识的结构化学习优于无信息数据融合。

📝 摘要(中文)

基础模型在越来越多的关键应用中处于领先地位。对于增材制造(AM)等技术,这些模型有潜力显著加速工艺优化,进而促进下一代材料的设计。构建基础工艺-性能模型的主要挑战是数据稀缺。为了理解这一挑战的影响,并且由于基础模型依赖于数据融合,本文进行了受控实验,重点关注不同材料系统和属性之间的信息可传递性。具体而言,我们从激光粉末床熔融(LPBF)中的17-4 PH和316L不锈钢(SSs)生成实验数据集,测量五个工艺参数对孔隙率和硬度的影响。然后,我们利用高斯过程(GPs)进行工艺-性能建模,通过各种配置测试关于一种材料系统或属性的知识是否可以用于为其他材料系统或属性构建更准确的机器学习模型。通过广泛的交叉验证研究和探究GPs的可解释超参数,我们研究了数据大小和维度、工艺-性能关系的复杂性、噪声以及机器学习模型的特征之间的复杂关系。我们的研究结果强调,在数据有限的应用中,需要结合领域知识的结构化学习方法来构建基础工艺-性能模型,而不是依赖于无信息的数据融合。

🔬 方法详解

问题定义:论文旨在解决激光粉末床熔融(LPBF)工艺中,由于数据稀缺导致难以构建准确的工艺-性能基础模型的问题。现有方法依赖大量数据,但在新材料或新工艺条件下,数据获取成本高昂,限制了模型泛化能力。因此,如何有效利用少量数据,并融合不同材料或属性的信息,是亟待解决的痛点。

核心思路:论文的核心思路是探索不同材料系统(17-4 PH和316L不锈钢)和不同属性(孔隙率和硬度)之间的数据融合可行性。通过评估一种材料或属性的知识能否迁移到另一种材料或属性的建模中,从而在数据有限的情况下提升模型性能。这种思路旨在利用不同数据集之间的相关性,减少对大量独立数据的依赖。

技术框架:论文的技术框架主要包括以下几个阶段:1)实验数据生成:通过LPBF工艺,控制五个工艺参数,分别针对17-4 PH和316L不锈钢生成数据集,测量孔隙率和硬度。2)高斯过程建模:利用高斯过程(GPs)对工艺-性能关系进行建模,采用不同的配置,例如单独训练、联合训练等,以测试数据融合的效果。3)交叉验证:通过广泛的交叉验证,评估不同配置下模型的预测性能。4)超参数分析:探究GPs的可解释超参数,分析数据大小、维度、关系复杂性、噪声等因素对模型性能的影响。

关键创新:论文的关键创新在于系统性地评估了在LPBF工艺中,不同材料和属性之间数据融合的可行性。通过实验和建模,揭示了数据大小、维度、关系复杂性等因素对数据融合效果的影响,并强调了在数据有限情况下,结合领域知识的结构化学习的重要性。这与以往盲目追求大数据和无信息数据融合的方法不同,为LPBF工艺优化提供了更有效的策略。

关键设计:论文的关键设计包括:1)选择17-4 PH和316L不锈钢作为研究对象,这两种材料在LPBF工艺中应用广泛,具有代表性。2)选择孔隙率和硬度作为性能指标,这两个指标直接影响材料的力学性能。3)采用高斯过程作为建模方法,GPs具有非参数性、能够提供预测不确定性等优点,适合小样本建模。4)通过交叉验证和超参数分析,对数据融合效果进行全面评估。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,在数据有限的情况下,简单的数据融合并不一定能提升模型性能。通过交叉验证和超参数分析发现,当不同材料或属性之间关系复杂、噪声较大时,单独训练的模型可能优于融合后的模型。该研究强调了在数据融合前进行充分的领域知识分析和结构化学习的重要性。

🎯 应用场景

该研究成果可应用于增材制造工艺优化、新材料开发和工艺参数选择。通过有效的数据融合策略,可以减少实验次数,降低研发成本,加速新材料的推广应用。此外,该方法也适用于其他数据稀缺的工程领域,例如材料科学、化学工程等。

📄 摘要(原文)

Foundation models are at the forefront of an increasing number of critical applications. In regards to technologies such as additive manufacturing (AM), these models have the potential to dramatically accelerate process optimization and, in turn, design of next generation materials. A major challenge that impedes the construction of foundation process-property models is data scarcity. To understand the impact of this challenge, and since foundation models rely on data fusion, in this work we conduct controlled experiments where we focus on the transferability of information across different material systems and properties. More specifically, we generate experimental datasets from 17-4 PH and 316L stainless steels (SSs) in Laser Powder Bed Fusion (LPBF) where we measure the effect of five process parameters on porosity and hardness. We then leverage Gaussian processes (GPs) for process-property modeling in various configurations to test if knowledge about one material system or property can be leveraged to build more accurate machine learning models for other material systems or properties. Through extensive cross-validation studies and probing the GPs' interpretable hyperparameters, we study the intricate relation among data size and dimensionality, complexity of the process-property relations, noise, and characteristics of machine learning models. Our findings highlight the need for structured learning approaches that incorporate domain knowledge in building foundation process-property models rather than relying on uninformed data fusion in data-limited applications.