Towards a Foundation-Model Paradigm for Aerodynamic Prediction in Three-dimensional Design
作者: Yunjia Yang, Babak Gholami, Caglar Gurbuz, Mohammad Rashed, Nils Thuerey
分类: cs.LG, physics.flu-dyn
发布日期: 2026-04-20
🔗 代码/项目: GITHUB
💡 一句话要点
提出AeroTransformer,通过预训练-微调范式提升三维气动预测精度。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 气动预测 预训练模型 迁移学习 Transformer 三维设计
📋 核心要点
- 现有气动预测模型难以应用于复杂三维结构,主要挑战在于训练数据生成成本高昂。
- 论文提出预训练-微调范式,先在大规模数据集上预训练模型,再用少量特定任务数据微调。
- 实验表明,该方法在跨音速机翼表面流预测中,仅用450个样本就将误差降低了84.2%。
📝 摘要(中文)
为了加速形状优化,精确的气动预测机器学习模型至关重要。然而,由于生成训练数据的高成本,为复杂三维结构开发此类模型仍然具有挑战性。本研究提出了一种高效构建精确代理模型的方法,首先在多样化的几何形状上预训练一个大规模模型,然后使用少量更详细的特定任务样本进行微调。开发了一种基于Transformer的架构AeroTransformer,并针对大规模训练进行了定制,以学习空气动力学。该方法在跨音速机翼上进行了评估,模型在SuperWing数据集(包含近30000个具有广泛几何多样性的样本)上进行预训练,随后进行微调以处理从通用研究模型扰动产生的特定机翼形状。结果表明,使用450个特定任务的样本,所提出的方法在表面流预测中实现了0.36%的误差,与从头开始训练相比降低了84.2%。还系统地研究了模型配置和训练策略的影响,为在有限的数据和计算预算下有效训练和部署此类模型提供了指导。为了方便重用,我们在https://github.com/tum-pbs/AeroTransformer发布了数据集和预训练模型。还在预训练模型上构建了一个交互式设计工具,可在https://webwing.pbs.cit.tum.de在线获取。
🔬 方法详解
问题定义:论文旨在解决三维气动预测中,由于训练数据获取成本高昂,导致机器学习模型难以有效应用于复杂几何形状的问题。现有方法通常需要大量特定任务的数据进行训练,这在实际工程应用中往往难以满足。
核心思路:论文的核心思路是采用预训练-微调的迁移学习范式。首先,利用一个包含大量不同几何形状的数据集(SuperWing)预训练一个通用的气动预测模型。然后,针对特定的任务(例如,预测特定机翼形状的气动特性),使用少量特定任务的数据对预训练模型进行微调。这样可以充分利用大规模数据集中的通用知识,从而减少对特定任务数据的需求。
技术框架:整体框架包含两个主要阶段:预训练阶段和微调阶段。在预训练阶段,AeroTransformer模型在大规模的SuperWing数据集上进行训练,学习通用的气动特性表示。在微调阶段,使用特定任务的数据对预训练的AeroTransformer模型进行微调,使其适应特定任务的需求。该框架还包括一个交互式设计工具,允许用户基于预训练模型进行气动设计。
关键创新:论文的关键创新在于将预训练-微调范式成功应用于三维气动预测领域,并提出了专门针对气动预测任务设计的Transformer架构AeroTransformer。与传统的从头开始训练的方法相比,该方法能够显著降低对特定任务数据的需求,并提高预测精度。
关键设计:AeroTransformer模型基于Transformer架构,并针对气动预测任务进行了定制。具体的技术细节包括:输入数据的表示方式(例如,表面网格坐标和流动参数),Transformer模型的结构(例如,注意力机制的实现方式),以及损失函数的设计(例如,表面流预测的均方误差)。此外,论文还研究了不同的训练策略和模型配置对性能的影响,并给出了在有限数据和计算预算下有效训练和部署模型的指导。
📊 实验亮点
实验结果表明,使用450个特定任务样本对预训练的AeroTransformer模型进行微调后,在跨音速机翼表面流预测中实现了0.36%的误差,与从头开始训练相比,误差降低了84.2%。这表明该方法能够显著提高气动预测的精度,并降低对特定任务数据的需求。此外,论文还系统地研究了模型配置和训练策略的影响,为实际应用提供了有价值的指导。
🎯 应用场景
该研究成果可广泛应用于航空航天工程领域,例如飞行器气动外形优化设计、飞行器性能预测与评估等。通过预训练模型,可以显著降低气动设计过程中的计算成本和时间周期,加速新一代飞行器的研发。此外,该方法还可以推广到其他涉及复杂流体动力学问题的领域,例如汽车空气动力学设计、风力发电机叶片优化等。
📄 摘要(原文)
Accurate machine-learning models for aerodynamic prediction are essential for accelerating shape optimization, yet remain challenging to develop for complex three-dimensional configurations due to the high cost of generating training data. This work introduces a methodology for efficiently constructing accurate surrogate models for design purposes by first pre-training a large-scale model on diverse geometries and then fine-tuning it with a few more detailed task-specific samples. A Transformer-based architecture, AeroTransformer, is developed and tailored for large-scale training to learn aerodynamics. The methodology is evaluated on transonic wings, where the model is pre-trained on SuperWing, a dataset of nearly 30000 samples with broad geometric diversity, and subsequently fine-tuned to handle specific wing shapes perturbed from the Common Research Model. Results show that, with 450 task-specific samples, the proposed methodology achieves 0.36% error on surface-flow prediction, reducing 84.2% compared to training from scratch. The influence of model configurations and training strategies is also systematically studied to provide guidance on effectively training and deploying such models under limited data and computational budgets. To facilitate reuse, we release the datasets and the pre-trained models at https://github.com/tum-pbs/AeroTransformer. An interactive design tool is also built on the pre-trained model and is available online at https://webwing.pbs.cit.tum.de.