Autoregressive long-horizon prediction of plasma edge dynamics
作者: Hunor Csala, Sebastian De Pascuale, Paul Laiu, Jeremy Lore, Jae-Sun Park, Pei Zhang
分类: physics.plasm-ph, cs.AI
发布日期: 2025-12-29
💡 一句话要点
提出基于Transformer的自回归模型,用于高效预测等离子体边缘动力学
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 等离子体边缘动力学 Transformer模型 自回归预测 聚变装置 SOLPS-ITER
📋 核心要点
- 高精度等离子体边缘模拟计算成本高昂,限制了参数扫描和长时间研究。
- 利用Transformer构建自回归替代模型,加速等离子体边缘状态场的预测。
- 实验表明,该模型预测速度远超传统方法,并能稳定预测较长时间范围。
📝 摘要(中文)
精确建模刮削层(SOL)和偏滤器边缘动力学对于设计聚变装置中的面向等离子体部件至关重要。高保真边缘流体/中性代码(如SOLPS-ITER)能够高精度地捕捉SOL物理,但其计算成本限制了广泛的参数扫描和长时间瞬态研究。本文提出了一种基于Transformer的自回归替代模型,用于高效预测二维、时变等离子体边缘状态场。该模型在SOLPS-ITER时空数据上进行训练,能够预测电子温度、电子密度和辐射功率在较长时间范围内的变化。我们评估了使用不同自回归范围(1-100步)训练的模型变体在短时和长时预测任务上的表现。更长的训练范围能够系统地提高rollout稳定性并减轻误差累积,从而实现数百到数千步的稳定预测,并重现高辐射区域的运动等关键动力学特征。端到端测量结果表明,该替代模型比SOLPS-ITER快几个数量级,从而能够快速进行参数探索。当替代模型进入训练数据集中未表示的物理状态时,预测精度会下降,这促使未来研究关注数据丰富和物理信息约束。总而言之,这种方法为计算密集型等离子体边缘模拟提供了一种快速、准确的替代方案,支持快速场景探索、面向控制的研究以及在聚变装置中实现实时应用。
🔬 方法详解
问题定义:论文旨在解决等离子体边缘动力学模拟中,现有高精度流体/中性代码(如SOLPS-ITER)计算成本过高的问题。SOLPS-ITER虽然能准确捕捉刮削层(SOL)物理,但其计算量巨大,严重限制了对聚变装置进行广泛参数扫描和长时间瞬态研究的能力。
核心思路:论文的核心思路是利用深度学习中的Transformer模型,构建一个自回归的替代模型,来近似SOLPS-ITER的输出。通过在SOLPS-ITER生成的数据上训练Transformer模型,使其能够学习等离子体边缘状态的时空演化规律,从而实现对电子温度、电子密度和辐射功率等关键物理量的快速预测。自回归的特性使得模型能够根据之前的预测结果迭代地预测未来的状态,实现长时序的预测。
技术框架:该方法主要包含以下几个阶段:1) 使用SOLPS-ITER生成等离子体边缘状态的时空数据;2) 构建基于Transformer的自回归模型,模型的输入是历史的等离子体边缘状态,输出是未来时刻的状态;3) 使用SOLPS-ITER生成的数据训练Transformer模型;4) 使用训练好的模型进行等离子体边缘状态的预测,并与SOLPS-ITER的输出进行比较,评估模型的性能。
关键创新:该方法最重要的创新点在于将Transformer模型应用于等离子体边缘动力学的预测,并采用自回归的方式进行长时序预测。与传统的数值模拟方法相比,该方法能够显著提高预测速度,从而实现快速的参数探索和控制研究。此外,通过增加自回归的训练步数,可以提高模型的rollout稳定性,减轻误差累积,从而实现更长时间范围的稳定预测。
关键设计:论文中,模型训练时采用了不同长度的自回归范围(1-100步),实验结果表明,更长的训练范围能够提高rollout稳定性。损失函数方面,论文可能采用了均方误差等回归任务常用的损失函数。网络结构方面,Transformer模型的具体配置(如encoder/decoder层数、attention head数量等)未知,但这些参数的选择会影响模型的性能。
🖼️ 关键图片
📊 实验亮点
实验结果表明,基于Transformer的自回归模型能够显著提高等离子体边缘动力学的预测速度,比SOLPS-ITER快几个数量级。通过增加自回归的训练步数,模型能够实现数百到数千步的稳定预测,并重现高辐射区域的运动等关键动力学特征。该模型在训练数据集覆盖的物理状态下表现良好,但在未覆盖的区域预测精度会下降,这表明未来需要进一步丰富训练数据。
🎯 应用场景
该研究成果可应用于聚变装置的设计和运行优化,例如快速评估不同设计方案的性能,优化运行参数以提高能量约束和稳定性。此外,该模型还可用于开发实时控制系统,根据等离子体状态预测未来演化趋势,并及时调整控制参数,避免不稳定性发生。该方法为聚变能源的开发提供了新的工具,加速了聚变能源的商业化进程。
📄 摘要(原文)
Accurate modeling of scrape-off layer (SOL) and divertor-edge dynamics is vital for designing plasma-facing components in fusion devices. High-fidelity edge fluid/neutral codes such as SOLPS-ITER capture SOL physics with high accuracy, but their computational cost limits broad parameter scans and long transient studies. We present transformer-based, autoregressive surrogates for efficient prediction of 2D, time-dependent plasma edge state fields. Trained on SOLPS-ITER spatiotemporal data, the surrogates forecast electron temperature, electron density, and radiated power over extended horizons. We evaluate model variants trained with increasing autoregressive horizons (1-100 steps) on short- and long-horizon prediction tasks. Longer-horizon training systematically improves rollout stability and mitigates error accumulation, enabling stable predictions over hundreds to thousands of steps and reproducing key dynamical features such as the motion of high-radiation regions. Measured end-to-end wall-clock times show the surrogate is orders of magnitude faster than SOLPS-ITER, enabling rapid parameter exploration. Prediction accuracy degrades when the surrogate enters physical regimes not represented in the training dataset, motivating future work on data enrichment and physics-informed constraints. Overall, this approach provides a fast, accurate surrogate for computationally intensive plasma edge simulations, supporting rapid scenario exploration, control-oriented studies, and progress toward real-time applications in fusion devices.