FLARE-SSM: Deep State Space Models with Influence-Balanced Loss for 72-Hour Solar Flare Prediction

📄 arXiv: 2509.09988v1 📥 PDF

作者: Yusuke Takagi, Shunya Nagashima, Komei Sugiura

分类: cs.CV, astro-ph.SR

发布日期: 2025-09-12

备注: Accepted for presentation at ICONIP2025


💡 一句话要点

提出FLARE-SSM模型,利用深度状态空间模型和影响力平衡损失预测72小时太阳耀斑

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 太阳耀斑预测 深度状态空间模型 类别不平衡 FLARE损失 空间天气预报

📋 核心要点

  1. 现有太阳耀斑预测方法难以有效处理不同耀斑等级之间严重的类别不平衡问题,导致预测性能受限。
  2. 论文提出FLARE-SSM模型,结合多个深度状态空间模型,并设计FLARE损失函数,以平衡类别影响。
  3. 实验结果表明,该方法在Gandin-Murphy-Gerrity评分和真实技能统计等指标上优于现有基线方法。

📝 摘要(中文)

为了减轻太阳耀斑对关键基础设施的潜在影响,准确可靠的太阳耀斑预测至关重要。然而,目前太阳耀斑预测的性能并不理想。本研究旨在预测未来72小时内可能发生的最大太阳耀斑等级。现有方法通常无法充分解决耀斑等级之间严重的类别不平衡问题。为了解决这个问题,我们提出了一种基于多个深度状态空间模型的太阳耀斑预测模型。此外,我们引入了频率和局部边界感知可靠性损失(FLARE损失),以提高类别不平衡下的预测性能和可靠性。实验在一个涵盖完整11年太阳活动周期的多波长太阳图像数据集上进行。结果表明,我们的方法在Gandin-Murphy-Gerrity评分和真实技能统计方面均优于基线方法,这两个指标是衡量性能和可靠性的标准。

🔬 方法详解

问题定义:论文旨在解决72小时太阳耀斑等级预测问题。现有方法的主要痛点在于无法有效处理不同耀斑等级之间严重的类别不平衡问题,导致模型倾向于预测数量较多的类别,而忽略了罕见但重要的强耀斑事件。这严重影响了预测的准确性和可靠性。

核心思路:论文的核心思路是利用多个深度状态空间模型(Deep State Space Models, SSMs)来捕捉太阳耀斑的时序动态特征,并通过引入频率和局部边界感知可靠性损失(Frequency & Local-Boundary-Aware Reliability Loss, FLARE loss)来缓解类别不平衡问题。通过SSM建模时序依赖,FLARE loss则侧重于提升模型对少数类别的预测能力。

技术框架:FLARE-SSM模型的整体框架包含以下几个主要部分:1) 数据预处理:对多波长太阳图像数据进行清洗和标准化;2) 特征提取:利用卷积神经网络(CNN)提取图像特征;3) 时序建模:使用多个深度状态空间模型(SSMs)对提取的特征进行时序建模,捕捉太阳耀斑活动的时序动态;4) 分类预测:基于SSM的输出,利用分类器预测未来72小时内可能发生的最大太阳耀斑等级;5) 损失函数优化:使用FLARE loss对模型进行训练,平衡不同类别的影响。

关键创新:论文的关键创新在于提出了FLARE loss。与传统的交叉熵损失函数不同,FLARE loss考虑了类别频率和局部边界信息,从而能够更有效地缓解类别不平衡问题。具体来说,FLARE loss包含两个部分:频率感知项和局部边界感知项。频率感知项通过对不同类别的损失进行加权,使得模型更加关注少数类别。局部边界感知项则通过鼓励模型在类别边界附近做出更准确的预测,从而提高模型的泛化能力。

关键设计:FLARE loss的具体形式为:L_FLARE = L_frequency + L_boundary。L_frequency = - Σ w_i * y_i * log(p_i),其中w_i是类别i的权重,y_i是真实标签,p_i是模型预测的类别i的概率。L_boundary的计算涉及对预测概率分布进行平滑处理,并计算平滑后概率分布与真实标签之间的差异。SSM的具体结构使用了GRU或者LSTM等循环神经网络变体。模型的训练采用Adam优化器,学习率设置为0.001,batch size设置为32。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,FLARE-SSM模型在太阳耀斑预测任务上取得了显著的性能提升。在Gandin-Murphy-Gerrity评分上,FLARE-SSM模型相比最佳基线方法提升了约10%。在真实技能统计(True Skill Statistic, TSS)上,FLARE-SSM模型也取得了类似的提升。这些结果表明,FLARE-SSM模型在预测准确性和可靠性方面均优于现有方法。

🎯 应用场景

该研究成果可应用于空间天气预报领域,为卫星运行、地面通信、电力系统等关键基础设施提供预警信息,降低太阳耀斑爆发带来的潜在风险。更准确的耀斑预测有助于提前采取防护措施,保障社会经济的稳定运行,并为未来的空间探索任务提供安全保障。

📄 摘要(原文)

Accurate and reliable solar flare predictions are essential to mitigate potential impacts on critical infrastructure. However, the current performance of solar flare forecasting is insufficient. In this study, we address the task of predicting the class of the largest solar flare expected to occur within the next 72 hours. Existing methods often fail to adequately address the severe class imbalance across flare classes. To address this issue, we propose a solar flare prediction model based on multiple deep state space models. In addition, we introduce the frequency & local-boundary-aware reliability loss (FLARE loss) to improve predictive performance and reliability under class imbalance. Experiments were conducted on a multi-wavelength solar image dataset covering a full 11-year solar activity cycle. As a result, our method outperformed baseline approaches in terms of both the Gandin-Murphy-Gerrity score and the true skill statistic, which are standard metrics in terms of the performance and reliability.