FLARE-SSM: Deep State Space Models with Influence-Balanced Loss for 72-Hour Solar Flare Prediction

📄 arXiv: 2509.09988v1 📥 PDF

作者: Yusuke Takagi, Shunya Nagashima, Komei Sugiura

分类: cs.CV, astro-ph.SR

发布日期: 2025-09-12

备注: Accepted for presentation at ICONIP2025


💡 一句话要点

提出FLARE-SSM模型,利用深度状态空间模型和影响力平衡损失进行72小时太阳耀斑预测。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 太阳耀斑预测 深度状态空间模型 类别不平衡 FLARE损失 空间天气预报

📋 核心要点

  1. 现有太阳耀斑预测方法难以有效处理不同耀斑等级之间严重的类别不平衡问题。
  2. 论文提出基于多个深度状态空间模型的FLARE-SSM模型,并设计FLARE损失函数来平衡类别影响。
  3. 实验结果表明,该方法在Gandin-Murphy-Gerrity评分和真实技能统计方面均优于现有方法。

📝 摘要(中文)

为了减轻太阳耀斑对关键基础设施的潜在影响,准确可靠的太阳耀斑预测至关重要。然而,目前太阳耀斑预测的性能仍不尽如人意。本研究旨在预测未来72小时内可能发生的最大太阳耀斑等级。现有方法通常无法充分解决耀斑等级之间严重的类别不平衡问题。为了解决这个问题,我们提出了一种基于多个深度状态空间模型的太阳耀斑预测模型。此外,我们引入了频率和局部边界感知可靠性损失(FLARE损失),以提高类别不平衡下的预测性能和可靠性。在涵盖完整11年太阳活动周期的多波长太阳图像数据集上进行了实验。结果表明,我们的方法在Gandin-Murphy-Gerrity评分和真实技能统计方面均优于基线方法,这两个指标是衡量性能和可靠性的标准指标。

🔬 方法详解

问题定义:论文旨在解决太阳耀斑预测中,由于不同耀斑等级数据量严重不平衡,导致预测模型性能下降的问题。现有方法难以有效处理这种类别不平衡,使得模型倾向于预测数量较多的类别,而忽略了数量较少的、但更重要的耀斑事件。

核心思路:论文的核心思路是利用多个深度状态空间模型(Deep State Space Models, SSMs)来捕捉太阳耀斑的时间依赖性,并通过引入一种新的损失函数——频率和局部边界感知可靠性损失(Frequency & Local-Boundary-Aware Reliability Loss, FLARE loss)来平衡不同类别的影响,从而提高模型在类别不平衡情况下的预测性能和可靠性。

技术框架:FLARE-SSM模型的整体框架包含以下几个主要部分:首先,使用多波长太阳图像数据作为输入;然后,利用多个深度状态空间模型提取图像中的时空特征;接着,将提取的特征输入到分类器中,预测未来72小时内可能发生的最大太阳耀斑等级;最后,使用FLARE损失函数优化模型参数,该损失函数考虑了频率和局部边界信息,以平衡不同类别的影响。

关键创新:论文最重要的技术创新点在于提出了FLARE损失函数。与传统的交叉熵损失函数不同,FLARE损失函数不仅考虑了预测的准确性,还考虑了预测的可靠性,并且能够根据类别的频率和局部边界信息动态调整损失权重,从而更好地处理类别不平衡问题。这与现有方法中常用的重采样或重加权策略不同,FLARE损失函数能够更有效地利用数据信息,提高模型的泛化能力。

关键设计:FLARE损失函数的具体设计包括两个方面:一是频率感知部分,根据每个类别的样本数量动态调整损失权重,样本数量越少的类别,损失权重越大;二是局部边界感知部分,通过计算预测概率分布的局部边界信息,惩罚那些预测概率分布过于集中的样本,从而提高模型的可靠性。此外,深度状态空间模型的具体结构(例如,RNN、LSTM或Transformer)以及分类器的选择(例如,全连接层或softmax层)也是重要的设计细节。

📊 实验亮点

实验结果表明,FLARE-SSM模型在多波长太阳图像数据集上取得了显著的性能提升。具体而言,该模型在Gandin-Murphy-Gerrity评分和真实技能统计方面均优于基线方法,表明其在预测准确性和可靠性方面均有明显优势。这些结果验证了FLARE损失函数在处理类别不平衡问题上的有效性。

🎯 应用场景

该研究成果可应用于空间天气预报领域,为卫星运行、地面通信、电力系统等关键基础设施提供预警信息,降低太阳耀斑爆发带来的潜在风险。通过更准确地预测太阳耀斑,可以提前采取防护措施,减少经济损失和社会影响,并为未来的空间探索任务提供保障。

📄 摘要(原文)

Accurate and reliable solar flare predictions are essential to mitigate potential impacts on critical infrastructure. However, the current performance of solar flare forecasting is insufficient. In this study, we address the task of predicting the class of the largest solar flare expected to occur within the next 72 hours. Existing methods often fail to adequately address the severe class imbalance across flare classes. To address this issue, we propose a solar flare prediction model based on multiple deep state space models. In addition, we introduce the frequency & local-boundary-aware reliability loss (FLARE loss) to improve predictive performance and reliability under class imbalance. Experiments were conducted on a multi-wavelength solar image dataset covering a full 11-year solar activity cycle. As a result, our method outperformed baseline approaches in terms of both the Gandin-Murphy-Gerrity score and the true skill statistic, which are standard metrics in terms of the performance and reliability.