Lightweight CNN-Based Anomaly Detection for High Voltage Converter Modulators in the Spallation Neutron Source

📄 arXiv: 2605.31259v1 📥 PDF

作者: Alberto D. Cencillo, Leonardo Concepción, Julián Luengo, Isaac Triguero

分类: cs.LG

发布日期: 2026-05-29

备注: 21 pages, 8 figures


💡 一句话要点

针对散裂中子源高压转换器调制器的轻量级CNN异常检测方法

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 异常检测 卷积神经网络 高压转换器 散裂中子源 时序信号 故障诊断

📋 核心要点

  1. 高功率脉冲转换器的意外跳闸是加速器停机的主要原因,现有深度学习方法难以有效处理HVCM多通道信号的复杂关系。
  2. 论文提出一种轻量级CNN架构,通过调整时域滤波和跨通道混合的顺序,并引入自适应通道重加权,来提升异常检测性能。
  3. 实验结果表明,该方法在SNS的HVCM数据集上,AUC-PR达到0.816,AUC-ROC达到0.934,优于现有技术水平。

📝 摘要(中文)

高功率脉冲转换器的计划外跳闸是大型加速器设施停机的主要原因。在散裂中子源(SNS)中,高压转换器调制器(HVCM)一直是束流时间损失的第二大因素。每个HVCM脉冲都通过电流、电压和磁通等传感器通道记录,这些通道的相互作用编码了系统的运行状态。故障先兆并非在所有通道中均匀显现:根据故障类型,它们可能改变单个信号的时域结构,改变通道间的统计依赖性,或两者兼有。现有的深度学习方法通常使用标准卷积流程处理多通道信号,这些流程从第一层就将时域和跨通道操作纠缠在一起,没有给模型提供明确的机制来表示通道独立性或结构化的通道间交互。我们假设架构归纳偏置,特别是时域滤波和跨通道混合的顺序,在此类数据的检测性能中起着核心作用。为了验证这一点,我们改变了这两个操作的应用顺序,并检查了每个脉冲的自适应通道重加权是否能进一步提高灵敏度。在公共HVCM数据集上,针对所有四个SNS子系统(RFQ、DTL、CCL、SCL)进行评估,我们最好的变体实现了0.816的平均AUC-PR和0.934的AUC-ROC,在大多数子系统和六个故障系列中的五个方面优于现有技术。

🔬 方法详解

问题定义:论文旨在解决散裂中子源(SNS)中高压转换器调制器(HVCM)的异常检测问题。现有深度学习方法在处理HVCM多通道信号时,无法有效区分和利用通道独立性和结构化的通道间交互信息,导致检测性能受限。这些方法通常从第一层就将时域和跨通道操作混合,缺乏对通道间关系的建模能力。

核心思路:论文的核心思路是利用架构归纳偏置,通过调整时域滤波和跨通道混合的顺序,使模型能够更好地学习和表示通道独立性和结构化的通道间交互信息。此外,引入了每个脉冲的自适应通道重加权机制,以进一步提高模型对不同通道重要性的感知能力。

技术框架:整体框架包括数据预处理、模型构建和评估三个主要阶段。数据预处理涉及对HVCM脉冲信号进行清洗和标准化。模型构建阶段,设计了多种CNN变体,主要区别在于时域滤波和跨通道混合的顺序。评估阶段,使用AUC-PR和AUC-ROC等指标评估模型性能。

关键创新:最重要的技术创新点在于对时域滤波和跨通道混合操作顺序的调整。传统方法通常先进行跨通道混合,再进行时域滤波,而论文尝试了不同的顺序,并发现特定的顺序能够更好地捕捉HVCM信号的特征。此外,自适应通道重加权机制也是一个重要的创新点,它允许模型根据输入信号动态地调整不同通道的权重。

关键设计:论文中,CNN的具体结构是轻量级的,以保证计算效率。关键设计包括卷积核的大小、数量,以及激活函数的选择。自适应通道重加权机制通过一个小的神经网络实现,该网络以HVCM脉冲信号作为输入,输出每个通道的权重。损失函数采用标准的二元交叉熵损失函数,用于区分正常和异常脉冲。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,论文提出的方法在SNS的HVCM数据集上取得了显著的性能提升。最佳变体在所有四个子系统上的平均AUC-PR达到0.816,AUC-ROC达到0.934,优于现有技术水平。消融实验表明,三个输入通道对性能影响最大,且不同故障类型的性能与先兆表现形式有关。

🎯 应用场景

该研究成果可应用于大型加速器设施的故障诊断和预测性维护,减少计划外停机时间,提高设备利用率。此外,该方法也可推广到其他多通道时序信号的异常检测任务中,例如工业控制系统、医疗设备监测等领域,具有广泛的应用前景。

📄 摘要(原文)

Unscheduled trips of high-power pulsed converters are a leading source of downtime at large accelerator facilities. At the Spallation Neutron Source (SNS), the High Voltage Converter Modulators (HVCMs) are consistently the second-largest contributor to lost beam time. Each HVCM pulse is recorded across sensor channels spanning currents, voltages, and magnetic fluxes, whose mutual interactions encode the operating state of the system. Fault precursors do not manifest uniformly across these channels: depending on fault type, they may alter the temporal structure of individual signals, change the statistical dependencies among channels, or both. Existing deep-learning approaches typically process multi-channel signals with standard convolutional pipelines that entangle temporal and cross-channel operations from the first layer, giving the model no explicit mechanism to represent channel independence or structured inter-channel interaction. We hypothesise that architectural inductive bias, specifically the ordering of temporal filtering and cross-channel mixing, plays a central role in detection performance on this class of data. To test this, we vary the order in which these two operations are applied, and examine whether per-pulse adaptive channel reweighting further improves sensitivity. Evaluated on the public HVCM dataset across all four SNS subsystems (RFQ, DTL, CCL, SCL), our best variant achieves a pooled AUC-PR of 0.816 and AUC-ROC of 0.934, outperforming the state of the art on most subsystems and five of the six fault families. Ablations identify three dominant input channels and link per-fault-family performance to whether precursors manifest as amplitude shifts in individual channels or as subtler patterns requiring joint channel representations to surface.