SE-MLP Model for Predicting Prior Acceleration Features in Penetration Signals
作者: Yankang Li, Changsheng Li
分类: cs.LG
发布日期: 2025-12-29
备注: 23 pages, 10 figures, 6 tables
💡 一句话要点
提出SE-MLP模型,用于快速预测侵彻信号中的先验加速度特征,解决传统方法计算耗时问题。
🎯 匹配领域: 支柱四:生成式动作 (Generative Motion) 支柱八:物理动画 (Physics-based Animation)
关键词: 侵彻信号预测 先验特征提取 深度学习 多层感知机 通道注意力机制 残差连接 引信设计
📋 核心要点
- 传统侵彻过程识别依赖耗时的仿真计算获取先验加速度特征值,效率低下。
- SE-MLP模型通过集成通道注意力机制和残差连接,建立物理参数与侵彻特性的非线性映射,实现快速预测。
- 实验结果表明,SE-MLP在精度、泛化性和稳定性上优于传统MLP、XGBoost和Transformer模型。
📝 摘要(中文)
为了克服侵彻过程识别中先验加速度特征值获取需要耗费大量仿真时间和计算资源的限制,本文提出了一种多层感知机架构,称为挤压激励多层感知机(SE-MLP)。该模型集成了通道注意力机制和残差连接,能够快速预测加速度特征值。模型以不同工况下的物理参数作为输入,逐层输出加速度特征,从而建立物理参数和侵彻特性之间的非线性映射。与传统MLP、XGBoost和Transformer模型的对比实验表明,SE-MLP在预测精度、泛化性和稳定性方面表现更优。消融研究进一步证实了通道注意力模块和残差结构对性能提升的显著贡献。数值模拟和射程恢复测试表明,预测和测量加速度峰值和脉冲宽度之间的差异保持在可接受的工程公差范围内。这些结果验证了该方法的可行性和工程适用性,并为快速生成侵彻引信的先验特征值提供了实践基础。
🔬 方法详解
问题定义:论文旨在解决侵彻信号分析中,先验加速度特征值获取依赖于耗时且计算量大的仿真过程的问题。现有方法,如传统数值模拟,计算效率低,难以满足快速预测的需求。
核心思路:论文的核心思路是利用深度学习模型学习物理参数与侵彻特性之间的非线性映射关系,从而实现对先验加速度特征值的快速预测。通过引入通道注意力机制和残差连接,增强模型对重要特征的关注,并缓解梯度消失问题,提高预测精度和泛化能力。
技术框架:SE-MLP模型的整体架构是一个多层感知机,其输入为不同工况下的物理参数,输出为逐层的加速度特征。模型主要包含以下模块:输入层、多个SE-MLP层(包含全连接层、通道注意力模块和残差连接)、输出层。通道注意力模块用于自适应地调整每个通道的权重,残差连接用于缓解梯度消失问题。
关键创新:论文的关键创新在于将通道注意力机制(Squeeze-and-Excitation)与多层感知机相结合,并引入残差连接。这种结合使得模型能够更好地关注重要特征,并有效地训练更深的网络,从而提高预测精度和泛化能力。与传统MLP相比,SE-MLP能够自适应地学习特征之间的依赖关系,而无需手动设计特征。
关键设计:SE-MLP层由全连接层、Squeeze-and-Excitation (SE) 模块和残差连接组成。SE模块首先对特征图进行全局平均池化(Squeeze),然后通过两个全连接层学习通道间的依赖关系,最后通过Sigmoid函数生成通道权重(Excitation),并将权重应用于原始特征图。残差连接将输入直接加到SE模块的输出上,缓解梯度消失问题。具体的参数设置(如全连接层的神经元数量、SE模块的缩放比例)需要根据具体的数据集进行调整。损失函数采用均方误差(MSE)来衡量预测值与真实值之间的差异。
🖼️ 关键图片
📊 实验亮点
实验结果表明,SE-MLP模型在预测精度、泛化性和稳定性方面均优于传统MLP、XGBoost和Transformer模型。数值模拟和射程恢复测试表明,预测的加速度峰值和脉冲宽度与实际测量值之间的差异保持在可接受的工程公差范围内,验证了该方法的工程适用性。消融实验证明,通道注意力模块和残差连接均对性能提升有显著贡献。
🎯 应用场景
该研究成果可应用于侵彻引信的快速设计和优化,缩短研发周期,降低研发成本。此外,该方法还可以推广到其他涉及复杂物理过程预测的领域,例如材料设计、结构优化等,具有广泛的应用前景和实际价值。未来,可以将该模型与强化学习等技术结合,实现侵彻过程的智能控制。
📄 摘要(原文)
Accurate identification of the penetration process relies heavily on prior feature values of penetration acceleration. However, these feature values are typically obtained through long simulation cycles and expensive computations. To overcome this limitation, this paper proposes a multi-layer Perceptron architecture, termed squeeze and excitation multi-layer perceptron (SE-MLP), which integrates a channel attention mechanism with residual connections to enable rapid prediction of acceleration feature values. Using physical parameters under different working conditions as inputs, the model outputs layer-wise acceleration features, thereby establishing a nonlinear mapping between physical parameters and penetration characteristics. Comparative experiments against conventional MLP, XGBoost, and Transformer models demonstrate that SE-MLP achieves superior prediction accuracy, generalization, and stability. Ablation studies further confirm that both the channel attention module and residual structure contribute significantly to performance gains. Numerical simulations and range recovery tests show that the discrepancies between predicted and measured acceleration peaks and pulse widths remain within acceptable engineering tolerances. These results validate the feasibility and engineering applicability of the proposed method and provide a practical basis for rapidly generating prior feature values for penetration fuzes.