Real-time Event Recognition of Long-distance Distributed Vibration Sensing with Knowledge Distillation and Hardware Acceleration
作者: Zhongyao Luo, Hao Wu, Zhao Ge, Ming Tang
分类: eess.SY, eess.SP
发布日期: 2024-08-07 (更新: 2024-08-22)
备注: 9 pages, 10 figures
🔗 代码/项目: GITHUB
💡 一句话要点
提出知识蒸馏与FPGA加速方案,实现长距离DVS系统事件实时识别
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 分布式光纤传感 事件识别 知识蒸馏 FPGA加速 实时处理 物联网 振动监测
📋 核心要点
- 现有DVS系统依赖深度学习进行事件识别,但长距离应用中海量数据实时处理面临挑战。
- 采用知识蒸馏方法,使用ResNet作为教师模型训练小型CNN,提升模型精度和泛化能力。
- 设计基于FPGA的硬件加速方案,通过量化和移位操作,显著降低推理延迟,提升系统实时性。
📝 摘要(中文)
光纤传感,特别是分布式光纤振动(DVS)传感,在物联网(IoT)应用中变得越来越重要,例如工业安全监控和入侵检测。尽管DVS系统应用广泛,但现有依赖深度学习模型的后处理方法在事件识别方面面临着大数据量实时处理的挑战,尤其是在长距离应用中。为了解决这个问题,我们提出使用一个四层卷积神经网络(CNN),并以ResNet作为教师模型进行知识蒸馏。这显著提高了精度,从83.41%提高到95.39%,尤其是在之前未训练过的环境数据上。此外,我们提出了一种基于现场可编程门阵列(FPGA)的新型硬件设计,以进一步加速模型推理。该设计用二进制移位操作代替乘法并量化模型权重,从而实现高并行性和低延迟。我们的实现对于覆盖12.5米光纤长度和0.256秒时间帧的时空样本,实现了0.083毫秒的推理时间。这种性能使得能够在约38.55公里的光纤上进行实时信号处理,约为Nvidia GTX 4090 GPU的2.14倍。所提出的方法极大地提高了振动模式识别的效率,促进了DVS作为智能物联网系统的应用。数据和代码可在https://github.com/HUST-IOF/Efficient-DVS 获取。
🔬 方法详解
问题定义:论文旨在解决长距离分布式光纤振动传感(DVS)系统中,使用深度学习模型进行事件识别时,由于数据量巨大而导致的实时性不足的问题。现有方法通常依赖计算资源较多的GPU,成本较高,且难以满足长距离实时监测的需求。
核心思路:论文的核心思路是通过知识蒸馏压缩模型大小,降低计算复杂度,并利用FPGA进行硬件加速,提高推理速度。知识蒸馏将复杂模型(ResNet)的知识迁移到小型模型(CNN)中,在保证精度的前提下减少计算量。FPGA的并行计算能力和可定制性,能够进一步加速模型推理。
技术框架:整体框架包括数据采集、预处理、模型训练、知识蒸馏、模型量化和FPGA部署几个阶段。首先,采集DVS数据并进行预处理。然后,使用ResNet训练教师模型,并使用该模型指导CNN学生模型的训练,完成知识蒸馏。接着,对学生模型进行量化,降低计算复杂度。最后,将量化后的模型部署到FPGA上,实现硬件加速。
关键创新:论文的关键创新在于将知识蒸馏和FPGA硬件加速相结合,用于解决长距离DVS系统的实时事件识别问题。通过知识蒸馏,在保证精度的前提下,显著降低了模型的大小和计算复杂度。通过FPGA硬件加速,充分利用了FPGA的并行计算能力,进一步提高了推理速度。此外,使用二进制移位操作代替乘法,进一步降低了计算复杂度。
关键设计:在知识蒸馏过程中,使用ResNet作为教师模型,四层CNN作为学生模型。损失函数包括分类损失和蒸馏损失,蒸馏损失用于衡量学生模型和教师模型输出的相似度。在FPGA设计中,对模型权重进行量化,使用二进制移位操作代替乘法,并采用高度并行的流水线结构,以实现低延迟和高吞吐量。
🖼️ 关键图片
📊 实验亮点
实验结果表明,通过知识蒸馏,模型精度从83.41%提升至95.39%。基于FPGA的硬件加速方案,对于12.5米光纤长度和0.256秒时间帧的时空样本,推理时间仅为0.083毫秒,能够实现约38.55公里的光纤实时信号处理,性能约为Nvidia GTX 4090 GPU的2.14倍。该方案显著提升了DVS系统的实时性和精度。
🎯 应用场景
该研究成果可广泛应用于工业安全监控、入侵检测、管道泄漏监测、桥梁健康监测等领域。通过实时识别振动事件,可以及时发现潜在的安全隐患,提高安全预警能力。该方案具有低成本、低功耗、高实时性的优点,尤其适用于长距离、大规模的物联网应用场景,具有重要的实际应用价值和广阔的市场前景。
📄 摘要(原文)
Fiber-optic sensing, especially distributed optical fiber vibration (DVS) sensing, is gaining importance in internet of things (IoT) applications, such as industrial safety monitoring and intrusion detection. Despite their wide application, existing post-processing methods that rely on deep learning models for event recognition in DVS systems face challenges with real-time processing of large sample data volumes, particularly in long-distance applications. To address this issue, we propose to use a four-layer convolutional neural network (CNN) with ResNet as the teacher model for knowledge distillation. This results in a significant improvement in accuracy, from 83.41% to 95.39%, on data from previously untrained environments. Additionally, we propose a novel hardware design based on field-programmable gate arrays (FPGA) to further accelerate model inference. This design replaces multiplication with binary shift operations and quantizes model weights, enabling high parallelism and low latency. Our implementation achieves an inference time of 0.083 ms for a spatial-temporal sample covering a 12.5 m fiber length and 0.256 s time frame. This performance enables real-time signal processing over approximately 38.55 km of fiber, about $2.14\times$ the capability of an Nvidia GTX 4090 GPU. The proposed method greatly enhances the efficiency of vibration pattern recognition, promoting the use of DVS as a smart IoT system. The data and code are available at https://github.com/HUST-IOF/Efficient-DVS.