Towards Real-Time ECG and EMG Modeling on $μ$ NPUs
作者: Josh Millar, Ashok Samraj Thangarajan, Soumyajit Chatterjee, Hamed Haddadi
分类: cs.LG
发布日期: 2026-04-20
🔗 代码/项目: GITHUB
💡 一句话要点
提出PhysioLite,实现微型NPU上实时心电/肌电信号建模
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生理信号分析 心电信号 肌电信号 微型NPU 轻量级模型
📋 核心要点
- 现有Transformer模型在生理信号分析中表现出色,但模型过大,难以部署在资源受限的微型NPU设备上。
- PhysioLite通过可学习小波滤波器组、CPU卸载的位置编码和硬件感知设计,构建轻量级NPU兼容模型。
- 实验表明,PhysioLite在心电/肌电信号分析中性能与Transformer模型相当,但模型尺寸显著减小,可在微型NPU上运行。
📝 摘要(中文)
神经处理单元(NPU)等低功耗加速器的微型化,使其能够集成到微控制器级别的可穿戴硬件中,从而支持近实时、离线和保护隐私的推理。然而,生理信号分析在这种硬件上仍然不可行;最近基于Transformer的模型表现出最先进的性能,但对于资源和功率受限的硬件来说,其规模过于庞大,并且由于其动态注意力操作而与μNPU不兼容。我们引入PhysioLite,一种轻量级的、与NPU兼容的模型架构和训练框架,用于心电/肌电信号分析。通过使用可学习的小波滤波器组、CPU卸载的位置编码和硬件感知的层设计,PhysioLite在心电和肌电基准测试中达到了与最先进的基于Transformer的基础模型相当的性能,同时尺寸小于10%(使用8位量化时约为370KB)。我们还在MAX78000和HX6538 WE2 μNPU上分析了其组件的延迟和资源消耗,证明了其在受限的电池供电硬件上进行信号分析的可行性。我们在https://github.com/j0shmillar/physiolite上发布了我们的模型和训练框架。
🔬 方法详解
问题定义:论文旨在解决在资源和功耗受限的微型神经处理单元(μNPU)上进行实时心电(ECG)和肌电(EMG)信号分析的问题。现有基于Transformer的模型虽然性能优越,但模型尺寸过大,计算复杂度高,无法直接部署在这些资源受限的设备上。此外,Transformer中的动态注意力机制也不兼容μNPU。
核心思路:论文的核心思路是设计一个轻量级、NPU兼容的模型架构PhysioLite,它能够在保持与先进Transformer模型相当的性能的同时,显著减小模型尺寸和计算复杂度。通过硬件感知的层设计,使模型能够高效地在μNPU上运行。
技术框架:PhysioLite的整体架构包括以下几个主要模块:1) 可学习的小波滤波器组:用于提取信号的特征。2) CPU卸载的位置编码:减少NPU的计算负担。3) 硬件感知的层设计:优化模型结构以适应μNPU的硬件特性。训练框架也针对NPU进行了优化,例如采用量化感知训练。
关键创新:PhysioLite的关键创新在于其轻量级和NPU兼容的设计。与传统的Transformer模型相比,PhysioLite避免了动态注意力机制,并采用了可学习的小波滤波器组来提取特征,从而显著减小了模型尺寸和计算复杂度。此外,CPU卸载的位置编码进一步降低了NPU的计算负担。
关键设计:PhysioLite的关键设计包括:1) 使用可学习的小波滤波器组代替传统的卷积层,以更有效地提取信号特征。2) 将位置编码的计算卸载到CPU,以减少NPU的计算负担。3) 采用硬件感知的层设计,例如使用更小的卷积核和更少的通道数,以适应μNPU的硬件特性。4) 使用8位量化来进一步减小模型尺寸。
🖼️ 关键图片
📊 实验亮点
PhysioLite在心电和肌电基准测试中达到了与最先进的基于Transformer的基础模型相当的性能,同时模型尺寸小于10%(使用8位量化时约为370KB)。在MAX78000和HX6538 WE2 μNPU上的实验表明,PhysioLite能够以较低的延迟和资源消耗进行信号分析,证明了其在受限的电池供电硬件上进行信号分析的可行性。
🎯 应用场景
PhysioLite的潜在应用领域包括可穿戴健康监测设备、远程医疗、运动医学等。它可以实现对心电和肌电信号的实时分析,从而为用户提供个性化的健康建议和预警。该研究的实际价值在于降低了生理信号分析的硬件门槛,使其能够在低功耗、资源受限的设备上运行。未来,PhysioLite可以进一步扩展到其他生理信号的分析,并与其他传感器数据融合,从而实现更全面的健康监测。
📄 摘要(原文)
The miniaturisation of neural processing units (NPUs) and other low-power accelerators has enabled their integration into microcontroller-scale wearable hardware, supporting near-real-time, offline, and privacy-preserving inference. Yet physiological signal analysis has remained infeasible on such hardware; recent Transformer-based models show state-of-the-art performance but are prohibitively large for resource- and power-constrained hardware and incompatible with $μ$ NPUs due to their dynamic attention operations. We introduce PhysioLite, a lightweight, NPU-compatible model architecture and training framework for ECG/EMG signal analysis. Using learnable wavelet filter banks, CPU-offloaded positional encoding, and hardware-aware layer design, PhysioLite reaches performance comparable to state-of-the-art Transformer-based foundation models on ECG and EMG benchmarks, while being <10% of the size ($\sim$370KB with 8-bit quantization). We also profile its component-wise latency and resource consumption on both the MAX78000 and HX6538 WE2 $μ$ NPUs, demonstrating its viability for signal analysis on constrained, battery-powered hardware. We release our model(s) and training framework at: https://github.com/j0shmillar/physiolite.