UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation

📄 arXiv: 2405.16850v1 📥 PDF

作者: Runzhao Yang, Yinda Chen, Zhihong Zhang, Xiaoyu Liu, Zongren Li, Kunlun He, Zhiwei Xiong, Jinli Suo, Qionghai Dai

分类: eess.IV, cs.CV, cs.LG

发布日期: 2024-05-27


💡 一句话要点

UniCompress:基于知识蒸馏的多数据医学图像压缩方法

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 医学图像压缩 隐式神经表示 知识蒸馏 小波变换 多数据压缩

📋 核心要点

  1. 现有基于INR的医学图像压缩方法采用一对一拟合,编码时间长,效率较低。
  2. UniCompress利用小波变换和量化构建码本,作为INR网络的先验知识,实现多数据块压缩。
  3. 通过知识蒸馏简化模型,提高压缩比,实验表明UniCompress在压缩速度和性能上均优于现有方法。

📝 摘要(中文)

本文提出了一种名为“UniCompress”的新方法,创新性地扩展了隐式神经表示(INR)的压缩能力,首次实现了使用单个INR网络压缩多个医学数据块。该方法利用小波变换和量化,构建包含频域信息的码本作为INR网络的先验输入,增强了INR的表示能力,并为不同的图像块提供了独特的条件信息。此外,本文还提出了一种新的隐式表示知识蒸馏技术,将复杂的模型知识简化为更易于管理的形式,从而提高压缩比。在CT和电子显微镜(EM)数据集上的大量测试表明,UniCompress优于传统的INR方法和商业压缩解决方案(如HEVC),尤其是在复杂和高压缩场景中。与现有的INR技术相比,UniCompress的压缩速度提高了4到5倍,标志着医学图像压缩领域的重大进步。代码将公开。

🔬 方法详解

问题定义:医学图像压缩旨在减少存储空间和传输带宽,同时保持图像质量。现有的基于INR的方法虽然具有灵活的压缩比,但通常采用一对一的拟合方式,即每个图像块都需要训练一个独立的INR网络,导致编码时间过长,难以满足实际应用的需求。此外,如何有效利用医学图像的先验知识,进一步提高压缩比也是一个挑战。

核心思路:UniCompress的核心思路是利用单个INR网络同时压缩多个医学图像块。为了实现这一目标,该方法引入了频域信息的码本作为INR网络的先验输入,为不同的图像块提供独特的条件信息,从而增强INR的表示能力。此外,通过知识蒸馏技术,将复杂模型的知识转移到更简单的模型中,进一步提高压缩比。

技术框架:UniCompress的整体框架包括以下几个主要阶段:1) 小波变换:对输入医学图像进行小波变换,提取频域信息。2) 量化:对小波系数进行量化,生成码本。3) INR编码:将码本作为先验输入到INR网络中,对图像进行编码。4) 知识蒸馏:利用知识蒸馏技术,将复杂INR网络的知识转移到更简单的网络中。5) 解码:利用解码器重构图像。

关键创新:UniCompress的关键创新在于:1) 首次实现了使用单个INR网络压缩多个医学图像块。2) 引入了频域信息的码本作为INR网络的先验输入,增强了表示能力。3) 提出了一种新的隐式表示知识蒸馏技术,提高了压缩比。

关键设计:在小波变换方面,论文采用了离散小波变换(DWT)。在量化方面,采用了标量量化。在INR网络结构方面,采用了MLP结构。在知识蒸馏方面,采用了基于特征的知识蒸馏方法,最小化学生网络和教师网络之间的特征差异。损失函数包括重构损失和知识蒸馏损失。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,UniCompress在CT和EM数据集上均优于传统的INR方法和商业压缩解决方案(如HEVC)。在高压缩比下,UniCompress的性能优势更加明显。例如,与现有的INR技术相比,UniCompress的压缩速度提高了4到5倍,同时保持了较高的图像质量。具体而言,在某些数据集上,UniCompress在相同压缩比下,PSNR指标比HEVC提高了1-2dB。

🎯 应用场景

UniCompress在医学图像存储、传输和远程诊断等领域具有广泛的应用前景。它可以有效地减少医学图像的存储空间和传输带宽,提高医疗效率,降低医疗成本。例如,在远程会诊中,医生可以通过UniCompress压缩医学图像,从而更快地传输图像数据,提高诊断效率。此外,UniCompress还可以应用于医学图像数据库的构建,减少存储空间,方便图像检索。

📄 摘要(原文)

In the field of medical image compression, Implicit Neural Representation (INR) networks have shown remarkable versatility due to their flexible compression ratios, yet they are constrained by a one-to-one fitting approach that results in lengthy encoding times. Our novel method, ``\textbf{UniCompress}'', innovatively extends the compression capabilities of INR by being the first to compress multiple medical data blocks using a single INR network. By employing wavelet transforms and quantization, we introduce a codebook containing frequency domain information as a prior input to the INR network. This enhances the representational power of INR and provides distinctive conditioning for different image blocks. Furthermore, our research introduces a new technique for the knowledge distillation of implicit representations, simplifying complex model knowledge into more manageable formats to improve compression ratios. Extensive testing on CT and electron microscopy (EM) datasets has demonstrated that UniCompress outperforms traditional INR methods and commercial compression solutions like HEVC, especially in complex and high compression scenarios. Notably, compared to existing INR techniques, UniCompress achieves a 4$\sim$5 times increase in compression speed, marking a significant advancement in the field of medical image compression. Codes will be publicly available.