D-CNN and VQ-VAE Autoencoders for Compression and Denoising of Industrial X-ray Computed Tomography Images

作者: Bardia Hejazi, Keerthana Chand, Tobias Fritsch, Giovanni Bruno

分类: eess.IV, cs.CV

发布日期: 2025-07-10

DOI: 10.3233/FAIA251480

💡 一句话要点

利用D-CNN和VQ-VAE自编码器压缩和降噪工业X射线CT图像

🎯 匹配领域: 支柱四：生成式动作 (Generative Motion)

关键词: X射线CT图像 图像压缩 深度学习 自编码器 D-CNN VQ-VAE 边缘保持 图像降噪

📋 核心要点

成像技术进步导致成像科学数据量激增，需要高效可靠的存储解决方案。
论文研究使用D-CNN和VQ-VAE自编码器压缩XCT数据，并评估压缩对数据质量的影响。
实验表明，根据后续分析需求，需选择不同架构和压缩率，并引入边缘保持敏感的指标。

📝 摘要（中文）

本研究探讨了使用深度学习自编码器压缩工业X射线计算机断层扫描(XCT)数据，并研究这些压缩算法如何影响恢复数据的质量。使用了两种具有不同压缩率的网络架构：深度卷积神经网络(D-CNN)和矢量量化变分自编码器(VQ-VAE)。所用的XCT数据来自具有复杂内部孔隙网络的砂岩样本。对两种不同深度学习架构在不同压缩率下获得的解码图像质量进行了量化，并与原始输入数据进行了比较。此外，为了提高图像解码质量指标，我们引入了一种对边缘保持敏感的指标，这对于三维数据分析至关重要。结果表明，根据需要保留用于后续分析的特定特征，需要不同的架构和压缩率。本文的研究结果可以帮助科学家确定其数据存储和分析的需求和策略。

🔬 方法详解

问题定义：工业X射线CT图像数据量巨大，存储和传输成本高昂。现有压缩方法可能导致图像质量下降，影响后续的三维数据分析，尤其是在边缘信息的保持方面存在不足。因此，需要研究高效的压缩方法，在保证压缩率的同时，尽可能保留图像的关键特征，特别是边缘信息。

核心思路：利用深度学习自编码器的能力，学习XCT图像的低维表示，实现数据压缩。通过设计不同的自编码器架构（D-CNN和VQ-VAE）和调整压缩率，探索压缩率和图像质量之间的平衡。引入边缘保持敏感的指标，更准确地评估压缩算法对图像质量的影响。

技术框架：整体流程包括：1) 使用D-CNN或VQ-VAE自编码器对XCT图像进行编码，得到低维表示；2) 对低维表示进行存储或传输；3) 使用相应的解码器将低维表示恢复为原始图像；4) 使用多种指标（包括提出的边缘保持敏感指标）评估恢复图像的质量。D-CNN使用卷积层进行特征提取和压缩，VQ-VAE使用矢量量化技术学习离散的潜在表示。

关键创新：1) 比较了D-CNN和VQ-VAE在XCT图像压缩方面的性能，为选择合适的压缩算法提供了依据；2) 引入了一种对边缘保持敏感的指标，更准确地评估了压缩算法对图像质量的影响，尤其是在三维数据分析中至关重要的边缘信息；3) 针对工业XCT图像的特点，探索了不同压缩率对图像质量的影响，为实际应用提供了指导。

关键设计：D-CNN的具体网络结构未知，VQ-VAE的关键设计在于矢量量化的码本大小和训练策略。边缘保持敏感指标的具体计算方法未知，但其核心思想是衡量压缩前后图像边缘信息的差异。论文中使用了不同的压缩率，具体数值未知，但通过对比不同压缩率下的图像质量，可以找到一个合适的平衡点。

🖼️ 关键图片

📊 实验亮点

论文对比了D-CNN和VQ-VAE两种自编码器在不同压缩率下的性能。结果表明，不同的架构和压缩率适用于需要保留不同特征的场景。引入的边缘保持敏感指标能够更有效地评估图像质量，尤其是在三维数据分析中。具体的性能数据（如压缩率、PSNR、SSIM等）和提升幅度未知，但研究结果表明，通过选择合适的架构和压缩率，可以在保证图像质量的前提下实现高效的数据压缩。

🎯 应用场景

该研究成果可应用于工业X射线CT图像的存储、传输和分析。例如，在石油勘探、材料科学、无损检测等领域，可以利用该方法压缩XCT图像，降低存储成本，加快数据传输速度，同时保证图像质量，为后续的三维孔隙网络分析、裂缝检测等提供可靠的数据基础。该方法还可推广到其他类型的医学图像或科学图像的压缩。

📄 摘要（原文）

The ever-growing volume of data in imaging sciences stemming from the advancements in imaging technologies, necessitates efficient and reliable storage solutions for such large datasets. This study investigates the compression of industrial X-ray computed tomography (XCT) data using deep learning autoencoders and examines how these compression algorithms affect the quality of the recovered data. Two network architectures with different compression rates were used, a deep convolution neural network (D-CNN) and a vector quantized variational autoencoder (VQ-VAE). The XCT data used was from a sandstone sample with a complex internal pore network. The quality of the decoded images obtained from the two different deep learning architectures with different compression rates were quantified and compared to the original input data. In addition, to improve image decoding quality metrics, we introduced a metric sensitive to edge preservation, which is crucial for three-dimensional data analysis. We showed that different architectures and compression rates are required depending on the specific characteristics needed to be preserved for later analysis. The findings presented here can aid scientists to determine the requirements and strategies for their data storage and analysis needs.

D-CNN and VQ-VAE Autoencoders for Compression and Denoising of Industrial X-ray Computed Tomography Images

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理