Simulating Sinogram-Domain Motion and Correcting Image-Domain Artifacts Using Deep Learning in HR-pQCT Bone Imaging
作者: Farhan Sadik, Christopher L. Newman, Stuart J. Warden, Rachel K. Surowiec
分类: cs.CV
发布日期: 2025-09-13
💡 一句话要点
提出ESWGAN-GP,用于HR-pQCT骨骼成像中运动伪影的模拟与图像域校正
🎯 匹配领域: 支柱五:交互与反应 (Interaction & Reaction)
关键词: HR-pQCT 运动伪影校正 深度学习 生成对抗网络 骨骼成像
📋 核心要点
- HR-pQCT成像易受运动伪影影响,现有运动分级技术无法有效校正,缺乏标准退化模型是关键瓶颈。
- 提出ESWGAN-GP网络,通过正弦图模拟运动伪影,构建配对数据集,实现监督学习的运动校正。
- 实验结果表明,ESWGAN-GP在模拟和真实数据集上均表现出良好的运动伪影校正效果,显著提升SNR、SSIM和VIF。
📝 摘要(中文)
刚性运动伪影(如皮质骨条纹和骨小梁模糊)阻碍了高分辨率外周定量计算机断层扫描(HR-pQCT)对骨骼微结构的体内评估。尽管有各种运动分级技术,但由于缺乏标准化的退化模型,目前尚无运动校正方法。本文优化了一种传统的基于正弦图的方法来模拟HR-pQCT图像中的运动伪影,创建了运动损坏图像及其对应真实值的配对数据集,从而能够无缝集成到监督学习框架中进行运动校正。因此,我们提出了一种边缘增强的自注意力Wasserstein生成对抗网络与梯度惩罚(ESWGAN-GP),以解决模拟(源)和真实(目标)数据集中的运动伪影。该模型结合了边缘增强跳跃连接以保留骨小梁边缘,并结合了自注意力机制以捕获长距离依赖关系,从而促进运动校正。使用基于视觉几何组(VGG)的感知损失来重建精细的微结构特征。对于源数据集,ESWGAN-GP实现了26.78的平均信噪比(SNR)、0.81的结构相似性指数(SSIM)和0.76的视觉信息保真度(VIF),同时在目标数据集上表现出更高的性能,SNR为29.31,SSIM为0.87,VIF为0.81。所提出的方法解决了一种简化的真实运动表示,可能无法完全捕捉体内运动伪影的复杂性。然而,由于运动伪影是该模式更广泛应用的主要挑战之一,因此这些方法代表了在HR-pQCT中实施基于深度学习的运动校正的重要初步步骤。
🔬 方法详解
问题定义:HR-pQCT成像在评估骨骼微结构时,易受患者运动产生的伪影干扰,如皮质骨条纹和骨小梁模糊。现有方法主要集中在运动分级,缺乏有效的运动校正技术。主要痛点在于缺乏标准化的运动伪影退化模型,难以构建用于训练运动校正算法的数据集。
核心思路:论文的核心思路是首先通过模拟运动伪影来生成训练数据,然后利用深度学习方法学习从含伪影图像到清晰图像的映射关系。通过优化传统的基于正弦图的方法,模拟HR-pQCT图像中的运动伪影,从而创建配对数据集。这样就可以利用监督学习方法进行运动校正。
技术框架:整体框架包括两个主要阶段:1) 运动伪影模拟阶段:优化基于正弦图的方法,模拟HR-pQCT图像中的运动伪影,生成配对的含伪影图像和清晰图像。2) 运动校正阶段:使用ESWGAN-GP网络,以含伪影图像作为输入,输出校正后的图像。该网络在生成对抗网络的基础上,加入了边缘增强跳跃连接和自注意力机制。
关键创新:论文的关键创新在于:1) 提出了一种基于正弦图的运动伪影模拟方法,为深度学习运动校正提供了训练数据。2) 设计了ESWGAN-GP网络,该网络通过边缘增强跳跃连接和自注意力机制,更好地保留了骨小梁边缘等细节信息,并捕获了长距离依赖关系。与传统的GAN相比,ESWGAN-GP使用了Wasserstein距离和梯度惩罚,提高了训练的稳定性。
关键设计:ESWGAN-GP网络使用了边缘增强跳跃连接,将浅层网络的边缘信息传递到深层网络,以保留骨小梁边缘。自注意力机制用于捕获图像中的长距离依赖关系,从而更好地校正运动伪影。损失函数包括对抗损失、VGG感知损失和梯度惩罚项。VGG感知损失用于重建精细的微结构特征。使用了Adam优化器进行训练,学习率等参数根据经验进行调整。
🖼️ 关键图片
📊 实验亮点
实验结果表明,ESWGAN-GP在模拟数据集上取得了显著的性能提升,SNR达到26.78,SSIM达到0.81,VIF达到0.76。更重要的是,在真实数据集上,ESWGAN-GP也表现出优异的性能,SNR达到29.31,SSIM达到0.87,VIF达到0.81。这些结果表明,该方法具有良好的泛化能力,能够有效校正真实HR-pQCT图像中的运动伪影。
🎯 应用场景
该研究成果可应用于HR-pQCT骨骼成像领域,提升图像质量,减少运动伪影对骨骼微结构评估的影响。通过更准确的骨骼参数测量,有助于早期诊断骨质疏松症等疾病,并为相关药物研发提供更可靠的数据支持。未来,该方法有望推广到其他医学成像领域,解决类似运动伪影问题。
📄 摘要(原文)
Rigid-motion artifacts, such as cortical bone streaking and trabecular smearing, hinder in vivo assessment of bone microstructures in high-resolution peripheral quantitative computed tomography (HR-pQCT). Despite various motion grading techniques, no motion correction methods exist due to the lack of standardized degradation models. We optimize a conventional sinogram-based method to simulate motion artifacts in HR-pQCT images, creating paired datasets of motion-corrupted images and their corresponding ground truth, which enables seamless integration into supervised learning frameworks for motion correction. As such, we propose an Edge-enhanced Self-attention Wasserstein Generative Adversarial Network with Gradient Penalty (ESWGAN-GP) to address motion artifacts in both simulated (source) and real-world (target) datasets. The model incorporates edge-enhancing skip connections to preserve trabecular edges and self-attention mechanisms to capture long-range dependencies, facilitating motion correction. A visual geometry group (VGG)-based perceptual loss is used to reconstruct fine micro-structural features. The ESWGAN-GP achieves a mean signal-to-noise ratio (SNR) of 26.78, structural similarity index measure (SSIM) of 0.81, and visual information fidelity (VIF) of 0.76 for the source dataset, while showing improved performance on the target dataset with an SNR of 29.31, SSIM of 0.87, and VIF of 0.81. The proposed methods address a simplified representation of real-world motion that may not fully capture the complexity of in vivo motion artifacts. Nevertheless, because motion artifacts present one of the foremost challenges to more widespread adoption of this modality, these methods represent an important initial step toward implementing deep learning-based motion correction in HR-pQCT.