Prior-guided Hierarchical Instance-pixel Contrastive Learning for Ultrasound Speckle Noise Suppression

📄 arXiv: 2602.13831v1 📥 PDF

作者: Zhenyu Bu, Yuanxin Xie, Guang-Quan Zhou

分类: cs.CV

发布日期: 2026-02-14


💡 一句话要点

提出先验引导的分层实例-像素对比学习方法,用于超声散斑噪声抑制。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 超声降噪 散斑噪声抑制 对比学习 Transformer CNN 医学图像处理 分层学习

📋 核心要点

  1. 超声图像降噪面临挑战,散斑噪声包含纹理和解剖细节,难以有效抑制且保持结构。
  2. 提出先验引导的分层实例-像素对比学习,旨在学习噪声不变和结构感知的特征表示。
  3. 实验结果表明,该模型在公开超声数据集上优于现有方法,验证了其有效性。

📝 摘要(中文)

超声降噪对于减轻散斑引起的图像质量下降至关重要,从而提高图像质量和诊断可靠性。然而,由于散斑模式固有地编码了纹理和精细的解剖细节,因此在抑制噪声的同时保持结构保真度仍然是一个重大挑战。本研究提出了一种先验引导的分层实例-像素对比学习模型用于超声降噪,旨在通过最大化噪声样本和干净样本在像素和实例级别的可分离性,来促进噪声不变和结构感知的特征表示。具体而言,引入了一种统计引导的像素级对比学习策略,以增强噪声像素和干净像素之间的分布差异,从而提高局部结构一致性。同时,在特征空间中使用记忆库来促进实例级对比学习,鼓励更忠实地逼近底层数据分布的表示。此外,采用混合Transformer-CNN架构,将基于Transformer的编码器用于全局上下文建模,以及针对精细解剖结构恢复优化的基于CNN的解码器相结合,从而能够互补地利用长程依赖关系和局部纹理细节。在两个公开可用的超声数据集上的大量评估表明,所提出的模型始终优于现有方法,证实了其有效性和优越性。

🔬 方法详解

问题定义:超声图像的散斑噪声严重影响图像质量和诊断准确性。现有方法难以在有效抑制噪声的同时,保持图像的结构细节,因为散斑噪声本身也包含了纹理和解剖结构信息。

核心思路:论文的核心思路是通过对比学习,区分噪声像素和干净像素,以及噪声实例和干净实例,从而学习到噪声不变且结构感知的特征表示。通过在像素级别和实例级别同时进行对比学习,可以更全面地捕捉图像的结构信息,并有效抑制噪声。

技术框架:该模型采用混合Transformer-CNN架构。Transformer编码器用于捕捉全局上下文信息,CNN解码器用于恢复精细的解剖结构。模型包含两个主要的对比学习模块:像素级对比学习模块和实例级对比学习模块。像素级对比学习模块利用统计信息引导,增强噪声像素和干净像素之间的分布差异。实例级对比学习模块使用记忆库,促进特征空间中的对比学习,鼓励模型学习更接近真实数据分布的表示。

关键创新:该方法最重要的创新点在于同时在像素级别和实例级别进行对比学习。像素级对比学习关注局部结构一致性,实例级对比学习关注全局数据分布。这种分层对比学习策略能够更有效地抑制噪声,并保持图像的结构细节。此外,统计引导的像素级对比学习和基于记忆库的实例级对比学习也是关键创新。

关键设计:像素级对比学习使用统计信息(例如均值和方差)来区分噪声像素和干净像素。实例级对比学习使用记忆库来存储和检索特征向量,从而实现高效的对比学习。损失函数包括像素级对比损失和实例级对比损失。Transformer编码器和CNN解码器的具体结构根据实验进行调整,以达到最佳性能。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

该模型在两个公开可用的超声数据集上进行了广泛的评估,结果表明该模型始终优于现有的降噪方法。具体来说,该模型在PSNR和SSIM等指标上取得了显著的提升,表明其在抑制噪声的同时,能够更好地保持图像的结构细节。实验结果验证了该模型的有效性和优越性。

🎯 应用场景

该研究成果可广泛应用于医学超声成像领域,例如胎儿超声、心脏超声、腹部超声等。通过提高超声图像的质量,可以帮助医生更准确地诊断疾病,提高诊断效率,并减少误诊率。此外,该方法还可以应用于其他类型的图像降噪任务中,例如遥感图像和自然图像。

📄 摘要(原文)

Ultrasound denoising is essential for mitigating speckle-induced degradations, thereby enhancing image quality and improving diagnostic reliability. Nevertheless, because speckle patterns inherently encode both texture and fine anatomical details, effectively suppressing noise while preserving structural fidelity remains a significant challenge. In this study, we propose a prior-guided hierarchical instance-pixel contrastive learning model for ultrasound denoising, designed to promote noise-invariant and structure-aware feature representations by maximizing the separability between noisy and clean samples at both pixel and instance levels. Specifically, a statistics-guided pixel-level contrastive learning strategy is introduced to enhance distributional discrepancies between noisy and clean pixels, thereby improving local structural consistency. Concurrently, a memory bank is employed to facilitate instance-level contrastive learning in the feature space, encouraging representations that more faithfully approximate the underlying data distribution. Furthermore, a hybrid Transformer-CNN architecture is adopted, coupling a Transformer-based encoder for global context modeling with a CNN-based decoder optimized for fine-grained anatomical structure restoration, thus enabling complementary exploitation of long-range dependencies and local texture details. Extensive evaluations on two publicly available ultrasound datasets demonstrate that the proposed model consistently outperforms existing methods, confirming its effectiveness and superiority.