A novel attention mechanism for noise-adaptive and robust segmentation of microtubules in microscopy images

📄 arXiv: 2507.07800v2 📥 PDF

作者: Achraf Ait Laydi, Louis Cueff, Mewen Crespo, Yousef El Mourabit, Hélène Bouvrais

分类: q-bio.QM, cs.CV

发布日期: 2025-07-10 (更新: 2025-10-23)


💡 一句话要点

提出噪声自适应注意力机制,用于显微图像中微管的稳健分割

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 微管分割 显微图像 噪声自适应 注意力机制 深度学习 U-Net 细胞骨架

📋 核心要点

  1. 现有方法在噪声或低对比度显微图像中分割细胞骨架丝时性能下降,且难以获得准确标注和处理类别不平衡。
  2. 提出自适应SE (ASE) 注意力机制,动态调整以适应不同噪声水平,并集成到U-Net中,构建ASE_Res_U-Net模型。
  3. ASE_Res_U-Net在合成和真实噪声图像中有效分割微管,优于其他方法,且参数更少,并能推广到其他曲线结构。

📝 摘要(中文)

细胞骨架丝在显微图像中的分割对于理解其细胞作用至关重要,但仍然具有挑战性,尤其是在密集、复杂的网络中以及在噪声或低对比度图像条件下。虽然深度学习已经推动了图像分割的发展,但在这些不利情况下,性能通常会下降。其他挑战包括难以获得准确的注释和管理严重的类别不平衡。我们提出了一种新的噪声自适应注意力机制,扩展了Squeeze-and-Excitation (SE)模块,以动态适应不同的噪声水平。这种自适应SE (ASE)机制被集成到U-Net解码器中,带有残差编码器块,形成了一个轻量级但功能强大的模型:ASE_Res_U-Net。我们还开发了一种合成数据集策略,并采用定制的损失函数和评估指标来缓解类别不平衡并确保公平评估。ASE_Res_U-Net有效地分割了合成和真实噪声图像中的微管,优于其消融变体和最先进的曲线结构分割方法。它在参数较少的情况下实现了这一点,使其适用于资源受限的环境。重要的是,ASE_Res_U-Net推广到其他曲线结构(血管和神经),在不同的成像条件下表现良好。原始微管数据集(合成和真实噪声图像)可在Zenodo上获得。ASE_Res_UNet模型将在发布后共享。

🔬 方法详解

问题定义:论文旨在解决显微图像中微管分割的问题,尤其是在高噪声、低对比度以及复杂网络结构的情况下。现有深度学习方法在这些不利条件下性能显著下降,同时,获取精确的微管标注数据非常困难,且数据集中存在严重的类别不平衡问题。

核心思路:论文的核心思路是设计一种噪声自适应的注意力机制,使模型能够动态地根据图像的噪声水平调整其注意力。通过扩展Squeeze-and-Excitation (SE)模块,使其能够更好地适应不同噪声水平,从而提高模型在噪声环境下的分割性能。

技术框架:论文提出的模型ASE_Res_U-Net基于U-Net架构,包含一个残差编码器和一个带有自适应SE (ASE)模块的解码器。编码器负责提取图像特征,解码器利用ASE模块对特征进行加权,从而实现对微管的精确分割。此外,论文还采用了合成数据集生成策略,以及定制的损失函数和评估指标来解决类别不平衡问题。

关键创新:论文最关键的创新点在于提出的自适应SE (ASE)注意力机制。与传统的SE模块不同,ASE模块能够根据输入特征的噪声水平动态调整其权重,从而更好地适应噪声环境。这种自适应性使得模型在噪声图像中能够更准确地关注微管区域,提高分割精度。

关键设计:ASE模块的具体实现方式是对SE模块进行扩展,引入了额外的参数来控制注意力权重的调整幅度。这些参数可以通过学习来适应不同的噪声水平。此外,论文还采用了Dice损失函数和Focal损失函数来缓解类别不平衡问题。在网络结构方面,残差块的使用有助于缓解梯度消失问题,提高模型的训练效率。

📊 实验亮点

实验结果表明,ASE_Res_U-Net在合成和真实噪声图像中均优于其他分割方法,包括U-Net及其变体,以及专门用于曲线结构分割的方法。在微管分割任务中,ASE_Res_U-Net在参数量更少的情况下,取得了更高的分割精度。此外,该模型还展现了良好的泛化能力,能够有效地分割血管和神经等其他曲线结构。

🎯 应用场景

该研究成果可应用于生物医学图像分析领域,例如细胞骨架研究、药物筛选和疾病诊断。通过精确分割微管,可以更好地理解细胞的结构和功能,为相关疾病的治疗提供新的思路。该方法还可推广到其他曲线结构的分割,如血管和神经,具有广泛的应用前景。

📄 摘要(原文)

Segmenting cytoskeletal filaments in microscopy images is essential for understanding their cellular roles but remains challenging, especially in dense, complex networks and under noisy or low-contrast image conditions. While deep learning has advanced image segmentation, performance often degrades in these adverse scenarios. Additional challenges include the difficulty of obtaining accurate annotations and managing severe class imbalance. We proposed a novel noise-adaptive attention mechanism, extending the Squeeze-and-Excitation (SE) module, to dynamically adjust to varying noise levels. This Adaptive SE (ASE) mechanism is integrated into a U-Net decoder, with residual encoder blocks, forming a lightweight yet powerful model: ASE_Res_U-Net. We also developed a synthetic-dataset strategy and employed tailored loss functions and evaluation metrics to mitigate class imbalance and ensure fair assessment. ASE_Res_U-Net effectively segmented microtubules in both synthetic and real noisy images, outperforming its ablated variants and state-of-the-art curvilinear-structure segmentation methods. It achieved this while using fewer parameters, making it suitable for resource-constrained environments. Importantly, ASE_Res_U-Net generalised well to other curvilinear structures (blood vessels and nerves) under diverse imaging conditions. Availability and implementation: Original microtubule datasets (synthetic and real noisy images) are available on Zenodo (DOIs: 10.5281/zenodo.14696279 and 10.5281/zenodo.15852660). ASE_Res_UNet model will be shared upon publication.