Polygon-mamba: Retinal vessel segmentation using polygon scanning mamba and space-frequency collaborative attention
作者: Yuanyuan Peng, Wen Li, Xiong Li, Juan Zhou
分类: cs.CV
发布日期: 2026-05-11
💡 一句话要点
提出Polygon-Mamba网络,通过多边形扫描与空频协同注意力机制提升视网膜微小血管分割精度
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 视网膜血管分割 视觉状态空间模型 多边形扫描 空频协同注意力 医学图像处理 深度学习
📋 核心要点
- 现有Mamba架构的水平-垂直扫描方式难以捕捉视网膜微小血管的复杂拓扑结构,常导致血管局部断裂与信息丢失。
- 提出多边形扫描视觉状态空间模型(PS-VSS)与空频协同注意力机制(SFCAM),通过多层反向扫描与多域特征融合增强微小血管特征提取。
- 在DRIVE、STARE和CHASE_DB1数据集上取得显著性能,AUC分别达到0.9806、0.9840和0.9866,有效提升了微小血管的分割质量。
📝 摘要(中文)
视网膜血管分割对于眼科疾病的诊断与评估至关重要,其中微小血管的分割因其复杂性始终是该领域的难点。为解决此问题,本文设计了一种融合CNN与Mamba的混合网络,引入了多边形扫描Mamba(PS-VSS)与空频协同注意力机制(SFCAM)。针对传统Mamba水平-垂直扫描可能破坏血管拓扑完整性并导致局部断裂的问题,PS-VSS采用多层反向扫描方式,有效保持了像素连通性,减少了微小血管信息丢失。此外,SFCAM被集成在跳跃连接中,通过结合空间域的结构信息与频域的全局感知及细节特征,动态增强关键特征并抑制噪声。在DRIVE、STARE和CHASE_DB1三个公开数据集上的实验表明,该模型在F1分数、AUC及敏感度(SE)指标上均表现优异,验证了其在视网膜血管分割任务中的有效性。
🔬 方法详解
问题定义:论文旨在解决视网膜图像中微小血管分割精度不足的问题。现有基于CNN或传统Mamba的方法在处理细长、拓扑复杂的微小血管时,容易因扫描路径限制导致结构连通性受损,进而产生局部断裂和特征丢失。
核心思路:引入多边形扫描策略以替代传统的行列扫描,从而更好地拟合血管的几何形态;同时利用空间域与频域的互补性,通过注意力机制在跳跃连接中动态过滤噪声并强化微小血管特征。
技术框架:模型采用CNN-Mamba混合架构。编码器部分利用CNN提取局部特征,核心模块为PS-VSS,用于捕捉长距离依赖;跳跃连接中嵌入SFCAM模块,实现空间与频率特征的深度融合,最后通过解码器恢复空间分辨率。
关键创新:核心创新在于PS-VSS模型,它通过多层反向扫描策略,能够更紧密地追踪血管的拓扑结构,相比传统扫描方式显著提升了对细微结构的感知能力。
关键设计:SFCAM模块通过并行分支分别处理空间特征(定位与结构)和频域特征(全局感知与细节),通过协同注意力权重分配,实现对血管特征的动态增强与背景噪声的有效抑制。
📊 实验亮点
模型在三个主流数据集上表现稳健:在DRIVE、STARE和CHASE_DB1上,F1分数分别达到0.8283、0.8282和0.8251,AUC值分别达到0.9806、0.9840和0.9866。实验结果表明,该方法在保持高敏感度的同时,有效提升了微小血管的结构完整性,优于多种现有的先进分割算法。
🎯 应用场景
该研究主要应用于医学影像分析领域,特别是眼底视网膜血管的自动分割。其技术成果可直接嵌入眼科辅助诊断系统,用于糖尿病视网膜病变、高血压性视网膜病变等眼科疾病的早期筛查与病情量化评估,具有极高的临床应用价值与推广潜力。
📄 摘要(原文)
Retinal vessel segmentation is crucial for diagnosis and assessment of ocular diseases. Notably, segmentation of small retinal vessels has been consistently recognized as a challenging and complex task. To tackle this challenge, we design a hybrid CNN-Mamba fusion network that integrates polygon scanning mamba and space-frequency collaborative attention mechanism for the detection of small vessels. Considering that the traditional mamba architecture with horizontal-vertical scanning may compromise the topological integrity of target structures and result in local discontinuities in small retinal vessels, we present a polygon scanning visual state space model (PS-VSS) to identify small vessel structural features by multi-layer reverse scanning way. Which effectively preserves pixels connectivity, thereby substantially mitigating the loss of information pertaining to small vessels. Furthermore, as we all known that the spatial domain prioritizes positional and structural information, while the frequency domain emphasizes global perception and local detail components, a space-frequency collaborative attention mechanism (SFCAM) is introduced within the skip connection to extract efficient features from the spatial and frequency domains. This strategy empowers the model to dynamically enhance the key features while effectively suppressing clutters. To assess the efficacy of our model, it was tested on three publicly available datasets: DRIVE, STARE, and CHASE_DB1. Compared to manual annotations, our model demonstrated F1 scores of 0.8283, 0.8282, and 0.8251, Area Under Curve (AUC) values of 0.9806, 0.9840, and 0.9866, and Sensitivity (SE) values of of 0.8268, 0.8314, and 0.8484 across three datasets, respectively. The effectiveness of our model was validated through both visual inspection and quantitative analysis.