HUR-MACL: High-Uncertainty Region-Guided Multi-Architecture Collaborative Learning for Head and Neck Multi-Organ Segmentation

📄 arXiv: 2601.04607v1 📥 PDF

作者: Xiaoyu Liu, Siwen Wei, Linhao Qu, Mingyuan Pan, Chengsheng Zhang, Yonghong Shi, Zhijian Song

分类: cs.CV, cs.AI

发布日期: 2026-01-08


💡 一句话要点

提出HUR-MACL模型,解决头颈部多器官分割中小器官分割精度低的问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 头颈部多器官分割 高不确定性区域 多架构协同学习 Vision Mamba Deformable CNN

📋 核心要点

  1. 深度学习模型在头颈部多器官分割中,对小型、形状复杂的器官分割精度较低,是目前面临的核心问题。
  2. HUR-MACL模型通过卷积神经网络自适应识别高不确定性区域,并利用Vision Mamba和Deformable CNN协同提升分割精度。
  3. 实验结果表明,该方法在多个数据集上取得了SOTA结果,验证了其有效性。

📝 摘要(中文)

针对头颈部危及器官精确分割在放射治疗中的重要性,以及深度学习模型在小型、复杂形状器官上的分割失败问题,本文提出了一种高不确定性区域引导的多架构协同学习(HUR-MACL)模型。该模型自适应地识别高不确定性区域,并利用Vision Mamba和Deformable CNN共同提高这些区域的分割精度。此外,还提出了一种异构特征蒸馏损失,以促进两种架构在高不确定性区域的协同学习,从而进一步提高性能。该方法在两个公共数据集和一个私有数据集上取得了SOTA结果。

🔬 方法详解

问题定义:头颈部多器官分割是放射治疗的关键步骤,但现有深度学习模型在分割小型、形状复杂的危及器官时,精度往往较低。现有混合架构通常只是简单地连接不同模型的特征,未能充分利用各自的优势,导致功能重叠和分割精度受限。

核心思路:HUR-MACL的核心思路是关注分割不确定性高的区域,并利用不同架构的优势进行协同学习。通过识别这些区域,并针对性地使用Vision Mamba和Deformable CNN进行联合优化,可以有效提高分割精度。异构特征蒸馏损失进一步促进了不同架构之间的知识迁移和协同。

技术框架:HUR-MACL模型主要包含三个模块:高不确定性区域识别模块、Vision Mamba分割模块和Deformable CNN分割模块。首先,高不确定性区域识别模块利用卷积神经网络预测分割结果的不确定性,从而确定需要重点关注的区域。然后,Vision Mamba和Deformable CNN分别对图像进行分割,并特别关注高不确定性区域。最后,通过异构特征蒸馏损失,促进两个分割模块之间的协同学习,并输出最终的分割结果。

关键创新:该论文的关键创新在于:1) 提出了一种自适应的高不确定性区域识别方法,能够有效定位分割困难的区域。2) 采用多架构协同学习策略,充分利用Vision Mamba和Deformable CNN的优势,提高分割精度。3) 设计了一种异构特征蒸馏损失,促进不同架构之间的知识迁移和协同,进一步提升性能。与现有方法相比,HUR-MACL能够更有效地利用不同架构的优势,并针对性地优化分割困难的区域。

关键设计:高不确定性区域识别模块采用卷积神经网络进行训练,损失函数可以是交叉熵损失或Dice损失。Vision Mamba和Deformable CNN的具体网络结构可以根据具体任务进行选择。异构特征蒸馏损失的设计需要考虑不同架构特征的差异,可以使用L1损失或L2损失来衡量特征之间的距离。具体的参数设置需要根据实验结果进行调整。

📊 实验亮点

HUR-MACL模型在两个公共数据集和一个私有数据集上进行了评估,实验结果表明,该方法在多个器官的分割精度上均取得了SOTA结果。相较于现有方法,HUR-MACL能够显著提高小型、形状复杂器官的分割精度,例如视神经、脑干等。

🎯 应用场景

该研究成果可应用于头颈部肿瘤的放射治疗计划制定,提高危及器官的分割精度,从而减少放疗副作用,改善患者的生活质量。此外,该方法也可推广到其他医学图像分割任务中,例如腹部器官分割、脑部肿瘤分割等,具有广泛的应用前景。

📄 摘要(原文)

Accurate segmentation of organs at risk in the head and neck is essential for radiation therapy, yet deep learning models often fail on small, complexly shaped organs. While hybrid architectures that combine different models show promise, they typically just concatenate features without exploiting the unique strengths of each component. This results in functional overlap and limited segmentation accuracy. To address these issues, we propose a high uncertainty region-guided multi-architecture collaborative learning (HUR-MACL) model for multi-organ segmentation in the head and neck. This model adaptively identifies high uncertainty regions using a convolutional neural network, and for these regions, Vision Mamba as well as Deformable CNN are utilized to jointly improve their segmentation accuracy. Additionally, a heterogeneous feature distillation loss was proposed to promote collaborative learning between the two architectures in high uncertainty regions to further enhance performance. Our method achieves SOTA results on two public datasets and one private dataset.