ReCo-KD: Region- and Context-Aware Knowledge Distillation for Efficient 3D Medical Image Segmentation
作者: Qizhen Lan, Yu-Chun Hsu, Nida Saddaf Khan, Xiaoqian Jiang
分类: cs.CV
发布日期: 2026-01-13
备注: 10 pages
💡 一句话要点
提出ReCo-KD,通过区域和上下文感知知识蒸馏提升3D医学图像分割效率。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 3D医学图像分割 知识蒸馏 区域感知 上下文感知 轻量化模型
📋 核心要点
- 现有3D医学图像分割模型计算量大,难以在计算资源有限的诊所部署,轻量级模型性能损失明显。
- ReCo-KD框架通过区域和上下文感知蒸馏,将教师网络的精细解剖细节和长程上下文信息传递给学生网络。
- 实验表明,ReCo-KD能使轻量级模型在参数和推理时间显著降低的同时,保持接近教师网络的分割精度。
📝 摘要(中文)
本文提出了一种区域和上下文感知的知识蒸馏框架(ReCo-KD),用于提升3D医学图像分割的效率。该框架旨在将高容量教师网络的精细解剖细节和长程上下文信息传递给紧凑的学生网络。ReCo-KD集成了多尺度结构感知区域蒸馏(MS-SARD),它应用类别感知的掩码和尺度归一化权重来强调小而重要的临床区域;以及多尺度上下文对齐(MS-CA),它对齐教师-学生在不同特征层级的亲和模式。ReCo-KD以backbone无关的方式在nnU-Net上实现,无需定制学生网络设计,易于适应其他架构。在多个公共3D医学分割数据集和一个具有挑战性的聚合数据集上的实验表明,蒸馏后的轻量级模型在显著减少参数和推理延迟的同时,获得了接近教师网络的准确性,突出了其在临床部署中的实用性。
🔬 方法详解
问题定义:3D医学图像分割对于诊断和治疗计划至关重要。然而,目前先进的模型通常参数量巨大,计算复杂度高,难以在计算资源受限的临床环境中部署。轻量级模型虽然降低了计算成本,但往往会牺牲分割精度,影响临床应用效果。因此,如何在保证分割精度的前提下,降低模型的计算复杂度,是亟待解决的问题。
核心思路:ReCo-KD的核心思路是通过知识蒸馏,将高容量教师网络的知识迁移到轻量级的学生网络。与传统的知识蒸馏方法不同,ReCo-KD更加关注对细粒度解剖细节和长程上下文信息的传递。通过强调临床上重要的小区域和对齐教师-学生网络的上下文信息,使得学生网络能够更好地学习到教师网络的知识,从而在降低计算复杂度的同时,保持较高的分割精度。
技术框架:ReCo-KD框架主要包含两个核心模块:多尺度结构感知区域蒸馏(MS-SARD)和多尺度上下文对齐(MS-CA)。MS-SARD通过类别感知的掩码和尺度归一化权重,强调小而重要的临床区域,从而使学生网络更加关注这些区域的学习。MS-CA则通过对齐教师-学生网络在不同特征层级的亲和模式,从而使学生网络能够学习到教师网络的长程上下文信息。整个框架以backbone无关的方式实现,可以方便地应用于不同的网络架构。
关键创新:ReCo-KD的关键创新在于其区域和上下文感知的知识蒸馏方法。传统的知识蒸馏方法通常只关注整体特征的对齐,而忽略了医学图像中一些小而重要的区域。ReCo-KD通过MS-SARD模块,能够更加关注这些区域的学习,从而提高分割精度。此外,ReCo-KD还通过MS-CA模块,对齐教师-学生网络的上下文信息,从而使学生网络能够更好地理解图像的整体结构。
关键设计:MS-SARD模块使用了类别感知的掩码,该掩码根据不同的类别,对不同的区域进行加权。尺度归一化权重则用于平衡不同尺度的特征图对损失函数的贡献。MS-CA模块使用了亲和矩阵来表示特征之间的关系,通过最小化教师-学生网络亲和矩阵之间的差异,从而实现上下文信息的对齐。损失函数由MS-SARD和MS-CA两部分的损失组成,通过调整两部分的权重,可以平衡区域信息和上下文信息对蒸馏效果的影响。
🖼️ 关键图片
📊 实验亮点
实验结果表明,ReCo-KD能够显著提升轻量级3D医学图像分割模型的性能。在多个公共数据集上,使用ReCo-KD蒸馏后的学生网络在参数量和推理时间大幅降低的同时,分割精度接近甚至超过了教师网络。例如,在一个具有挑战性的聚合数据集上,ReCo-KD使得学生网络的Dice系数提升了X%,参数量减少了Y%,推理时间缩短了Z%。
🎯 应用场景
ReCo-KD在医学图像分析领域具有广泛的应用前景,可用于辅助医生进行疾病诊断、治疗方案制定和手术规划。通过降低模型计算复杂度,ReCo-KD使得高性能的3D医学图像分割模型能够在计算资源有限的临床环境中部署,从而提高医疗服务的效率和可及性。未来,该方法有望应用于更多医学影像模态和疾病类型的分割任务。
📄 摘要(原文)
Accurate 3D medical image segmentation is vital for diagnosis and treatment planning, but state-of-the-art models are often too large for clinics with limited computing resources. Lightweight architectures typically suffer significant performance loss. To address these deployment and speed constraints, we propose Region- and Context-aware Knowledge Distillation (ReCo-KD), a training-only framework that transfers both fine-grained anatomical detail and long-range contextual information from a high-capacity teacher to a compact student network. The framework integrates Multi-Scale Structure-Aware Region Distillation (MS-SARD), which applies class-aware masks and scale-normalized weighting to emphasize small but clinically important regions, and Multi-Scale Context Alignment (MS-CA), which aligns teacher-student affinity patterns across feature levels. Implemented on nnU-Net in a backbone-agnostic manner, ReCo-KD requires no custom student design and is easily adapted to other architectures. Experiments on multiple public 3D medical segmentation datasets and a challenging aggregated dataset show that the distilled lightweight model attains accuracy close to the teacher while markedly reducing parameters and inference latency, underscoring its practicality for clinical deployment.