Domain-invariant Representation Learning via Segment Anything Model for Blood Cell Classification

作者: Yongcheng Li, Lingcong Cai, Ying Lu, Cheng Lin, Yupeng Zhang, Jingyan Jiang, Genan Dai, Bowen Zhang, Jingzhou Cao, Xiangzhong Zhang, Xiaomao Fan

分类: cs.CV

发布日期: 2024-08-14

🔗 代码/项目: GITHUB

💡 一句话要点

提出基于SAM的领域不变表征学习框架，提升血细胞跨域分类精度

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 血细胞分类 领域不变学习 Segment Anything Model LoRA微调 跨域自编码器

📋 核心要点

现有血细胞分类模型在跨域场景下泛化能力不足，主要原因是不同实验室的程序和设置导致了领域偏移。
论文提出DoRL框架，利用LoRA微调SAM学习图像嵌入并分割血细胞，再通过CAE学习领域不变表征。
实验结果表明，DoRL在跨域血细胞分类任务上取得了显著提升，超越了现有方法，达到新的SOTA。

📝 摘要（中文）

血细胞的精确分类对于血液系统疾病的诊断至关重要。然而，在实际应用中，由于实验室程序和设置的差异导致的领域偏移，会迅速降低模型的泛化性能。为了解决这个问题，我们提出了一种新颖的领域不变表征学习（DoRL）框架，该框架利用Segment Anything Model（SAM）进行血细胞分类。DoRL主要包含两个组成部分：基于LoRA的SAM（LoRA-SAM）和一个跨域自编码器（CAE）。DoRL的优势在于，它可以以无监督的方式从各种血细胞数据集中提取领域不变的表征。具体来说，我们首先利用大规模的基础模型SAM，通过LoRA进行微调，以学习通用的图像嵌入并分割血细胞。此外，我们引入CAE来学习跨不同领域数据集的领域不变表征，同时减轻图像伪影的影响。为了验证领域不变表征的有效性，我们采用五种广泛使用的机器学习分类器来构建血细胞分类模型。在两个公共血细胞数据集和一个私有真实数据集上的实验结果表明，我们提出的DoRL实现了新的最先进的跨域性能，显著超越了现有方法。

🔬 方法详解

问题定义：血细胞分类在临床诊断中至关重要，但不同实验室之间的数据存在领域差异，导致模型在新的数据集上表现不佳。现有方法难以有效提取领域不变的特征，从而限制了模型的泛化能力。

核心思路：利用预训练的Segment Anything Model (SAM) 强大的图像分割能力，结合LoRA进行高效微调，提取血细胞的通用特征。然后，通过跨域自编码器 (CAE) 进一步学习领域不变的表征，消除领域差异带来的影响。这种方法旨在学习到与具体数据来源无关的、更具泛化性的血细胞特征。

技术框架：DoRL框架包含两个主要模块：LoRA-SAM 和 CAE。首先，使用LoRA对SAM进行微调，使其适应血细胞图像的分割任务，得到血细胞的图像嵌入。然后，将这些嵌入输入到CAE中，CAE通过学习跨域的共享表征，消除领域特定的信息。最后，将CAE提取的领域不变表征用于血细胞分类。

关键创新：该方法的核心创新在于将预训练的SAM模型引入到领域不变表征学习中。SAM作为一个强大的视觉基础模型，能够提供高质量的图像嵌入和分割结果，从而为后续的领域不变表征学习奠定基础。此外，结合LoRA进行高效微调，降低了计算成本。

关键设计：LoRA-SAM使用预训练的SAM模型作为骨干网络，通过LoRA技术进行微调，以适应血细胞分割任务。CAE采用自编码器的结构，通过最小化重构误差和领域判别损失来学习领域不变表征。具体的损失函数设计包括重构损失、对抗损失（用于领域判别）等。分类器部分，文章使用了五种常用的机器学习分类器，以验证DoRL提取的特征的有效性。

🖼️ 关键图片

📊 实验亮点

实验结果表明，DoRL在跨域血细胞分类任务上取得了显著的性能提升，超越了现有方法。具体而言，在两个公共数据集和一个私有数据集上，DoRL的分类准确率均优于其他基线方法，证明了其领域不变表征学习的有效性。具体的性能提升幅度在论文中进行了详细的量化。

🎯 应用场景

该研究成果可应用于临床血液疾病的辅助诊断，通过提高血细胞分类的准确性和鲁棒性，减少人工干预，提升诊断效率。该方法还可推广到其他医学图像分析任务，例如细胞病理学、组织病理学等，具有广阔的应用前景。

📄 摘要（原文）

Accurate classification of blood cells is of vital significance in the diagnosis of hematological disorders. However, in real-world scenarios, domain shifts caused by the variability in laboratory procedures and settings, result in a rapid deterioration of the model's generalization performance. To address this issue, we propose a novel framework of domain-invariant representation learning (DoRL) via segment anything model (SAM) for blood cell classification. The DoRL comprises two main components: a LoRA-based SAM (LoRA-SAM) and a cross-domain autoencoder (CAE). The advantage of DoRL is that it can extract domain-invariant representations from various blood cell datasets in an unsupervised manner. Specifically, we first leverage the large-scale foundation model of SAM, fine-tuned with LoRA, to learn general image embeddings and segment blood cells. Additionally, we introduce CAE to learn domain-invariant representations across different-domain datasets while mitigating images' artifacts. To validate the effectiveness of domain-invariant representations, we employ five widely used machine learning classifiers to construct blood cell classification models. Experimental results on two public blood cell datasets and a private real dataset demonstrate that our proposed DoRL achieves a new state-of-the-art cross-domain performance, surpassing existing methods by a significant margin. The source code can be available at the URL (https://github.com/AnoK3111/DoRL).

Domain-invariant Representation Learning via Segment Anything Model for Blood Cell Classification

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理