FMCL: Class-Aware Client Clustering with Foundation Model Representations for Heterogeneous Federated Learning

📄 arXiv: 2604.27510v1 📥 PDF

作者: Mahad Ali, Laura J. Brattain

分类: cs.LG, cs.CV

发布日期: 2026-04-30

备注: 14 pages, 2 figures


💡 一句话要点

FMCL:利用基础模型表征进行类感知客户端聚类的异构联邦学习

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 联邦学习 异构数据 客户端聚类 基础模型 类感知学习

📋 核心要点

  1. 现有联邦学习聚类方法依赖原始数据或模型参数,难以捕捉异构数据下的类级别语义信息。
  2. FMCL利用预训练基础模型提取客户端数据的类级别嵌入,构建语义客户端签名,实现一次性聚类。
  3. 实验表明,FMCL在异构数据集上提升了联邦学习性能,并获得了比现有方法更稳定的聚类效果。

📝 摘要(中文)

联邦学习(FL)实现了跨分布式客户端的协作模型训练,而无需共享原始数据,但其性能在统计异构性下会下降。聚类联邦学习通过对相似客户端进行分组并为每个集群训练单独的模型来解决这一挑战。然而,现有的聚类策略通常依赖于原始数据统计、模型参数或启发式相似性度量,这些方法无法捕获跨异构域的类级别语义结构,并且经常需要迭代协调。我们提出了FMCL,一个一次性的、类感知的客户端聚类框架,它利用基础模型表征来构建语义客户端签名。FMCL使用冻结的基础模型,计算每个客户端的类级别嵌入原型,并通过其类感知表征之间的余弦距离来衡量相似性。聚类在训练之前执行一次,在联邦优化期间不引入额外的通信,并且与下游模型架构无关。在异构基准上的大量实验表明,在非独立同分布数据划分下,与现有的基于聚类的方法相比,FMCL提高了联邦性能并产生了更稳定的聚类行为。

🔬 方法详解

问题定义:联邦学习在客户端数据异构性(statistical heterogeneity)下性能显著下降。现有的聚类联邦学习方法,如基于原始数据统计、模型参数或启发式相似度度量的方法,无法有效捕捉类级别的语义信息,导致聚类效果不佳,影响模型训练效果。此外,一些方法需要迭代协调,增加了通信成本。

核心思路:FMCL的核心思路是利用预训练的基础模型(Foundation Model)提取客户端数据的类级别语义表征,并基于这些表征进行客户端聚类。通过使用预训练模型,可以有效利用大规模数据集学习到的通用知识,从而更好地捕捉客户端数据的语义信息,提高聚类效果。

技术框架:FMCL框架主要包含以下几个阶段:1) 特征提取:使用冻结的预训练基础模型,对每个客户端的本地数据进行特征提取,得到每个类别的嵌入向量。2) 客户端签名构建:基于每个客户端的类别嵌入向量,构建该客户端的语义签名。具体而言,计算每个类别的嵌入原型(embedding prototype),例如通过计算该类别所有样本嵌入的均值。3) 客户端聚类:计算客户端签名之间的相似度(例如,使用余弦距离),并使用聚类算法(例如,K-means)将客户端划分为不同的簇。4) 联邦学习:在每个簇内进行独立的联邦学习模型训练。

关键创新:FMCL的关键创新在于:1) 类感知的客户端聚类:通过考虑类级别的语义信息,提高了聚类的准确性。2) 利用预训练基础模型:利用大规模预训练模型提取特征,避免了从头训练特征提取器的困难,并提高了特征的泛化能力。3) 一次性聚类:聚类过程在训练前完成,无需迭代协调,降低了通信成本。

关键设计:FMCL的关键设计包括:1) 基础模型的选择:选择合适的预训练基础模型至关重要,需要根据具体任务和数据集进行选择。2) 类别嵌入原型的计算:可以使用不同的方法计算类别嵌入原型,例如均值、中位数等。3) 相似度度量:可以使用不同的相似度度量方法,例如余弦距离、欧氏距离等。4) 聚类算法:可以使用不同的聚类算法,例如K-means、层次聚类等。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,FMCL在多个异构数据集上显著优于现有的聚类联邦学习方法。例如,在某些数据集上,FMCL可以将联邦学习模型的准确率提高5%以上,并且聚类结果更加稳定。此外,FMCL的一次性聚类特性也降低了通信成本。

🎯 应用场景

FMCL可应用于各种存在数据异构性的联邦学习场景,例如跨医疗机构的医疗数据分析、跨设备的移动应用模型训练、以及跨不同地理位置的物联网设备数据分析。该方法能够提升联邦学习在这些场景下的模型性能和泛化能力,从而更好地服务于实际应用。

📄 摘要(原文)

Federated Learning (FL) enables collaborative model training across distributed clients without sharing raw data, yet its performance deteriorates under statistical heterogeneity. Clustered Federated Learning addresses this challenge by grouping similar clients and training separate models per cluster. However, existing clustering strategies often rely on raw data statistics, model parameters, or heuristic similarity measures that fail to capture class-level semantic structure across heterogeneous domains and frequently require iterative coordination. We propose FMCL, a one-shot, class-aware client clustering framework that leverages foundation model representations to construct semantic client signatures. Using a frozen foundation model, FMCL computes class-level embedding prototypes for each client and measures similarity via cosine distance between their class-aware representations. Clustering is performed once prior to training, introducing no additional communication during federated optimization and remaining agnostic to the downstream model architecture. Extensive experiments across heterogeneous benchmarks demonstrate that FMCL improves federated performance and yields more stable clustering behavior compared to existing clustering-based methods under non-identically distributed data partitioning.