CEPerFed: Communication-Efficient Personalized Federated Learning for Multi-Pulse MRI Classification
作者: Ludi Li, Junbin Mao, Hanhe Lin, Xu Tian, Fang-Xiang Wu, Jin Liu
分类: cs.LG, cs.AI
发布日期: 2025-10-20
🔗 代码/项目: GITHUB
💡 一句话要点
提出CEPerFed,一种面向多脉冲MRI分类的通信高效个性化联邦学习方法
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 联邦学习 个性化联邦学习 多脉冲MRI 数据异质性 通信效率 分层SVD 医疗影像分析
📋 核心要点
- 联邦学习在多脉冲MRI分类中面临数据异质性和通信开销大的挑战,影响模型收敛和实用性。
- CEPerFed通过历史梯度协调局部和全局优化,并采用分层SVD降低通信成本,实现高效个性化联邦学习。
- 实验表明,CEPerFed在多个分类任务上表现出有效性,验证了其在异构数据和通信约束下的优越性。
📝 摘要(中文)
多脉冲磁共振成像(MRI)广泛应用于临床实践,如阿尔茨海默病诊断。为了训练一个鲁棒的多脉冲MRI分类模型,需要来自不同医疗机构的大量多样化数据,同时通过防止机构间原始数据共享来保护隐私。联邦学习(FL)是解决此问题的一种可行方案,但由于数据异质性的影响和模型中传输的大量参数导致的大量通信开销,它带来了模型收敛的挑战。为了应对这些挑战,我们提出了一种通信高效的个性化FL方法CEPerFed。它通过结合客户端历史风险梯度和历史平均梯度来协调局部和全局优化,从而减轻数据异质性的影响。前者用于权衡来自其他客户端的贡献,增强局部更新的可靠性,而后者强制局部更新与全局优化方向之间的一致性,以确保异构数据分布上的稳定收敛。为了解决高通信开销问题,我们提出了一种分层SVD(HSVD)策略,该策略仅传输模型更新所需的最关键信息。在五个分类任务上的实验证明了CEPerFed方法的有效性。
🔬 方法详解
问题定义:论文旨在解决多脉冲MRI分类中,由于数据异质性和通信开销过大导致的联邦学习模型收敛困难问题。现有联邦学习方法在处理不同医疗机构间MRI数据差异时,容易出现模型漂移,且模型参数量大导致通信成本高昂,限制了其在实际医疗场景中的应用。
核心思路:CEPerFed的核心思路是通过引入客户端历史风险梯度和历史平均梯度来协调局部和全局优化,从而减轻数据异质性的影响。同时,采用分层SVD(HSVD)策略来压缩模型参数,降低通信开销。通过这种方式,在保证模型个性化的同时,提高联邦学习的效率和稳定性。
技术框架:CEPerFed的整体框架包括以下几个主要阶段:1) 客户端本地训练:每个客户端使用本地数据进行模型训练,并计算历史风险梯度和历史平均梯度。2) 服务器端聚合:服务器收集客户端上传的模型更新和梯度信息,并使用HSVD进行压缩。3) 模型更新:服务器将压缩后的模型更新发送给客户端,客户端结合历史梯度信息进行个性化模型更新。4) 迭代优化:重复上述过程,直到模型收敛。
关键创新:CEPerFed的关键创新在于:1) 引入历史风险梯度和历史平均梯度来协调局部和全局优化,从而减轻数据异质性的影响。2) 提出分层SVD(HSVD)策略,有效降低了通信开销,提高了联邦学习的效率。3) 将上述两种方法结合,实现了通信高效的个性化联邦学习。
关键设计:在梯度协调方面,论文设计了特定的权重计算方法,用于平衡来自不同客户端的贡献,增强局部更新的可靠性。在HSVD方面,论文采用了一种分层分解策略,逐步提取模型参数中的重要信息,并丢弃冗余信息。具体的损失函数和网络结构细节在论文中未详细描述,属于未知信息。
🖼️ 关键图片
📊 实验亮点
CEPerFed在五个分类任务上进行了实验,证明了其有效性。具体性能数据和对比基线在摘要中未提及,属于未知信息。但论文强调,CEPerFed能够减轻数据异质性的影响,并显著降低通信开销,从而提高了联邦学习的效率和稳定性。代码将在论文接收后开源。
🎯 应用场景
CEPerFed可应用于医疗影像分析领域,特别是多中心、多机构的MRI数据分析。通过该方法,可以在保护患者隐私的前提下,利用不同机构的数据训练出更鲁棒、更准确的疾病诊断模型,例如阿尔茨海默病、脑肿瘤等。该研究有助于推动医疗人工智能的发展,提高诊断效率和准确性,最终改善患者的治疗效果。
📄 摘要(原文)
Multi-pulse magnetic resonance imaging (MRI) is widely utilized for clinical practice such as Alzheimer's disease diagnosis. To train a robust model for multi-pulse MRI classification, it requires large and diverse data from various medical institutions while protecting privacy by preventing raw data sharing across institutions. Although federated learning (FL) is a feasible solution to address this issue, it poses challenges of model convergence due to the effect of data heterogeneity and substantial communication overhead due to large numbers of parameters transmitted within the model. To address these challenges, we propose CEPerFed, a communication-efficient personalized FL method. It mitigates the effect of data heterogeneity by incorporating client-side historical risk gradients and historical mean gradients to coordinate local and global optimization. The former is used to weight the contributions from other clients, enhancing the reliability of local updates, while the latter enforces consistency between local updates and the global optimization direction to ensure stable convergence across heterogeneous data distributions. To address the high communication overhead, we propose a hierarchical SVD (HSVD) strategy that transmits only the most critical information required for model updates. Experiments on five classification tasks demonstrate the effectiveness of the CEPerFed method. The code will be released upon acceptance at https://github.com/LD0416/CEPerFed.