DisAgg: Distributed Aggregators for Efficient Secure Aggregation in Federated Learning
作者: Haaris Mehmood, Giorgos Tatsis, Dimitrios Alexopoulos, Karthikeyan Saravanan, Jie Xu, Anastasios Drosou, Mete Ozay
分类: cs.CR, cs.DC, cs.LG
发布日期: 2026-05-13
备注: Accepted to MLSys 2026; code available at: https://github.com/SamsungLabs/mlsys26_disagg
💡 一句话要点
DisAgg:一种用于联邦学习中高效安全聚合的分布式聚合器
🎯 匹配领域: 支柱五:交互与反应 (Interaction & Reaction)
关键词: 联邦学习 安全聚合 分布式聚合器 隐私保护 秘密共享
📋 核心要点
- 现有联邦学习安全聚合方法存在通信轮次多、计算开销大、难以处理客户端掉线等问题,限制了其在大规模场景下的应用。
- DisAgg通过引入客户端聚合器委员会,将客户端更新向量秘密共享给聚合器,由聚合器本地计算部分和,降低了端点计算负担。
- 实验表明,DisAgg在处理大规模高维数据时,相比于OPA等现有方法,具有显著的性能优势,速度提升高达4.6倍。
📝 摘要(中文)
联邦学习支持跨分布式客户端的协同模型训练,但原始FL会将客户端更新暴露给中央服务器。安全聚合方案可以保护隐私,防止诚实但好奇的服务器,但现有方法通常存在通信轮次过多、公钥操作繁重或难以处理客户端掉线等问题。最近的方法,如一次性私有聚合(OPA),将轮次减少到每次FL迭代的单次服务器交互,但它们给服务器和客户端都带来了巨大的密码学和计算开销。我们提出了一种名为DisAgg的新协议,该协议利用一个由客户端组成的小型委员会(称为聚合器)来执行聚合本身:每个客户端将其更新向量秘密共享给聚合器,聚合器在本地计算部分和,并仅返回聚合后的份额以供服务器端重建。这种设计消除了本地掩码和昂贵的同态加密,减少了端点计算,同时保护了隐私,防止好奇的服务器和有限比例的串通客户端。通过利用通信和计算成本之间的最佳权衡,与之前的最佳协议OPA相比,DisAgg可以处理来自10万个5G客户端的10万维更新向量,速度提高了4.6倍。
🔬 方法详解
问题定义:论文旨在解决联邦学习中安全聚合的效率问题。现有方法,如OPA,虽然减少了通信轮次,但引入了大量的密码学和计算开销,尤其是在客户端数量和模型维度较高时,成为性能瓶颈。这些方法难以满足大规模、低延迟的联邦学习应用需求。
核心思路:DisAgg的核心思路是利用一个由客户端组成的聚合器委员会,将聚合计算任务分摊到这些聚合器上。每个客户端不再直接与服务器交互,而是将其更新向量秘密共享给聚合器。聚合器在本地计算部分和,并将聚合后的份额返回给服务器。服务器只需重建最终的聚合结果,无需进行复杂的密码学运算。
技术框架:DisAgg协议包含以下主要阶段:1) 聚合器选择:从所有客户端中选择一部分作为聚合器。2) 秘密共享:每个客户端将其更新向量秘密共享给选定的聚合器。3) 局部聚合:每个聚合器接收到来自多个客户端的份额后,在本地计算部分和。4) 份额返回:聚合器将聚合后的份额返回给服务器。5) 结果重建:服务器根据收到的份额重建最终的聚合结果。
关键创新:DisAgg的关键创新在于引入了分布式聚合器的概念,将原本由服务器承担的聚合计算任务分摊到客户端。这种设计避免了客户端的本地掩码和服务器的同态加密等昂贵操作,显著降低了计算开销。同时,通过秘密共享机制,保证了客户端数据的隐私性,防止服务器和部分恶意客户端的窥探。
关键设计:DisAgg的关键设计包括:1) 聚合器数量的选择:需要权衡通信开销和安全性,选择合适的聚合器数量。2) 秘密共享方案的选择:需要选择高效且安全的秘密共享方案,例如Shamir秘密共享。3) 客户端选择策略:选择哪些客户端作为聚合器,可以采用随机选择或基于信誉值的选择策略。
🖼️ 关键图片
📊 实验亮点
实验结果表明,DisAgg在处理10万维更新向量和10万个5G客户端时,相比于之前的最佳协议OPA,速度提升了4.6倍。这表明DisAgg在实际应用中具有显著的性能优势,能够有效降低计算开销,提高联邦学习的效率。此外,DisAgg还具有良好的可扩展性,可以适应不同规模的联邦学习场景。
🎯 应用场景
DisAgg适用于大规模、低延迟的联邦学习应用场景,例如5G网络中的边缘计算、物联网设备上的模型训练等。该方法可以有效降低客户端的计算负担,提高聚合效率,并保护用户数据的隐私。未来,DisAgg可以应用于自动驾驶、智能医疗、金融风控等领域,促进人工智能技术的普及和应用。
📄 摘要(原文)
Federated learning enables collaborative model training across distributed clients, yet vanilla FL exposes client updates to the central server. Secure-aggregation schemes protect privacy against an honest-but-curious server, but existing approaches often suffer from many communication rounds, heavy public-key operations, or difficulty handling client dropouts. Recent methods like One-Shot Private Aggregation (OPA) cut rounds to a single server interaction per FL iteration, yet they impose substantial cryptographic and computational overhead on both server and clients. We propose a new protocol called DisAgg that leverages a small committee of clients called Aggregators to perform the aggregation itself: each client secret-shares its update vector to Aggregators, which locally compute partial sums and return only aggregated shares for server-side reconstruction. This design eliminates local masking and expensive homomorphic encryption, reducing endpoint computation while preserving privacy against a curious server and a limited fraction of colluding clients. By leveraging optimal trade-offs between communication and computation costs, DisAgg processes 100k-dimensional update vectors from 100k 5G clients with a 4.6x speedup compared to OPA, the previous best protocol.