DisAgg: Distributed Aggregators for Efficient Secure Aggregation in Federated Learning

作者: Haaris Mehmood, Giorgos Tatsis, Dimitrios Alexopoulos, Karthikeyan Saravanan, Jie Xu, Anastasios Drosou, Mete Ozay

分类: cs.CR, cs.DC, cs.LG

发布日期: 2026-05-13

备注: Accepted to MLSys 2026; code available at: https://github.com/SamsungLabs/mlsys26_disagg

💡 一句话要点

DisAgg：一种用于联邦学习中高效安全聚合的分布式聚合器

🎯 匹配领域: 支柱五：交互与反应 (Interaction & Reaction)

关键词: 联邦学习 安全聚合 分布式聚合器 隐私保护 秘密共享

📋 核心要点

现有联邦学习安全聚合方法存在通信轮次多、计算开销大、难以处理客户端掉线等问题，限制了其在大规模场景下的应用。
DisAgg通过引入客户端聚合器委员会，将客户端更新向量秘密共享给聚合器，由聚合器本地计算部分和，降低了端点计算负担。
实验表明，DisAgg在处理大规模高维数据时，相比于OPA等现有方法，具有显著的性能优势，速度提升高达4.6倍。

📝 摘要（中文）

联邦学习支持跨分布式客户端的协同模型训练，但原始FL会将客户端更新暴露给中央服务器。安全聚合方案可以保护隐私，防止诚实但好奇的服务器，但现有方法通常存在通信轮次过多、公钥操作繁重或难以处理客户端掉线等问题。最近的方法，如一次性私有聚合（OPA），将轮次减少到每次FL迭代的单次服务器交互，但它们给服务器和客户端都带来了巨大的密码学和计算开销。我们提出了一种名为DisAgg的新协议，该协议利用一个由客户端组成的小型委员会（称为聚合器）来执行聚合本身：每个客户端将其更新向量秘密共享给聚合器，聚合器在本地计算部分和，并仅返回聚合后的份额以供服务器端重建。这种设计消除了本地掩码和昂贵的同态加密，减少了端点计算，同时保护了隐私，防止好奇的服务器和有限比例的串通客户端。通过利用通信和计算成本之间的最佳权衡，与之前的最佳协议OPA相比，DisAgg可以处理来自10万个5G客户端的10万维更新向量，速度提高了4.6倍。

🔬 方法详解

问题定义：论文旨在解决联邦学习中安全聚合的效率问题。现有方法，如OPA，虽然减少了通信轮次，但引入了大量的密码学和计算开销，尤其是在客户端数量和模型维度较高时，成为性能瓶颈。这些方法难以满足大规模、低延迟的联邦学习应用需求。

核心思路：DisAgg的核心思路是利用一个由客户端组成的聚合器委员会，将聚合计算任务分摊到这些聚合器上。每个客户端不再直接与服务器交互，而是将其更新向量秘密共享给聚合器。聚合器在本地计算部分和，并将聚合后的份额返回给服务器。服务器只需重建最终的聚合结果，无需进行复杂的密码学运算。

技术框架：DisAgg协议包含以下主要阶段：1) 聚合器选择：从所有客户端中选择一部分作为聚合器。2) 秘密共享：每个客户端将其更新向量秘密共享给选定的聚合器。3) 局部聚合：每个聚合器接收到来自多个客户端的份额后，在本地计算部分和。4) 份额返回：聚合器将聚合后的份额返回给服务器。5) 结果重建：服务器根据收到的份额重建最终的聚合结果。

关键创新：DisAgg的关键创新在于引入了分布式聚合器的概念，将原本由服务器承担的聚合计算任务分摊到客户端。这种设计避免了客户端的本地掩码和服务器的同态加密等昂贵操作，显著降低了计算开销。同时，通过秘密共享机制，保证了客户端数据的隐私性，防止服务器和部分恶意客户端的窥探。

关键设计：DisAgg的关键设计包括：1) 聚合器数量的选择：需要权衡通信开销和安全性，选择合适的聚合器数量。2) 秘密共享方案的选择：需要选择高效且安全的秘密共享方案，例如Shamir秘密共享。3) 客户端选择策略：选择哪些客户端作为聚合器，可以采用随机选择或基于信誉值的选择策略。

🖼️ 关键图片

📊 实验亮点

实验结果表明，DisAgg在处理10万维更新向量和10万个5G客户端时，相比于之前的最佳协议OPA，速度提升了4.6倍。这表明DisAgg在实际应用中具有显著的性能优势，能够有效降低计算开销，提高联邦学习的效率。此外，DisAgg还具有良好的可扩展性，可以适应不同规模的联邦学习场景。

🎯 应用场景

DisAgg适用于大规模、低延迟的联邦学习应用场景，例如5G网络中的边缘计算、物联网设备上的模型训练等。该方法可以有效降低客户端的计算负担，提高聚合效率，并保护用户数据的隐私。未来，DisAgg可以应用于自动驾驶、智能医疗、金融风控等领域，促进人工智能技术的普及和应用。

📄 摘要（原文）

Federated learning enables collaborative model training across distributed clients, yet vanilla FL exposes client updates to the central server. Secure-aggregation schemes protect privacy against an honest-but-curious server, but existing approaches often suffer from many communication rounds, heavy public-key operations, or difficulty handling client dropouts. Recent methods like One-Shot Private Aggregation (OPA) cut rounds to a single server interaction per FL iteration, yet they impose substantial cryptographic and computational overhead on both server and clients. We propose a new protocol called DisAgg that leverages a small committee of clients called Aggregators to perform the aggregation itself: each client secret-shares its update vector to Aggregators, which locally compute partial sums and return only aggregated shares for server-side reconstruction. This design eliminates local masking and expensive homomorphic encryption, reducing endpoint computation while preserving privacy against a curious server and a limited fraction of colluding clients. By leveraging optimal trade-offs between communication and computation costs, DisAgg processes 100k-dimensional update vectors from 100k 5G clients with a 4.6x speedup compared to OPA, the previous best protocol.

DisAgg: Distributed Aggregators for Efficient Secure Aggregation in Federated Learning

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理