OptiVote: Non-Coherent FSO Over-the-Air Majority Vote for Communication-Efficient Distributed Federated Learning in Space Data Centers
作者: Anbang Zhang, Chenyuan Feng, Wai Ho Mow, Jia Ye, Shuaishuai Guo, Geyong Min, Tony Q. S. Quek
分类: eess.SP, cs.LG
发布日期: 2025-12-30 (更新: 2026-01-08)
💡 一句话要点
OptiVote:面向空间数据中心,通信高效的非相干FSO空中多数投票联邦学习
🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)
关键词: 联邦学习 空中计算 自由空间光通信 空间数据中心 非相干通信 多数投票 动态功率控制
📋 核心要点
- 星间链路带宽和能量受限,且链路条件动态,导致空间数据中心联邦学习的聚合通信开销大,传统相干AirComp对相位同步要求高。
- 提出OptiVote框架,结合signSGD、多数投票和PPM,利用非相干FSO AirComp,无需精确相位同步,增强动态环境下的鲁棒性。
- 设计无CSI的动态功率控制方案,平衡接收能量,减轻异构信道引起的聚合偏差,并从理论上分析了聚合误差概率和收敛性。
📝 摘要(中文)
随着巨型星座的快速部署,空间数据中心(SDC)的长期愿景正在成为现实,互连卫星形成在轨分布式计算和学习基础设施。在此类系统中实现分布式联邦学习面临挑战,因为迭代训练需要频繁地通过带宽和能量受限的星间链路进行聚合,且链路条件高度动态。本文利用空中计算(AirComp)作为一种网络内聚合原语。然而,传统的相干AirComp依赖于严格的相位对齐,这在空间环境中由于卫星抖动和多普勒效应而难以维持。为了克服这一限制,我们提出OptiVote,这是一个鲁棒且通信高效的非相干自由空间光(FSO) AirComp框架,用于面向空间数据中心的联邦学习。OptiVote集成了符号随机梯度下降(signSGD)与多数投票(MV)聚合原则和脉冲位置调制(PPM),其中每个卫星通过激活正交PPM时隙来传递局部梯度符号。聚合节点通过非相干能量累积执行MV检测,将相位敏感的场叠加转换为相位无关的光强度组合,从而消除了对精确相位同步的需求,并提高了在动态损伤下的鲁棒性。为了减轻异构FSO信道引起的聚合偏差,我们进一步开发了一种重要性感知、无信道状态信息(CSI)的动态功率控制方案,该方案在没有额外信令的情况下平衡接收能量。我们通过表征统计FSO信道下的聚合误差概率,并建立非凸目标的收敛保证,提供了理论分析。
🔬 方法详解
问题定义:论文旨在解决空间数据中心中,由于星间链路带宽和能量限制以及动态链路条件,导致传统相干空中计算(AirComp)在联邦学习聚合过程中面临的通信效率低和相位同步困难的问题。现有相干AirComp方法对相位对齐要求严格,在卫星抖动和多普勒效应影响下难以维持,限制了其在空间环境中的应用。
核心思路:论文的核心思路是利用非相干自由空间光(FSO) AirComp,结合符号随机梯度下降(signSGD)和多数投票(MV)聚合原则,通过脉冲位置调制(PPM)将梯度符号编码到不同的时隙中,并在聚合节点通过非相干能量累积进行MV检测。这种方法将相位敏感的场叠加转换为相位无关的光强度组合,从而避免了精确的相位同步需求。
技术框架:OptiVote框架包含以下主要模块:1) 卫星节点:每个卫星节点使用signSGD计算局部梯度符号,并使用PPM将梯度符号编码到不同的时隙中。2) 聚合节点:聚合节点接收来自多个卫星的FSO信号,通过非相干能量累积进行多数投票检测,得到聚合后的梯度符号。3) 动态功率控制模块:该模块根据卫星的重要性动态调整发射功率,以平衡接收能量,减轻异构信道引起的聚合偏差。
关键创新:论文的关键创新在于提出了非相干FSO AirComp框架OptiVote,它将signSGD、多数投票和PPM相结合,实现了无需精确相位同步的联邦学习聚合。此外,论文还提出了一种无CSI的动态功率控制方案,可以在异构信道条件下有效平衡接收能量,提高聚合精度。
关键设计:论文的关键设计包括:1) 使用PPM调制,将梯度符号映射到不同的时隙,避免了相位同步问题。2) 设计了基于能量累积的多数投票检测器,用于在聚合节点进行梯度符号的判决。3) 提出了重要性感知的动态功率控制方案,该方案根据卫星的梯度方差动态调整发射功率,以平衡接收能量。该方案无需额外的信令开销,且对信道状态信息不敏感。
🖼️ 关键图片
📊 实验亮点
论文通过理论分析和仿真实验验证了OptiVote框架的有效性。理论分析表明,该框架具有良好的收敛性。仿真结果表明,在存在信道衰落和噪声的情况下,OptiVote框架能够实现较高的聚合精度,并且优于传统的相干AirComp方法。动态功率控制方案能够有效减轻异构信道引起的聚合偏差,进一步提高性能。
🎯 应用场景
OptiVote框架可应用于空间数据中心,实现卫星间的分布式联邦学习,例如地球观测数据的联合分析、空间态势感知模型的训练等。该研究降低了星间通信的相位同步要求,提高了通信效率和鲁棒性,有助于构建更高效、可靠的在轨分布式计算和学习基础设施,促进空间信息技术的进步。
📄 摘要(原文)
The rapid deployment of mega-constellations is driving the long-term vision of space data centers (SDCs), where interconnected satellites form in-orbit distributed computing and learning infrastructures. Enabling distributed federated learning in such systems is challenging because iterative training requires frequent aggregation over inter-satellite links that are bandwidth- and energy-constrained, and the link conditions can be highly dynamic. In this work, we exploit over-the-air computation (AirComp) as an in-network aggregation primitive. However, conventional coherent AirComp relies on stringent phase alignment, which is difficult to maintain in space environments due to satellite jitter and Doppler effects. To overcome this limitation, we propose OptiVote, a robust and communication-efficient non-coherent free-space optical (FSO) AirComp framework for federated learning toward Space Data Centers. OptiVote integrates sign stochastic gradient descent (signSGD) with a majority-vote (MV) aggregation principle and pulse-position modulation (PPM), where each satellite conveys local gradient signs by activating orthogonal PPM time slots. The aggregation node performs MV detection via non-coherent energy accumulation, transforming phase-sensitive field superposition into phase-agnostic optical intensity combining, thereby eliminating the need for precise phase synchronization and improving resilience under dynamic impairments. To mitigate aggregation bias induced by heterogeneous FSO channels, we further develop an importance-aware, channel state information (CSI)-free dynamic power control scheme that balances received energies without additional signaling. We provide theoretical analysis by characterizing the aggregate error probability under statistical FSO channels and establishing convergence guarantees for non-convex objectives.