Cycle-Sync: Robust Global Camera Pose Estimation through Enhanced Cycle-Consistent Synchronization

📄 arXiv: 2511.02329v1 📥 PDF

作者: Shaohan Li, Yunpeng Shi, Gilad Lerman

分类: cs.CV, cs.RO, math.NA, stat.ME

发布日期: 2025-11-04

备注: NeurIPS 2025 spotlight paper


💡 一句话要点

Cycle-Sync:通过增强的循环一致性同步实现稳健的全局相机位姿估计

🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)

关键词: 相机位姿估计 全局优化 循环一致性 消息传递最小二乘 鲁棒估计

📋 核心要点

  1. 现有相机位姿估计方法在噪声和异常值存在时鲁棒性不足,且依赖于耗时的捆绑调整。
  2. Cycle-Sync利用循环一致性约束,通过改进的消息传递最小二乘法(MPLS)进行相机位置估计。
  3. 实验结果表明,Cycle-Sync在合成和真实数据集上均优于现有方法,无需捆绑调整。

📝 摘要(中文)

本文提出了一种稳健的全局相机位姿估计框架Cycle-Sync,用于估计相机的旋转和位置。核心创新在于位置求解器,它将消息传递最小二乘法(MPLS)——最初为群同步而开发——应用于相机位置估计。我们修改了MPLS,强调循环一致性信息,使用先前迭代中估计的距离重新定义循环一致性,并结合了Welsch型鲁棒损失。我们为相机位置估计建立了已知的最强的确定性精确恢复保证,表明仅循环一致性——无需访问相机间距离——就足以实现当前已知的最低样本复杂度。为了进一步提高鲁棒性,我们引入了一个受鲁棒子空间恢复启发的即插即用异常值拒绝模块,并将循环一致性完全集成到MPLS中以进行旋转同步。我们的全局方法避免了对捆绑调整的需求。在合成和真实数据集上的实验表明,Cycle-Sync始终优于领先的位姿估计器,包括具有捆绑调整的完整结构光重建流程。

🔬 方法详解

问题定义:相机位姿估计旨在从一系列图像中恢复相机的旋转和平移信息。现有方法,特别是依赖于增量式结构光重建(SfM)的方法,容易受到噪声和异常值的影响,并且通常需要耗时的捆绑调整来优化结果。全局位姿估计方法旨在直接估计所有相机位姿,但仍然面临鲁棒性和准确性的挑战。

核心思路:Cycle-Sync的核心思路是利用循环一致性约束来提高相机位姿估计的鲁棒性。循环一致性是指,如果相机A看到相机B,相机B看到相机C,相机C又看到相机A,那么这三个相机之间的相对位姿关系应该满足一定的几何约束。通过强调和利用这些循环一致性信息,可以有效地减少噪声和异常值的影响,从而提高位姿估计的准确性和鲁棒性。

技术框架:Cycle-Sync包含以下主要模块:1) 基于消息传递最小二乘法(MPLS)的位置求解器,用于估计相机的位置;2) 循环一致性增强模块,用于强调循环一致性信息;3) 鲁棒损失函数,用于减少异常值的影响;4) 异常值拒绝模块,用于进一步提高鲁棒性;5) 旋转同步模块,将循环一致性集成到MPLS中以进行旋转估计。整体流程是先使用改进的MPLS估计相机位置,然后进行旋转同步,最后通过异常值拒绝模块进一步优化结果。

关键创新:Cycle-Sync的关键创新在于:1) 将MPLS应用于相机位置估计,并对其进行了改进,使其更适合相机位姿估计问题;2) 强调循环一致性信息,并使用先前迭代中估计的距离重新定义循环一致性;3) 引入了Welsch型鲁棒损失,以减少异常值的影响;4) 提出了一个即插即用异常值拒绝模块,进一步提高了鲁棒性。

关键设计:在位置求解器中,MPLS被修改为强调循环一致性信息。具体来说,循环一致性被定义为相机之间相对位姿关系的闭合环路。Welsch型鲁棒损失被用于减少异常值的影响,其形式为ρ(x) = c^2/2 * (1 - exp(-(x/c)^2)),其中c是一个尺度参数。异常值拒绝模块基于鲁棒子空间恢复的思想,通过识别和剔除不一致的相机对来提高鲁棒性。旋转同步模块将循环一致性集成到MPLS中,以实现更准确的旋转估计。

📊 实验亮点

Cycle-Sync在合成和真实数据集上进行了广泛的实验。在合成数据集上,Cycle-Sync在各种噪声水平下均优于现有方法,并且实现了最低的样本复杂度。在真实数据集上,Cycle-Sync在EuRoC和KITTI数据集上均取得了state-of-the-art的结果,并且优于包括具有捆绑调整的完整结构光重建流程在内的其他方法。例如,在EuRoC数据集上,Cycle-Sync的平均旋转误差和位置误差均显著低于其他方法。

🎯 应用场景

Cycle-Sync在机器人导航、增强现实、三维重建、自动驾驶等领域具有广泛的应用前景。该方法能够提供更准确和鲁棒的相机位姿估计,从而提高这些应用系统的性能和可靠性。未来,该方法可以进一步扩展到更大规模的场景,并与其他传感器数据融合,以实现更精确的环境感知。

📄 摘要(原文)

We introduce Cycle-Sync, a robust and global framework for estimating camera poses (both rotations and locations). Our core innovation is a location solver that adapts message-passing least squares (MPLS) -- originally developed for group synchronization -- to camera location estimation. We modify MPLS to emphasize cycle-consistent information, redefine cycle consistencies using estimated distances from previous iterations, and incorporate a Welsch-type robust loss. We establish the strongest known deterministic exact-recovery guarantee for camera location estimation, showing that cycle consistency alone -- without access to inter-camera distances -- suffices to achieve the lowest sample complexity currently known. To further enhance robustness, we introduce a plug-and-play outlier rejection module inspired by robust subspace recovery, and we fully integrate cycle consistency into MPLS for rotation synchronization. Our global approach avoids the need for bundle adjustment. Experiments on synthetic and real datasets show that Cycle-Sync consistently outperforms leading pose estimators, including full structure-from-motion pipelines with bundle adjustment.