PEGS: Physics-Event Enhanced Large Spatiotemporal Motion Reconstruction via 3D Gaussian Splatting
作者: Yijun Xu, Jingrui Zhang, Hongyi Liu, Yuhan Chen, Yuanyang Wang, Qingyao Guo, Dingwen Wang, Lei Yu, Chu He
分类: cs.CV
发布日期: 2025-11-21
💡 一句话要点
PEGS:基于物理事件增强的3D高斯溅射实现大时空运动重建
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱八:物理动画 (Physics-based Animation)
关键词: 运动重建 3D高斯溅射 事件相机 物理先验 运动模糊 卡尔曼滤波 模拟退火
📋 核心要点
- 现有方法在建模范式、运动模糊和物理一致性方面存在局限,难以重建大时空尺度下的刚性运动。
- PEGS框架融合物理先验和事件流增强,利用3D高斯溅射进行去模糊建模和运动恢复,实现更精确的运动重建。
- 实验结果表明,PEGS在重建大时空尺度运动方面优于主流动态方法,并贡献了新的RGB-Event配对数据集。
📝 摘要(中文)
由于建模范式的局限性、严重的运动模糊以及物理一致性不足,在大时空尺度上重建刚性运动仍然是一项具有挑战性的任务。本文提出了PEGS,一个将物理先验与事件流增强集成到3D高斯溅射管道中的框架,以执行去模糊的、目标聚焦的建模和运动恢复。我们引入了一个有凝聚力的三级监督方案,通过加速度约束来加强物理合理性,利用事件流进行高时间分辨率指导,并采用卡尔曼正则化器来融合多源观测。此外,我们设计了一种运动感知的模拟退火策略,该策略基于实时运动学状态自适应地调度训练过程。我们还贡献了第一个RGB-Event配对数据集,该数据集针对各种场景中的自然、快速刚性运动。实验表明,与主流动态方法相比,PEGS在重建大时空尺度上的运动方面表现出卓越的性能。
🔬 方法详解
问题定义:论文旨在解决大时空尺度下刚性运动重建的难题。现有方法在处理严重的运动模糊、保证物理一致性以及有效利用高时间分辨率信息方面存在不足,导致重建精度和鲁棒性受限。
核心思路:论文的核心思路是将物理先验知识和事件流信息融入到3D高斯溅射(3D Gaussian Splatting)框架中。通过物理先验约束保证重建运动的合理性,利用事件流提供高时间分辨率的运动信息,从而克服运动模糊的影响,提升重建质量。
技术框架:PEGS框架主要包含以下几个模块:1) 3D高斯溅射模块,用于场景的动态表示;2) 物理先验约束模块,通过加速度约束保证运动的物理合理性;3) 事件流增强模块,利用事件流提供高时间分辨率的运动信息;4) 卡尔曼正则化器,用于融合多源观测数据;5) 运动感知的模拟退火策略,自适应地调整训练过程。
关键创新:PEGS的关键创新在于:1) 提出了一个融合物理先验和事件流的3D高斯溅射框架,有效解决了大时空尺度下的运动重建问题;2) 设计了一个三级监督方案,包括物理合理性约束、事件流指导和卡尔曼正则化,从而实现更精确的运动重建;3) 提出了运动感知的模拟退火策略,自适应地调整训练过程,提高了训练效率和重建质量。
关键设计:论文设计了以下关键技术细节:1) 使用加速度约束作为物理先验,保证重建运动的合理性;2) 利用事件流提供高时间分辨率的运动信息,克服运动模糊的影响;3) 采用卡尔曼正则化器融合多源观测数据,提高重建精度;4) 设计运动感知的模拟退火策略,根据实时运动学状态自适应地调整训练过程。
🖼️ 关键图片
📊 实验亮点
PEGS在重建大时空尺度运动方面表现出卓越的性能,显著优于主流动态方法。论文贡献了首个RGB-Event配对数据集,为相关研究提供了宝贵的数据资源。实验结果表明,PEGS能够有效处理运动模糊,重建出更精确、更鲁棒的运动轨迹。
🎯 应用场景
该研究成果可应用于机器人导航、自动驾驶、运动捕捉、增强现实等领域。通过精确重建快速运动物体的轨迹和姿态,可以提高机器人对动态环境的感知能力,提升自动驾驶系统的安全性,并为AR/VR应用提供更逼真的交互体验。未来,该技术有望在工业自动化、医疗诊断等领域发挥重要作用。
📄 摘要(原文)
Reconstruction of rigid motion over large spatiotemporal scales remains a challenging task due to limitations in modeling paradigms, severe motion blur, and insufficient physical consistency. In this work, we propose PEGS, a framework that integrates Physical priors with Event stream enhancement within a 3D Gaussian Splatting pipeline to perform deblurred target-focused modeling and motion recovery. We introduce a cohesive triple-level supervision scheme that enforces physical plausibility via an acceleration constraint, leverages event streams for high-temporal resolution guidance, and employs a Kalman regularizer to fuse multi-source observations. Furthermore, we design a motion-aware simulated annealing strategy that adaptively schedules the training process based on real-time kinematic states. We also contribute the first RGB-Event paired dataset targeting natural, fast rigid motion across diverse scenarios. Experiments show PEGS's superior performance in reconstructing motion over large spatiotemporal scales compared to mainstream dynamic methods.