Stop Holding Your Breath: CT-Informed Gaussian Splatting for Dynamic Bronchoscopy
作者: Andrea Dunn Beltran, Daniel Rho, Aarav Mehta, Xinqi Xiong, Raúl San José Estépar, Ron Alterovitz, Marc Niethammer, Roni Sengupta
分类: cs.CV
发布日期: 2026-04-30
🔗 代码/项目: PROJECT_PAGE
💡 一句话要点
提出CT引导的高斯溅射方法,用于动态支气管镜检查,无需屏气。
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 支气管镜导航 高斯溅射 呼吸运动建模 医学影像配准 动态场景重建
📋 核心要点
- 现有支气管镜导航受呼吸运动影响,CT与实际气道偏差大,需屏气,流程繁琐。
- 提出CT引导的高斯溅射方法,通过呼吸建模将运动约束到解剖学配置,无需屏气。
- 在RESPIRE模拟器上验证,几何重建更准确,训练速度提升20倍,定位精度达1.22mm。
📝 摘要(中文)
支气管镜导航依赖于内窥镜视频与术前CT扫描的配准,但呼吸运动会使气道变形5-20毫米,导致CT与实际身体的偏差,限制了定位精度。目前通常采用屏气方案来缓解这一问题,但这难以重复且会中断临床流程。本文提出了一种利用患者特定呼吸建模的方法,无需屏气。通过配准已有的吸气-呼气CT扫描,将呼吸运动简化为每帧的单个标量呼吸相位,将所有重建约束到解剖学上观察到的配置。我们将这种表示嵌入到网格锚定的高斯溅射框架中,其中一个轻量级估计器直接从内窥镜RGB图像推断呼吸相位,从而在整个呼吸周期内实现连续的、变形感知的重建,无需屏气或外部传感。为了实现定量评估,我们引入了RESPIRE,一个具有物理基础的支气管镜模拟管线,具有每帧几何、姿势、呼吸相位和变形的真实值。在RESPIRE上的实验表明,我们的方法实现了几何上忠实的重建,训练速度提高了20倍以上,目标定位精度达到1.22毫米(在3毫米的临床相关容差范围内),优于未约束的单CT基线。
🔬 方法详解
问题定义:支气管镜导航的关键问题在于呼吸运动导致术前CT扫描与术中气道结构的偏差,传统方法依赖屏气来减少这种偏差,但屏气操作不便且影响临床流程。现有方法难以在动态呼吸条件下实现精确的支气管镜导航。
核心思路:核心思路是利用患者的吸气和呼气CT扫描来构建患者特定的呼吸运动模型。通过将呼吸运动建模为一个标量呼吸相位,并将该相位信息融入到高斯溅射框架中,从而实现对动态气道的精确重建和导航。这种方法避免了对屏气的依赖,使得支气管镜导航可以在自然的呼吸状态下进行。
技术框架:整体框架包括以下几个主要步骤:1) 获取患者的吸气和呼气CT扫描;2) 配准这两组CT扫描,建立呼吸运动模型;3) 构建网格锚定的高斯溅射场景;4) 使用轻量级估计器从内窥镜RGB图像中推断呼吸相位;5) 根据推断的呼吸相位,对高斯溅射场景进行变形,实现动态气道重建。
关键创新:最重要的创新点在于将患者特定的呼吸运动模型与高斯溅射框架相结合,实现了对动态气道的实时重建。通过从内窥镜视频中直接估计呼吸相位,避免了对外部传感器的依赖,使得该方法更加实用和易于部署。此外,RESPIRE模拟器的引入为该领域的研究提供了标准化的评估平台。
关键设计:关键设计包括:1) 使用配准后的吸气-呼气CT扫描定义呼吸运动的变形空间;2) 设计轻量级网络结构,从内窥镜RGB图像中估计呼吸相位;3) 使用网格锚定的高斯溅射方法,实现高效的场景重建和渲染;4) 定义合适的损失函数,以优化呼吸相位估计和场景重建。
🖼️ 关键图片
📊 实验亮点
实验结果表明,该方法在RESPIRE模拟器上实现了1.22毫米的目标定位精度,满足临床3毫米的容差要求,优于未约束的单CT基线方法。此外,该方法训练速度提升了20倍以上,表明其具有良好的计算效率,更易于实际应用。
🎯 应用场景
该研究成果可应用于临床支气管镜检查,提高导航精度,减少手术风险,并有望推广到其他需要考虑呼吸运动的医学影像引导手术,如肺部肿瘤消融、活检等。该方法无需屏气,能显著改善患者体验,提高手术效率,具有重要的临床应用价值。
📄 摘要(原文)
Bronchoscopic navigation relies on registering endoscopic video to a preoperative CT scan, but respiratory motion deforms the airway by 5-20 mm, creating CT-to-body divergence that limits localization accuracy. In practice, this is mitigated through breath-hold protocols, which attempt to match the intraoperative anatomy to a static CT, but are difficult to reproduce and disrupt clinical workflow. We propose to eliminate the need for breath-hold protocols by leveraging patient-specific respiratory modeling. Paired inhale-exhale CT scans, already acquired for planning, implicitly define the patient-specific deformation space of the breathing airway. By registering these scans, we reduce respiratory motion to a single scalar breathing phase per frame, constraining all reconstructions to anatomically observed configurations. We embed this representation within a mesh-anchored Gaussian splatting framework, where a lightweight estimator infers breathing phase directly from endoscopic RGB, enabling continuous, deformation-aware reconstruction throughout the respiratory cycle without breath-holds or external sensing. To enable quantitative evaluation, we introduce RESPIRE, a physically grounded bronchoscopy simulation pipeline with per-frame ground truth for geometry, pose, breathing phase, and deformation. Experiments on RESPIRE show that our approach achieves geometrically faithful reconstruction, over 20x faster training, and 1.22 mm target localization accuracy (within the 3mm clinically relevant tolerances) outperforming unconstrained single-CT baselines. Please check out our website for additional visuals: https://asdunnbe.github.io/RESPIRE/