PR-ENDO: Physically Based Relightable Gaussian Splatting for Endoscopy

📄 arXiv: 2411.12510v2 📥 PDF

作者: Joanna Kaleta, Weronika Smolak-Dyżewska, Dawid Malarz, Diego Dall'Alba, Przemysław Korzeniowski, Przemysław Spurek

分类: cs.CV

发布日期: 2024-11-19 (更新: 2025-07-09)


💡 一句话要点

PR-ENDO:基于物理的内窥镜可重光照高斯溅射重建

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 内窥镜 三维重建 高斯溅射 可重光照 物理渲染

📋 核心要点

  1. 内窥镜图像重建易受相机运动限制和视角依赖光照影响,导致重建质量下降。
  2. PR-ENDO利用内窥镜成像特点,分离光照效果和组织属性,实现更准确的3D重建。
  3. PR-ENDO在公开和内部数据集上优于现有方法,并支持组织修改和真实光照响应。

📝 摘要(中文)

内窥镜检查对于诊断结直肠癌以及消化道、泌尿生殖系统和呼吸道的其他严重疾病至关重要。从内窥镜图像进行3D重建和新视角合成是增强诊断的有前途的工具。此外,整合生理形变和与内窥镜的交互能够从真实视频数据开发模拟工具。然而,受限的相机轨迹和视角相关的光照会产生伪影,导致不准确或过拟合的重建。我们提出了PR-ENDO,一种新颖的3D重建框架,利用内窥镜成像的独特属性,即单个光源与相机紧密对齐。我们的方法将光照效果与组织属性分离。PR-ENDO通过基于物理的可重光照模型增强了3D高斯溅射。我们使用专门的MLP来增强传统的光传输公式,以捕获复杂的光照相关效果,同时确保减少伪影并更好地泛化到新视角。在公共和内部数据集上,PR-ENDO实现了优于基线方法的重建质量。与现有方法不同,PR-ENDO能够在保持对光照的物理精确响应的同时修改组织,使其更接近真实的临床使用。

🔬 方法详解

问题定义:内窥镜图像的3D重建面临着相机轨迹受限和视角依赖光照的挑战,这些因素会导致重建结果中出现伪影,降低重建精度,甚至导致过拟合。现有方法难以有效分离光照效果和组织属性,限制了重建的真实感和可操作性。

核心思路:PR-ENDO的核心思路是利用内窥镜成像中光源与相机紧密对齐的特性,将光照效果从组织属性中分离出来。通过这种方式,可以更好地建模光照对重建的影响,减少伪影,并提高重建的泛化能力。

技术框架:PR-ENDO基于3D高斯溅射(3D Gaussian Splatting)框架,并对其进行了扩展。该框架包含以下主要模块:1) 使用3D高斯溅射进行初始场景重建;2) 引入基于物理的可重光照模型,用于分离光照效果和组织属性;3) 使用专门设计的MLP(多层感知机)来捕获复杂的光照相关效果;4) 通过优化过程,同时优化高斯参数和MLP参数,实现高质量的3D重建。

关键创新:PR-ENDO的关键创新在于引入了基于物理的可重光照模型,并使用MLP来捕获复杂的光照效果。这使得该方法能够有效地分离光照效果和组织属性,从而减少伪影,提高重建精度,并实现对重建结果的重光照。与现有方法相比,PR-ENDO能够更好地处理内窥镜图像中复杂的光照条件,并实现更真实的3D重建。

关键设计:PR-ENDO的关键设计包括:1) 使用基于物理的光照模型,例如 Lambertian 模型和 Specular 模型,来描述组织表面的光照反射特性;2) 设计专门的MLP结构,用于捕获复杂的光照相关效果,例如阴影、反射和散射;3) 使用光度一致性损失函数来约束重建结果,确保重建结果与原始图像的光照一致性;4) 通过优化过程,同时优化高斯参数和MLP参数,实现高质量的3D重建。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

PR-ENDO在公共和内部数据集上均取得了优于基线方法的重建质量。实验结果表明,PR-ENDO能够有效地减少伪影,提高重建精度,并实现对重建结果的重光照。与现有方法相比,PR-ENDO在重建质量和真实感方面均有显著提升。具体性能数据和提升幅度在论文中有详细展示。

🎯 应用场景

PR-ENDO在内窥镜检查领域具有广泛的应用前景。它可以用于辅助医生进行疾病诊断,例如结直肠癌的早期筛查。此外,PR-ENDO还可以用于开发内窥镜手术模拟器,帮助医生进行手术训练。该技术还可以应用于医学影像分析、虚拟现实和增强现实等领域,为医疗保健行业带来革命性的变革。

📄 摘要(原文)

Endoluminal endoscopic procedures are essential for diagnosing colorectal cancer and other severe conditions in the digestive tract, urogenital system, and airways. 3D reconstruction and novel-view synthesis from endoscopic images are promising tools for enhancing diagnosis. Moreover, integrating physiological deformations and interaction with the endoscope enables the development of simulation tools from real video data. However, constrained camera trajectories and view-dependent lighting create artifacts, leading to inaccurate or overfitted reconstructions. We present PR-ENDO, a novel 3D reconstruction framework leveraging the unique property of endoscopic imaging, where a single light source is closely aligned with the camera. Our method separates light effects from tissue properties. PR-ENDO enhances 3D Gaussian Splatting with a physically based relightable model. We boost the traditional light transport formulation with a specialized MLP capturing complex light-related effects while ensuring reduced artifacts and better generalization across novel views. PR-ENDO achieves superior reconstruction quality compared to baseline methods on both public and in-house datasets. Unlike existing approaches, PR-ENDO enables tissue modifications while preserving a physically accurate response to light, making it closer to real-world clinical use.