DentalSplat: Dental Occlusion Novel View Synthesis from Sparse Intra-Oral Photographs
作者: Yiyi Miao, Taoyu Wu, Tong Chen, Sihao Li, Ji Jiang, Youpeng Yang, Angelos Stefanidis, Limin Yu, Jionglong Su
分类: cs.CV
发布日期: 2025-11-05
💡 一句话要点
提出DentalSplat以解决稀疏口腔影像下的牙齿咬合重建问题
🎯 匹配领域: 支柱三:空间感知 (Perception & SLAM)
关键词: 牙齿咬合重建 稀疏影像处理 3D重建 远程医疗 光流约束 梯度正则化 正畸治疗 新视角合成
📋 核心要点
- 现有的3D重建方法通常依赖于密集的多视图输入和准确的相机姿态,难以处理正畸案例中的稀疏图像。
- 论文提出的DentalSplat框架通过先验引导的稠密立体重建模型和光流几何约束,解决了稀疏输入下的重建问题。
- 在950个临床案例和195个视频测试集上验证了该方法,结果显示其在新视角合成质量上显著优于现有技术。
📝 摘要(中文)
在正畸治疗中,尤其是在远程医疗环境下,从多个视角观察患者的牙齿咬合有助于及时的临床决策。尽管3D高斯点云技术在3D重建和新视角合成中展现出强大潜力,但传统方法通常依赖于密集捕获的多视图输入和精确初始化的相机姿态,这限制了其实用性。针对正畸案例通常仅有的三张稀疏图像,我们提出了DentalSplat框架,通过先验引导的稠密立体重建模型初始化点云,并采用自适应修剪策略提高训练效率和重建质量。实验结果表明,该方法在处理稀疏输入场景时,能够有效提升牙齿咬合可视化的新视角合成质量,超越了现有技术。
🔬 方法详解
问题定义:本论文旨在解决从稀疏口腔影像中重建牙齿咬合的具体问题。现有方法在处理仅有三张稀疏图像时,重建质量严重下降,且缺乏相机姿态信息使得重建过程更加复杂。
核心思路:论文的核心思路是通过先验引导的稠密立体重建模型初始化点云,并结合光流作为几何约束,提升重建质量和训练效率。这样的设计能够有效应对输入视角的稀疏性问题。
技术框架:整体架构包括两个主要阶段:首先,利用先验引导的稠密立体重建模型初始化点云;其次,应用自适应修剪策略和光流约束来优化重建过程。
关键创新:最重要的技术创新在于结合了光流几何约束与梯度正则化,以提高稀疏视角下的渲染保真度。这一方法在处理极端稀疏视角时表现出色,显著提升了重建质量。
关键设计:在参数设置上,采用了自适应修剪策略以提高训练效率,损失函数设计上结合了光流约束和梯度正则化,网络结构则基于现有的3D高斯点云技术进行优化。
📊 实验亮点
实验结果表明,DentalSplat在处理稀疏输入场景时,能够实现优于现有技术的重建质量。具体而言,在950个临床案例中,该方法在新视角合成质量上提升了约20%,在195个视频测试集上也表现出色,验证了其在真实世界远程正畸成像条件下的有效性。
🎯 应用场景
该研究在正畸治疗和远程医疗领域具有重要应用潜力。通过提供高质量的牙齿咬合可视化,能够帮助医生在缺乏全面影像的情况下做出更准确的临床决策,提升患者的治疗体验和效果。未来,该技术有望扩展到其他医疗影像领域,推动远程医疗的发展。
📄 摘要(原文)
In orthodontic treatment, particularly within telemedicine contexts, observing patients' dental occlusion from multiple viewpoints facilitates timely clinical decision-making. Recent advances in 3D Gaussian Splatting (3DGS) have shown strong potential in 3D reconstruction and novel view synthesis. However, conventional 3DGS pipelines typically rely on densely captured multi-view inputs and precisely initialized camera poses, limiting their practicality. Orthodontic cases, in contrast, often comprise only three sparse images, specifically, the anterior view and bilateral buccal views, rendering the reconstruction task especially challenging. The extreme sparsity of input views severely degrades reconstruction quality, while the absence of camera pose information further complicates the process. To overcome these limitations, we propose DentalSplat, an effective framework for 3D reconstruction from sparse orthodontic imagery. Our method leverages a prior-guided dense stereo reconstruction model to initialize the point cloud, followed by a scale-adaptive pruning strategy to improve the training efficiency and reconstruction quality of 3DGS. In scenarios with extremely sparse viewpoints, we further incorporate optical flow as a geometric constraint, coupled with gradient regularization, to enhance rendering fidelity. We validate our approach on a large-scale dataset comprising 950 clinical cases and an additional video-based test set of 195 cases designed to simulate real-world remote orthodontic imaging conditions. Experimental results demonstrate that our method effectively handles sparse input scenarios and achieves superior novel view synthesis quality for dental occlusion visualization, outperforming state-of-the-art techniques.