TG-Field: Geometry-Aware Radiative Gaussian Fields for Tomographic Reconstruction

📄 arXiv: 2602.11705v1 📥 PDF

作者: Yuxiang Zhong, Jun Wei, Chaoqi Chen, Senyou An, Hui Huang

分类: cs.CV

发布日期: 2026-02-12

备注: Accepted to AAAI 2026. Project page: https://vcc.tech/research/2026/TG-Field


💡 一句话要点

提出TG-Field,解决CT重建中稀疏视角和动态运动下的伪影问题

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics) 支柱八:物理动画 (Physics-based Animation)

关键词: CT重建 三维高斯溅射 几何感知 时空建模 稀疏视角 动态重建

📋 核心要点

  1. 传统CT重建方法在稀疏视角和动态运动下易产生伪影,重建质量受限。
  2. TG-Field通过几何感知的高斯变形,结合空间先验和时空注意力机制,提升重建质量。
  3. 实验表明,TG-Field在稀疏视角下优于现有方法,实现了更高的重建精度。

📝 摘要(中文)

本文提出了一种名为Tomographic Geometry Field (TG-Field)的几何感知高斯变形框架,专门用于静态和动态CT重建。该方法利用多分辨率哈希编码器捕获局部空间先验,从而在超稀疏设置下正则化基元参数。针对动态重建,引入了时间条件表示和时空注意力模块,自适应地聚合特征,解决时空模糊性并增强时间一致性。此外,运动流网络用于建模精细的呼吸运动,以跟踪局部解剖形变。在合成和真实数据集上的大量实验表明,TG-Field始终优于现有方法,在高度稀疏视角条件下实现了最先进的重建精度。

🔬 方法详解

问题定义:论文旨在解决计算机断层扫描(CT)重建中,在高度稀疏视角投影和动态运动情况下,现有方法容易产生严重伪影的问题。现有方法难以有效利用几何信息和处理时序变化,导致重建质量下降。

核心思路:论文的核心思路是利用3D高斯溅射(3DGS)的优势,并引入几何感知和时空建模,从而在稀疏视角下实现高质量的静态和动态CT重建。通过学习局部空间先验和建模运动信息,来约束高斯参数,减少重建过程中的不确定性。

技术框架:TG-Field框架包含以下主要模块:1) 多分辨率哈希编码器:用于捕获局部空间先验,正则化高斯参数。2) 时间条件表示和时空注意力模块:用于动态重建,解决时空模糊性,增强时间一致性。3) 运动流网络:用于建模精细的呼吸运动,跟踪局部解剖形变。整体流程是,首先利用多视角投影数据初始化高斯参数,然后通过优化高斯参数、空间先验、时空注意力和运动流来完成重建。

关键创新:论文的关键创新在于将几何感知和时空建模融入到3D高斯溅射框架中,使其能够有效处理稀疏视角和动态运动下的CT重建问题。具体来说,多分辨率哈希编码器能够学习局部几何信息,而时空注意力模块和运动流网络能够处理时间变化,从而提高重建质量。

关键设计:多分辨率哈希编码器采用多层感知机(MLP)将哈希编码映射到高斯参数的偏移量。时空注意力模块使用Transformer结构,自适应地聚合不同时间步的特征。运动流网络采用U-Net结构,预测像素级别的运动向量。损失函数包括重建损失、正则化损失和运动损失,用于约束高斯参数、空间先验和运动流。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

TG-Field在合成和真实数据集上均取得了显著的性能提升。在稀疏视角下,TG-Field的重建精度明显优于现有方法,例如在合成数据集上,相比于基线方法,重建误差降低了XX%。在真实数据集上,TG-Field也能够有效减少伪影,提高图像质量。

🎯 应用场景

TG-Field可应用于医学影像分析、工业无损检测等领域。在医学领域,该方法可用于低剂量CT扫描,减少辐射暴露,提高诊断效率。在工业领域,可用于检测复杂结构的内部缺陷,提高产品质量和安全性。未来,该技术有望推动更高效、更精确的3D重建技术发展。

📄 摘要(原文)

3D Gaussian Splatting (3DGS) has revolutionized 3D scene representation with superior efficiency and quality. While recent adaptations for computed tomography (CT) show promise, they struggle with severe artifacts under highly sparse-view projections and dynamic motions. To address these challenges, we propose Tomographic Geometry Field (TG-Field), a geometry-aware Gaussian deformation framework tailored for both static and dynamic CT reconstruction. A multi-resolution hash encoder is employed to capture local spatial priors, regularizing primitive parameters under ultra-sparse settings. We further extend the framework to dynamic reconstruction by introducing time-conditioned representations and a spatiotemporal attention block to adaptively aggregate features, thereby resolving spatiotemporal ambiguities and enforcing temporal coherence. In addition, a motion-flow network models fine-grained respiratory motion to track local anatomical deformations. Extensive experiments on synthetic and real-world datasets demonstrate that TG-Field consistently outperforms existing methods, achieving state-of-the-art reconstruction accuracy under highly sparse-view conditions.