MorphoFlow: Sparse-Supervised Generative Shape Modeling with Adaptive Latent Relevance

📄 arXiv: 2604.11636v1 📥 PDF

作者: Mokshagna Sai Teja Karanam, Tushar Kataria, Shireen Elhabian

分类: cs.CV

发布日期: 2026-04-13


💡 一句话要点

MorphoFlow:基于稀疏监督和自适应隐变量相关性的生成式形状建模

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 生成式形状建模 稀疏监督学习 神经隐式表示 自回归归一化流 医学图像分析 解剖结构重建

📋 核心要点

  1. 现有统计形状建模方法依赖密集标注和固定隐变量,限制了其在复杂解剖结构和大规模数据上的应用。
  2. MorphoFlow利用神经隐式表示和自回归流,从稀疏标注中学习紧凑的概率形状表示,实现分辨率无关的建模。
  3. 通过自适应隐变量相关性加权,MorphoFlow能够学习结构化的隐空间,支持不确定性量化和解剖学上合理的形状合成。

📝 摘要(中文)

统计形状建模(SSM)是解剖变异性群体水平分析的核心,但现有方法大多依赖于密集的分割标注和固定的隐变量表示,限制了可扩展性和建模复杂解剖变异的灵活性。我们提出了MorphoFlow,一个稀疏监督的生成式形状建模框架,直接从稀疏表面标注中学习紧凑的概率形状表示。MorphoFlow集成了神经隐式形状表示、自解码器公式和自回归归一化流,以学习隐形状空间上富有表现力的概率密度。神经隐式表示支持对3D解剖结构进行与分辨率无关的建模,而自解码器公式支持在稀疏监督下直接优化每个实例的隐代码。自回归流捕获隐解剖变异的分布,提供了一个可处理的、基于似然的形状生成模型。为了促进紧凑和结构化的隐表示,我们通过稀疏诱导先验引入自适应隐变量相关性加权,使模型能够根据各个隐维度的相关性调节其对底层解剖变异的贡献,同时保持生成表达能力。由此产生的隐空间支持不确定性量化和解剖学上合理的形状合成,无需手动调整隐维度。在公开的腰椎和股骨数据集上的评估表明,该方法能够从稀疏输入中准确地进行高分辨率重建,并恢复与群体水平趋势一致的结构化解剖变异模式。

🔬 方法详解

问题定义:现有统计形状建模方法需要密集的标注数据,这在医学图像分析中是一个很大的挑战,因为获取密集的、精确的标注非常耗时且成本高昂。此外,现有方法通常使用固定的隐变量表示,难以捕捉复杂的解剖变异性,并且需要手动调整隐空间的维度。

核心思路:MorphoFlow的核心思路是利用神经隐式表示来建模形状,并结合自回归归一化流来学习隐空间的概率分布。通过自解码器结构,可以直接从稀疏的表面标注中优化每个实例的隐代码。自适应隐变量相关性加权则用于促进学习紧凑且结构化的隐空间,从而提高模型的泛化能力和可解释性。

技术框架:MorphoFlow框架包含以下几个主要模块:1) 神经隐式形状表示模块,使用一个神经网络将3D坐标映射到形状的占用概率;2) 自解码器模块,将形状编码到隐空间,并从隐空间解码回形状;3) 自回归归一化流模块,用于建模隐空间的概率分布;4) 自适应隐变量相关性加权模块,通过稀疏诱导先验来调节隐变量的贡献。

关键创新:MorphoFlow的关键创新在于以下几个方面:1) 提出了一种基于稀疏监督的生成式形状建模框架,可以直接从稀疏标注中学习形状表示;2) 结合了神经隐式表示和自回归归一化流,能够学习到富有表达力的隐空间;3) 引入了自适应隐变量相关性加权,可以学习到紧凑且结构化的隐空间,提高模型的泛化能力和可解释性。

关键设计:在神经隐式表示模块中,使用了MLP网络来学习形状的占用概率。自解码器模块使用编码器-解码器结构,编码器将形状编码到隐空间,解码器从隐空间重建形状。自回归归一化流模块使用RealNVP架构来建模隐空间的概率分布。自适应隐变量相关性加权模块使用L1正则化来促进隐变量的稀疏性。损失函数包括重建损失、KL散度和稀疏性损失。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

MorphoFlow在腰椎和股骨数据集上进行了评估,实验结果表明,该方法能够从稀疏输入中准确地进行高分辨率重建,并恢复与群体水平趋势一致的结构化解剖变异模式。与现有方法相比,MorphoFlow在重建精度和隐空间的可解释性方面均有显著提升。

🎯 应用场景

MorphoFlow在医学图像分析领域具有广泛的应用前景,例如可以用于解剖结构的重建、形状分析、疾病诊断和治疗计划。通过学习解剖结构的概率模型,MorphoFlow可以用于生成新的、解剖学上合理的形状,从而帮助医生更好地理解解剖变异性。此外,MorphoFlow还可以用于不确定性量化,从而提高诊断和治疗的可靠性。

📄 摘要(原文)

Statistical shape modeling (SSM) is central to population level analysis of anatomical variability, yet most existing approaches rely on densely annotated segmentations and fixed latent representations. These requirements limit scalability and reduce flexibility when modeling complex anatomical variation. We introduce MorphoFlow, a sparse supervised generative shape modeling framework that learns compact probabilistic shape representations directly from sparse surface annotations. MorphoFlow integrates neural implicit shape representations with an autodecoder formulation and autoregressive normalizing flows to learn an expressive probabilistic density over the latent shape space. The neural implicit representation enables resolution-agnostic modeling of 3D anatomy, while the autodecoder formulation supports direct optimization of per-instance latent codes under sparse supervision. The autoregressive flow captures the distribution of latent anatomical variability providing a tractable, likelihood-based generative model of shapes. To promote compact and structured latent representations, we incorporate adaptive latent relevance weighting through sparsity-inducing priors, enabling the model to regulate the contribution of individual latent dimensions according to their relevance to the underlying anatomical variation while preserving generative expressivity. The resulting latent space supports uncertainty quantification and anatomically plausible shape synthesis without manual latent dimensionality tuning. Evaluation on publicly available lumbar vertebrae and femur datasets demonstrates accurate high-resolution reconstruction from sparse inputs and recovery of structured modes of anatomical variation consistent with population level trends.