Enhancing Corpus Callosum Segmentation in Fetal MRI via Pathology-Informed Domain Randomization

📄 arXiv: 2508.20475v2 📥 PDF

作者: Marina Grifell i Plana, Vladyslav Zalevskyi, Léa Schmidt, Yvan Gomez, Thomas Sanchez, Vincent Dunet, Mériam Koob, Vanessa Siffredi, Meritxell Bach Cuadra

分类: cs.CV, cs.LG

发布日期: 2025-08-28 (更新: 2025-10-02)

备注: Presented at the PIPPI Workshop of MICCAI 2025

期刊: Link-Sourani, D., Abaci Turk, E., Bastiaansen, W., Hutter, J., Melbourne, A., Licandro, R. (eds) Perinatal, Preterm and Paediatric Image Analysis. PIPPI 2025. Lecture Notes in Computer Science, vol 16118. Springer, Cham

DOI: 10.1007/978-3-032-05997-0_5


💡 一句话要点

提出病理信息驱动的域随机化方法,提升胎儿MRI中胼胝体分割精度,尤其针对胼胝体发育不全。

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 胎儿MRI 胼胝体分割 胼胝体发育不全 域随机化 数据增强 深度学习 医学图像分析

📋 核心要点

  1. 罕见病胼胝体发育不全(CCD)数据稀缺,限制了深度学习在胎儿脑部MRI分割中的应用,尤其影响模型对病理情况的泛化能力。
  2. 提出一种病理信息驱动的域随机化策略,利用健康胎儿数据,模拟CCD的各种大脑改变,生成合成数据,无需病理标注即可训练模型。
  3. 实验表明,该方法显著提升了CCD病例的分割精度,同时保持了在健康胎儿和其他脑部病变胎儿上的性能,并改善了生物标志物估计的准确性。

📝 摘要(中文)

精确的胎儿脑部分割对于提取生物标志物和评估神经发育至关重要,尤其是在胼胝体发育不全(CCD)等疾病中,这些疾病会导致显著的解剖结构变化。然而,CCD的罕见性严重限制了带标注的数据,阻碍了深度学习模型的泛化能力。为了解决这个问题,我们提出了一种病理信息驱动的域随机化策略,该策略将CCD表现的先验知识嵌入到合成数据生成流程中。通过仅从健康数据中模拟各种大脑改变,我们的方法能够实现稳健的分割,而无需病理标注。我们在一个包含248个健康胎儿、26个CCD胎儿和47个其他脑部病变的队列上验证了我们的方法,在CCD病例上取得了显著的改进,同时保持了在健康胎儿和其他病变胎儿上的性能。从预测的分割中,我们推导出临床相关的生物标志物,如胼胝体长度(LCC)和体积,并展示了它们在区分CCD亚型中的效用。我们的病理信息增强将健康病例的LCC估计误差从1.89毫米降低到0.80毫米,CCD病例的LCC估计误差从10.9毫米降低到0.7毫米。除了这些定量增益之外,我们的方法还产生了相对于可用ground truth具有改进拓扑一致性的分割,从而能够进行更可靠的基于形状的分析。总的来说,这项工作表明,将领域特定的解剖先验知识纳入合成数据流程中可以有效地缓解数据稀缺问题,并增强对罕见但临床上重要的畸形的研究。

🔬 方法详解

问题定义:论文旨在解决胎儿MRI图像中胼胝体分割的问题,尤其关注罕见病胼胝体发育不全(CCD)病例。现有方法受限于CCD病例数据稀缺,导致深度学习模型泛化能力不足,难以准确分割病理状态下的胼胝体。

核心思路:论文的核心思路是利用病理信息驱动的域随机化,通过合成数据增强来解决数据稀缺问题。具体来说,就是从健康胎儿的MRI数据出发,模拟各种CCD可能出现的解剖结构变化,从而生成大量的合成病理数据,用于训练分割模型。这样可以在没有真实病理标注的情况下,提升模型对CCD病例的分割能力。

技术框架:整体流程包括以下几个主要阶段:1) 健康胎儿MRI数据预处理;2) 基于CCD病理知识的域随机化,生成合成病理数据;3) 使用合成数据和少量真实健康数据训练分割模型;4) 在真实胎儿MRI数据(包括健康、CCD和其他病变)上进行测试和验证。

关键创新:最重要的技术创新点在于病理信息驱动的域随机化策略。与传统的域随机化方法不同,该方法不是随机地改变图像特征,而是根据CCD的已知病理表现,有针对性地模拟大脑结构的改变。这种方法能够更有效地生成具有代表性的病理数据,从而提升模型的泛化能力。

关键设计:论文中关键的设计包括:1) 如何根据CCD的病理特征(例如胼胝体缺失、脑室扩大等)设计域随机化的参数;2) 如何平衡合成数据和真实数据在训练中的比例;3) 使用何种分割网络结构(论文中未明确指出,但推测使用了常见的医学图像分割网络,如U-Net或V-Net);4) 损失函数的选择,可能使用了Dice Loss或Cross-Entropy Loss等。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在CCD病例上的胼胝体长度(LCC)估计误差从10.9毫米显著降低到0.7毫米,在健康病例上的LCC估计误差也从1.89毫米降低到0.80毫米。同时,该方法在保持健康胎儿和其他脑部病变胎儿分割性能的同时,显著提升了CCD病例的分割精度和拓扑一致性。

🎯 应用场景

该研究成果可应用于胎儿神经发育评估和诊断,尤其是在罕见脑部畸形(如胼胝体发育不全)的早期筛查和诊断中。通过提高分割精度,可以更准确地提取临床相关的生物标志物,辅助医生进行病情评估和制定治疗方案。该方法也为其他罕见病的数据增强和模型训练提供了借鉴。

📄 摘要(原文)

Accurate fetal brain segmentation is crucial for extracting biomarkers and assessing neurodevelopment, especially in conditions such as corpus callosum dysgenesis (CCD), which can induce drastic anatomical changes. However, the rarity of CCD severely limits annotated data, hindering the generalization of deep learning models. To address this, we propose a pathology-informed domain randomization strategy that embeds prior knowledge of CCD manifestations into a synthetic data generation pipeline. By simulating diverse brain alterations from healthy data alone, our approach enables robust segmentation without requiring pathological annotations. We validate our method on a cohort comprising 248 healthy fetuses, 26 with CCD, and 47 with other brain pathologies, achieving substantial improvements on CCD cases while maintaining performance on both healthy fetuses and those with other pathologies. From the predicted segmentations, we derive clinically relevant biomarkers, such as corpus callosum length (LCC) and volume, and show their utility in distinguishing CCD subtypes. Our pathology-informed augmentation reduces the LCC estimation error from 1.89 mm to 0.80 mm in healthy cases and from 10.9 mm to 0.7 mm in CCD cases. Beyond these quantitative gains, our approach yields segmentations with improved topological consistency relative to available ground truth, enabling more reliable shape-based analyses. Overall, this work demonstrates that incorporating domain-specific anatomical priors into synthetic data pipelines can effectively mitigate data scarcity and enhance analysis of rare but clinically significant malformations.