MRI Contrast Enhancement Kinetics World Model

📄 arXiv: 2602.19285v1 📥 PDF

作者: Jindi Kong, Yuting He, Cong Xia, Rongjun Ge, Shuo Li

分类: cs.CV

发布日期: 2026-02-22

备注: Accepted by CVPR 2026

🔗 代码/项目: GITHUB


💡 一句话要点

提出MRI CEKWorld模型,通过时空一致性学习提升MRI对比增强动态模拟效果

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: MRI 对比增强 世界模型 时空一致性学习 生成模型

📋 核心要点

  1. 临床MRI对比度采集效率低,且时间分辨率不足,难以训练出准确模拟对比增强动力学的世界模型。
  2. 论文提出MRI CEKWorld模型,通过时空一致性学习,利用潜在对齐学习和潜在差异学习来约束模型学习。
  3. 实验结果表明,该模型在内容真实性和动力学模拟方面均优于现有方法,有效提升了MRI对比增强动态模拟效果。

📝 摘要(中文)

临床MRI对比度采集存在信息利用效率低下的问题,表现为高风险、高成本的采集协议与固定、稀疏的采集序列之间的不匹配。将世界模型应用于模拟人体内的对比增强动力学,可以实现连续的无对比剂动态模拟。然而,MRI采集的时间分辨率低限制了世界模型的训练,导致数据集稀疏。直接训练生成模型捕捉动力学存在两个局限性:(a)由于缺少缺失时间的数据,模型容易过拟合不相关的特征,导致内容失真。(b)由于缺乏连续的时间监督,模型无法学习连续的动力学规律,导致时间不连续性。我们首次提出了具有时空一致性学习(STCL)的MRI对比增强动力学世界模型(MRI CEKWorld)。针对(a),在患者水平的结构在增强过程中保持一致的空间规律的指导下,我们提出了潜在对齐学习(LAL),构建了一个患者特定的模板来约束内容与该模板对齐。针对(b),在动力学遵循一致平滑趋势的时间规律的指导下,我们提出了潜在差异学习(LDL),通过插值扩展未观察到的间隔,并约束插值序列之间潜在空间的平滑变化。在两个数据集上的大量实验表明,我们的MRI CEKWorld实现了更好的真实内容和动力学。

🔬 方法详解

问题定义:论文旨在解决临床MRI对比增强数据采集效率低、时间分辨率不足的问题,导致难以训练出能够准确模拟对比增强动力学的世界模型。现有方法直接训练生成模型,容易过拟合不相关特征,造成内容失真,并且缺乏时间连续性监督,导致动力学模拟不连续。

核心思路:论文的核心思路是利用患者MRI图像在空间和时间上的规律性,即患者个体结构在增强过程中保持一致,且对比增强动力学遵循平滑变化趋势,来约束世界模型的学习过程。通过引入空间和时间一致性约束,提高模型生成图像的真实性和动力学模拟的准确性。

技术框架:MRI CEKWorld模型包含两个主要模块:潜在对齐学习(LAL)和潜在差异学习(LDL)。LAL模块通过构建患者特定的模板,约束生成的内容与该模板对齐,从而保证空间一致性。LDL模块通过插值扩展未观察到的时间间隔,并约束插值序列之间潜在空间的平滑变化,从而保证时间一致性。整体流程是,首先通过编码器将输入图像映射到潜在空间,然后利用LAL和LDL模块进行约束学习,最后通过解码器将潜在空间表示解码为生成的MRI图像序列。

关键创新:论文的关键创新在于提出了时空一致性学习(STCL)框架,并具体实现了潜在对齐学习(LAL)和潜在差异学习(LDL)两个模块。LAL模块利用患者特定的模板来约束内容对齐,解决了直接训练生成模型容易过拟合的问题。LDL模块通过插值和潜在空间平滑约束,解决了缺乏时间连续性监督的问题。

关键设计:LAL模块的关键设计是构建患者特定的模板,该模板可以是患者初始时刻的MRI图像,也可以是其他具有代表性的图像。LAL模块使用损失函数来衡量生成图像与模板之间的差异,并将其作为约束项加入到总损失函数中。LDL模块的关键设计是使用插值方法扩展未观察到的时间间隔,并使用损失函数来衡量插值序列之间潜在空间的平滑程度,例如可以使用相邻帧之间的L1或L2距离作为平滑约束。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文在两个MRI数据集上进行了实验,结果表明MRI CEKWorld模型在内容真实性和动力学模拟方面均优于现有方法。具体而言,该模型在峰值信噪比(PSNR)和结构相似性指数(SSIM)等指标上均取得了显著提升,并且能够生成更逼真、时间连续的MRI图像序列。实验结果验证了时空一致性学习的有效性。

🎯 应用场景

该研究成果可应用于临床MRI诊断,通过模拟完整的对比增强过程,帮助医生更全面地了解病灶的动态变化,提高诊断准确性。此外,该模型还可以用于生成不同对比剂剂量下的MRI图像,优化扫描协议,减少患者的辐射暴露和对比剂使用量。未来,该技术有望推广到其他医学影像模态,例如CT和PET。

📄 摘要(原文)

Clinical MRI contrast acquisition suffers from inefficient information yield, which presents as a mismatch between the risky and costly acquisition protocol and the fixed and sparse acquisition sequence. Applying world models to simulate the contrast enhancement kinetics in the human body enables continuous contrast-free dynamics. However, the low temporal resolution in MRI acquisition restricts the training of world models, leading to a sparsely sampled dataset. Directly training a generative model to capture the kinetics leads to two limitations: (a) Due to the absence of data on missing time, the model tends to overfit to irrelevant features, leading to content distortion. (b) Due to the lack of continuous temporal supervision, the model fails to learn the continuous kinetics law over time, causing temporal discontinuities. For the first time, we propose MRI Contrast Enhancement Kinetics World model (MRI CEKWorld) with SpatioTemporal Consistency Learning (STCL). For (a), guided by the spatial law that patient-level structures remain consistent during enhancement, we propose Latent Alignment Learning (LAL) that constructs a patient-specific template to constrain contents to align with this template. For (b), guided by the temporal law that the kinetics follow a consistent smooth trend, we propose Latent Difference Learning (LDL) which extends the unobserved intervals by interpolation and constrains smooth variations in the latent space among interpolated sequences. Extensive experiments on two datasets show our MRI CEKWorld achieves better realistic contents and kinetics. Codes will be available at https://github.com/DD0922/MRI-Contrast-Enhancement-Kinetics-World-Model.