UniField: A Unified Field-Aware MRI Enhancement Framework

📄 arXiv: 2603.09223v1 📥 PDF

作者: Yiyang Lin, Chenhui Wang, Zhihao Peng, Yixuan Yuan

分类: cs.CV

发布日期: 2026-03-10


💡 一句话要点

提出UniField统一框架,利用多场强MRI数据提升增强效果和泛化性。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: MRI增强 场强增强 深度学习 3D基础模型 频谱校正 流匹配模型 多模态学习

📋 核心要点

  1. 现有MRI场强增强方法泛化性差,未能充分利用不同场强间的共享退化模式。
  2. UniField框架利用预训练3D基础模型提取结构信息,并引入场感知频谱校正机制。
  3. 实验表明,UniField在PSNR和SSIM指标上显著优于现有方法,并发布了大规模多场MRI数据集。

📝 摘要(中文)

磁共振成像(MRI)场强增强对于临床诊断和高级研究具有重要价值。然而,现有方法通常侧重于孤立的增强任务,例如使用有限的受试者队列进行特定的64mT到3T或3T到7T的转换,未能利用不同场强之间固有的共享退化模式,严重限制了模型的泛化能力。为了解决这个挑战,我们提出了UniField,一个统一的框架,整合了多种模态和增强任务,通过利用这些共享的退化特征来相互促进表征学习。具体来说,我们的主要贡献有三方面。首先,为了克服MRI数据稀缺并捕获连续的解剖结构,UniField突破了将3D MRI体数据视为独立2D切片的传统方法。相反,我们通过利用预训练的3D基础模型直接利用全面的3D体积信息,从而嵌入通用且鲁棒的结构表示,从而显著提高增强性能。此外,为了减轻主流流匹配模型经常过度平滑高频细节的频谱偏差,我们显式地结合了磁场的物理机制,引入了场感知频谱校正机制(FASRM),为不同的场强定制频谱校正。最后,为了解决根本的数据瓶颈,我们组织并公开发布了一个全面的配对多场MRI数据集,该数据集比现有数据集大一个数量级。大量的实验表明,我们的方法优于最先进的方法,在PSNR中平均提高了约1.81 dB,在SSIM中提高了9.47%。代码将在接收后发布。

🔬 方法详解

问题定义:现有MRI场强增强方法通常针对特定场强转换进行优化,例如64mT到3T或3T到7T,缺乏跨场强的泛化能力。这些方法通常使用有限的数据集,并且忽略了不同场强之间共享的退化模式,导致模型在新数据或不同场强下的性能下降。此外,现有方法通常将3D MRI数据视为独立的2D切片,忽略了3D体积信息,限制了模型对解剖结构的理解。

核心思路:UniField的核心思路是利用不同场强MRI数据之间的共享退化模式,通过多模态和多任务学习来提升模型的泛化能力和增强效果。该方法利用预训练的3D基础模型来提取鲁棒的结构表示,并引入场感知频谱校正机制来缓解流匹配模型的频谱偏差。通过整合这些技术,UniField能够更有效地利用MRI数据,并生成高质量的增强图像。

技术框架:UniField框架主要包含以下几个模块:1) 3D基础模型:用于提取MRI数据的结构表示。2) 场感知频谱校正机制(FASRM):用于根据不同的场强定制频谱校正,缓解流匹配模型的频谱偏差。3) 流匹配模型:用于生成增强后的MRI图像。整个流程首先使用3D基础模型提取MRI数据的结构表示,然后使用FASRM进行频谱校正,最后使用流匹配模型生成增强后的图像。

关键创新:UniField的关键创新点在于以下几个方面:1) 提出了一个统一的框架,可以处理多种场强增强任务。2) 利用预训练的3D基础模型提取鲁棒的结构表示。3) 引入了场感知频谱校正机制,缓解了流匹配模型的频谱偏差。4) 发布了一个大规模的多场MRI数据集,为MRI场强增强研究提供了宝贵的数据资源。与现有方法相比,UniField能够更有效地利用MRI数据,并生成更高质量的增强图像。

关键设计:UniField的关键设计包括:1) 使用预训练的3D ResNet作为3D基础模型,提取MRI数据的结构表示。2) FASRM使用可学习的滤波器来校正频谱偏差,滤波器的参数根据场强进行调整。3) 使用Conditional Flow Matching作为流匹配模型,生成增强后的MRI图像。损失函数包括L1损失和感知损失,用于优化模型的性能。

📊 实验亮点

实验结果表明,UniField在多个MRI场强增强任务上均取得了显著的性能提升。与最先进的方法相比,UniField在PSNR指标上平均提高了约1.81 dB,在SSIM指标上提高了9.47%。这些结果表明,UniField能够有效地利用MRI数据,并生成高质量的增强图像。此外,UniField框架具有良好的泛化能力,可以在不同的场强和不同的MRI序列上取得良好的性能。

🎯 应用场景

UniField框架可应用于多种MRI场强增强任务,提高低场强MRI图像的质量,使其能够达到甚至超过高场强MRI图像的水平。这对于资源有限的医疗机构尤为重要,因为他们可以使用低成本的低场强MRI设备,并通过UniField框架获得高质量的图像,从而提高诊断的准确性和效率。此外,该框架还可以用于MRI图像的超分辨率重建、伪影去除等任务,具有广泛的应用前景。

📄 摘要(原文)

Magnetic Resonance Imaging (MRI) field-strength enhancement holds immense value for both clinical diagnostics and advanced research. However, existing methods typically focus on isolated enhancement tasks, such as specific 64mT-to-3T or 3T-to-7T transitions using limited subject cohorts, thereby failing to exploit the shared degradation patterns inherent across different field strengths and severely restricting model generalization. To address this challenge, we propose \methodname, a unified framework integrating multiple modalities and enhancement tasks to mutually promote representation learning by exploiting these shared degradation characteristics. Specifically, our main contributions are threefold. Firstly, to overcome MRI data scarcity and capture continuous anatomical structures, \methodname departs from conventional methods that treat 3D MRI volumes as independent 2D slices. Instead, we directly exploit comprehensive 3D volumetric information by leveraging pre-trained 3D foundation models, thereby embedding generalized and robust structural representations to significantly boost enhancement performance. In addition, to mitigate the spectral bias of mainstream flow-matching models that often over-smooth high-frequency details, we explicitly incorporate the physical mechanisms of magnetic fields to introduce a Field-Aware Spectral Rectification Mechanism (FASRM), tailoring customized spectral corrections to distinct field strengths. Finally, to resolve the fundamental data bottleneck, we organize and publicly release a comprehensive paired multi-field MRI dataset, which is an order of magnitude larger than existing datasets. Extensive experiments demonstrate our method's superiority over state-of-the-art approaches, achieving an average improvement of approximately 1.81 dB in PSNR and 9.47\% in SSIM. Code will be released upon acceptance.