Functional MRI Time Series Generation via Wavelet-Based Image Transform and Spectral Flow Matching for Brain Disorder Identification

📄 arXiv: 2605.30387v1 📥 PDF

作者: Hwa Hui Tew, Junn Yong Loo, Fang Yu Leong, Julia K. Lau, Ding Fan, Hernando Ombao, Raphaël C. -W. Phan, Chee Pin Tan, Chee-Ming Ting

分类: cs.LG, cs.AI, cs.CV, eess.SP

发布日期: 2026-05-28

备注: Accepted at the Fourteenth International Conference on Learning Representations (ICLR 2026)

🔗 代码/项目: GITHUB


💡 一句话要点

提出基于小波变换和谱流匹配的DSFM模型,用于生成fMRI时间序列并识别脑部疾病。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱八:物理动画 (Physics-based Animation)

关键词: fMRI 生成模型 谱流匹配 小波变换 脑疾病识别

📋 核心要点

  1. fMRI数据采集成本高昂,限制了数据驱动的脑分析模型所需的高质量样本数量。
  2. 提出双谱流匹配(DSFM)框架,通过双重频率表示和谱流匹配生成生理上合理的fMRI时间序列。
  3. 实验表明,DSFM生成的fMRI数据能够提升下游脑网络分类任务的性能。

📝 摘要(中文)

功能磁共振成像(fMRI)通过测量血氧水平依赖(BOLD)信号随时间的变化,提供了一种非侵入式的方式来获取动态脑活动。然而,fMRI采集过程需要大量的资源,这限制了数据驱动的脑分析模型所需的高保真样本的可用性。虽然现代生成模型可以合成fMRI数据,但它们在复制原始BOLD信号固有的非平稳性、复杂的时空动态以及生理变化方面仍然具有挑战性。为了解决这些挑战,我们提出了一种新的fMRI生成框架——双谱流匹配(DSFM),它将BOLD信号的双频表示与谱流匹配相结合。具体来说,我们的框架首先通过离散小波变换(DWT)将BOLD信号转换为小波分解图,以捕获全局瞬态和多尺度变化,并将其投影到跨脑区和时间的离散余弦变换(DCT)空间,以利用低频主导的BOLD系数的局部能量压缩。随后,训练一个谱流匹配模型来生成类别条件的余弦频率表示。生成的样本通过逆DCT和逆DWT操作进行重建,以恢复生理上合理的时域BOLD信号。这种双重变换方法施加了结构化的频率先验,并保留了关键的生理脑动态。最终,我们通过改进下游基于fMRI的脑网络分类来证明了我们方法的有效性。代码可在https://github.com/htew0001/DSFM.git 获取。

🔬 方法详解

问题定义:论文旨在解决fMRI数据获取成本高昂,导致数据量不足的问题。现有生成模型难以准确模拟fMRI信号的非平稳性、复杂的时空动态以及生理变化,从而影响下游脑疾病识别等任务的性能。

核心思路:论文的核心思路是利用双重频率表示(小波变换和离散余弦变换)来捕捉fMRI信号的多尺度时空特征,并结合谱流匹配方法生成高质量的fMRI时间序列。通过在频率域进行生成,可以更好地控制信号的生理特性和动态变化。

技术框架:DSFM框架包含以下主要阶段:1) 使用离散小波变换(DWT)将BOLD信号分解为小波系数,捕捉多尺度变化;2) 将小波系数通过离散余弦变换(DCT)投影到频率域,利用低频能量压缩特性;3) 训练谱流匹配模型,在频率域生成类别条件的fMRI信号表示;4) 通过逆DCT和逆DWT操作,将生成的频率域信号重构为时域BOLD信号。

关键创新:该方法最重要的创新点在于结合了小波变换和离散余弦变换的双重频率表示,以及谱流匹配的生成模型。这种双重变换能够更好地捕捉fMRI信号的复杂时空动态和生理特性,从而生成更逼真的fMRI数据。与现有方法相比,DSFM能够更好地模拟fMRI信号的非平稳性和生理变异性。

关键设计:论文中使用了离散小波变换(DWT)来提取BOLD信号的多尺度特征,并使用离散余弦变换(DCT)进行能量压缩。谱流匹配模型采用条件生成的方式,可以生成特定类别(例如,患有某种脑部疾病)的fMRI数据。损失函数的设计旨在保证生成信号的频率特性与真实信号相似,从而保留生理上的合理性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,使用DSFM生成的fMRI数据训练的脑网络分类器,在脑疾病识别任务上取得了显著的性能提升。具体而言,相较于使用真实fMRI数据训练的分类器,使用DSFM生成数据进行增强训练后,分类准确率提高了X%(具体数值未知,论文中未明确给出)。该结果验证了DSFM生成fMRI数据的有效性和实用性。

🎯 应用场景

该研究成果可应用于脑疾病诊断、脑功能研究和神经科学等领域。通过生成大量的fMRI数据,可以克服数据稀缺的问题,提高脑疾病诊断模型的准确性和泛化能力。此外,生成的数据还可以用于研究不同脑区之间的连接模式,以及脑活动与认知功能之间的关系。未来,该技术有望促进个性化医疗和精准治疗的发展。

📄 摘要(原文)

Functional Magnetic Resonance Imaging (fMRI) provides non-invasive access to dynamic brain activity by measuring blood oxygen level-dependent (BOLD) signals over time. However, the resource-intensive nature of fMRI acquisition limits the availability of high-fidelity samples required for data-driven brain analysis models. While modern generative models can synthesize fMRI data, they often remain challenging in replicating their inherent non-stationarity, intricate spatiotemporal dynamics, and physiological variations of raw BOLD signals. To address these challenges, we propose Dual-Spectral Flow Matching (DSFM), a novel fMRI generative framework that cascades dual frequency representation of BOLD signals with spectral flow matching. Specifically, our framework first converts BOLD signals into a wavelet decomposition map via a discrete wavelet transform (DWT) to capture globalized transient and multi-scale variations, and projects into the discrete cosine transform (DCT) space across brain regions and time to exploit localized energy compaction of low-frequency dominant BOLD coefficients. Subsequently, a spectral flow matching model is trained to generate class-conditioned cosine-frequency representation. The generated samples are reconstructed through inverse DCT and inverse DWT operations to recover physiologically plausible time-domain BOLD signals. This dual-transform approach imposes structured frequency priors and preserves key physiological brain dynamics. Ultimately, we demonstrate the efficacy of our approach through improved downstream fMRI-based brain network classification. The code is available at https://github.com/htew0001/DSFM.git .