CausalMamba: Scalable Conditional State Space Models for Neural Causal Inference

📄 arXiv: 2510.17318v1 📥 PDF

作者: Sangyoon Bae, Jiook Cha

分类: cs.CV

发布日期: 2025-10-20


💡 一句话要点

CausalMamba:用于神经因果推断的可扩展条件状态空间模型

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 神经因果推断 fMRI 状态空间模型 Mamba架构 BOLD信号反卷积 大脑网络动态 条件状态空间模型

📋 核心要点

  1. 现有基于fMRI的因果推断方法,如DCM,面临BOLD信号扭曲和计算复杂度高的挑战。
  2. CausalMamba将因果推断分解为BOLD信号反卷积和条件Mamba架构的因果图推断两个阶段。
  3. 实验表明,CausalMamba在模拟和真实fMRI数据上均优于传统方法,并能揭示大脑网络动态。

📝 摘要(中文)

本文提出了CausalMamba,一个可扩展的框架,旨在解决基于fMRI的因果推断中的根本性限制:从血流动力学扭曲的BOLD信号中推断神经因果关系的病态性和现有方法(如动态因果模型DCM)的计算复杂性。该方法将复杂的逆问题分解为两个易于处理的阶段:BOLD信号反卷积以恢复潜在的神经活动,然后使用一种新型的条件Mamba架构进行因果图推断。在模拟数据上,CausalMamba比DCM实现了高37%的准确率。关键的是,当应用于真实的task fMRI数据时,该方法以88%的保真度恢复了公认的神经通路,而传统方法在超过99%的受试者中未能识别出这些规范回路。此外,对工作记忆数据的网络分析表明,大脑根据刺激策略性地转移其主要的因果枢纽,招募执行或显著性网络,传统方法无法检测到这种复杂的重构。这项工作为神经科学家提供了一种用于大规模因果推断的实用工具,可以捕捉认知功能的基本回路模式和灵活的网络动态。

🔬 方法详解

问题定义:论文旨在解决基于fMRI的神经因果推断问题。现有方法,如动态因果模型(DCM),由于BOLD信号的血流动力学延迟和失真,以及计算复杂性,难以准确有效地推断神经活动之间的因果关系。DCM等方法在大规模数据集上的应用受到限制,并且难以捕捉大脑动态变化。

核心思路:论文的核心思路是将复杂的因果推断问题分解为两个更容易处理的步骤:首先,使用反卷积技术从BOLD信号中恢复潜在的神经活动;然后,利用一种新型的条件状态空间模型(Conditional Mamba)来推断神经活动之间的因果关系。这种分解简化了问题,并允许使用更高效的模型进行因果推断。

技术框架:CausalMamba框架包含两个主要阶段:1) BOLD信号反卷积:使用某种反卷积算法(具体算法未明确说明,但目的是去除血流动力学的影响)从fMRI数据中恢复潜在的神经活动。2) 因果图推断:使用条件Mamba架构,以恢复的神经活动作为输入,推断神经区域之间的因果关系。条件Mamba架构允许模型根据不同的条件(例如,任务类型、刺激)调整其因果推断。

关键创新:论文的关键创新在于使用条件状态空间模型(Conditional Mamba)进行因果图推断。Mamba架构具有处理长序列数据的能力,这对于处理时间序列fMRI数据至关重要。条件Mamba架构允许模型根据外部条件调整其因果推断,从而能够捕捉大脑网络动态。与传统的DCM等方法相比,CausalMamba具有更高的计算效率和更好的性能。

关键设计:论文中关于Mamba架构的具体参数设置、损失函数和训练细节没有详细说明。条件Mamba的具体实现方式(例如,如何将条件信息融入到Mamba模型中)也未明确说明。这些细节可能在补充材料或相关论文中给出。反卷积算法的具体选择也未明确说明,但这是BOLD信号处理中的一个标准步骤。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CausalMamba在模拟数据上比DCM提高了37%的准确率。在真实task fMRI数据上,CausalMamba以88%的保真度恢复了公认的神经通路,而传统方法在超过99%的受试者中未能识别出这些通路。对工作记忆数据的分析揭示了大脑根据刺激策略性地调整因果枢纽的现象,传统方法无法检测到这种动态变化。

🎯 应用场景

CausalMamba为神经科学研究提供了一种强大的工具,可用于大规模神经因果推断。它可以应用于研究各种认知功能(如工作记忆、注意力和决策)的神经机制,并揭示大脑网络在不同任务和条件下的动态变化。该方法还可以用于诊断和治疗神经系统疾病,例如阿尔茨海默病和精神分裂症。

📄 摘要(原文)

We introduce CausalMamba, a scalable framework that addresses fundamental limitations in fMRI-based causal inference: the ill-posed nature of inferring neural causality from hemodynamically distorted BOLD signals and the computational intractability of existing methods like Dynamic Causal Modeling (DCM). Our approach decomposes this complex inverse problem into two tractable stages: BOLD deconvolution to recover latent neural activity, followed by causal graph inference using a novel Conditional Mamba architecture. On simulated data, CausalMamba achieves 37% higher accuracy than DCM. Critically, when applied to real task fMRI data, our method recovers well-established neural pathways with 88% fidelity, whereas conventional approaches fail to identify these canonical circuits in over 99% of subjects. Furthermore, our network analysis of working memory data reveals that the brain strategically shifts its primary causal hub-recruiting executive or salience networks depending on the stimulus-a sophisticated reconfiguration that remains undetected by traditional methods. This work provides neuroscientists with a practical tool for large-scale causal inference that captures both fundamental circuit motifs and flexible network dynamics underlying cognitive function.