Aneumo: A Large-Scale Multimodal Aneurysm Dataset with Computational Fluid Dynamics Simulations and Deep Learning Benchmarks

📄 arXiv: 2505.14717v1 📥 PDF

作者: Xigui Li, Yuanye Zhou, Feiyang Xiao, Xin Guo, Chen Jiang, Tan Pan, Xingmeng Zhang, Cenyu Liu, Zeyun Miao, Jianchao Ge, Xiansheng Wang, Qimeng Wang, Yichi Zhang, Wenbo Zhang, Fengping Zhu, Limei Han, Yuan Qi, Chensen Lin, Yuan Cheng

分类: eess.IV, cs.AI, cs.CV, cs.LG

发布日期: 2025-05-19

🔗 代码/项目: GITHUB


💡 一句话要点

Aneumo:大规模多模态脑动脉瘤数据集,含CFD模拟与深度学习基准。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 颅内动脉瘤 计算流体动力学 深度学习 数据集 血流动力学

📋 核心要点

  1. 现有颅内动脉瘤风险评估方法主要依赖形态学和患者特异性因素,忽略了血流动力学的影响。
  2. 该研究通过合成大量动脉瘤形状并进行CFD模拟,构建了一个大规模、高保真度的血流动力学数据集。
  3. 该数据集包含多种模态数据,并提供了一个流动参数估计的基准,旨在促进数据驱动的动脉瘤研究。

📝 摘要(中文)

颅内动脉瘤(IAs)是常见的脑血管病变,约影响5%的人口,破裂可能导致高死亡率。目前IA风险评估侧重形态和患者特异性因素,但血流动力学对IA发展和破裂的影响尚不明确。传统计算流体动力学(CFD)方法虽然精确,但计算密集,难以应用于大规模或实时临床场景。为解决此问题,我们构建了一个大规模、高保真动脉瘤CFD数据集,以促进高效机器学习算法的开发。基于427个真实动脉瘤几何形状,通过受控变形合成了10,660个3D形状,模拟动脉瘤演变,其真实性已获神经外科医生确认。在每种形状下,进行了八种稳态质量流量条件下的CFD计算,生成了85,280个血流动力学数据,涵盖关键参数。数据集还包括分割掩码,支持使用图像、点云或其他多模态数据作为输入的任务。此外,我们引入了用于估计流动参数的基准,以评估当前建模方法。该数据集旨在推进动脉瘤研究,并促进生物流体、生物医学工程和临床风险评估中数据驱动方法的发展。

🔬 方法详解

问题定义:颅内动脉瘤的破裂风险评估是临床上的一个重要问题。传统的CFD方法虽然能够提供精确的血流动力学信息,但计算成本高昂,难以应用于大规模的临床数据分析和实时决策。因此,需要开发一种高效的、基于数据驱动的方法来预测动脉瘤的血流动力学参数。

核心思路:该论文的核心思路是构建一个大规模的、包含真实动脉瘤几何形状和CFD模拟结果的数据集,并利用该数据集训练机器学习模型,从而实现对动脉瘤血流动力学参数的快速预测。通过合成大量的动脉瘤形状,可以有效地扩充数据集,提高模型的泛化能力。

技术框架:该研究的技术框架主要包括以下几个步骤:1) 收集真实动脉瘤的几何形状数据;2) 通过受控变形的方法合成大量的动脉瘤形状;3) 对每个动脉瘤形状进行CFD模拟,计算血流动力学参数;4) 构建包含动脉瘤几何形状、血流动力学参数和分割掩码的数据集;5) 建立流动参数估计的基准,评估当前建模方法。

关键创新:该论文的关键创新在于构建了一个大规模的、高保真度的动脉瘤CFD数据集。该数据集不仅包含了真实动脉瘤的几何形状数据,还包含了通过CFD模拟得到的血流动力学参数。此外,该数据集还提供了分割掩码,支持使用图像、点云或其他多模态数据作为输入的任务。

关键设计:在合成动脉瘤形状时,采用了受控变形的方法,以保证合成形状的真实性。在进行CFD模拟时,采用了八种稳态质量流量条件,以覆盖不同的生理状态。在构建数据集时,不仅包含了动脉瘤的几何形状和血流动力学参数,还包含了分割掩码,以支持多种不同的机器学习任务。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该研究构建了一个包含85,280个血流动力学数据的大规模动脉瘤数据集,数据基于427个真实动脉瘤几何形状,通过合成10,660个3D形状模拟动脉瘤演变。研究者还提供了一个流动参数估计基准,为后续研究提供了评估标准。该数据集为数据驱动的动脉瘤研究奠定了基础。

🎯 应用场景

该研究成果可应用于颅内动脉瘤的风险评估、诊断和治疗方案制定。通过训练高效的机器学习模型,医生可以快速预测动脉瘤的血流动力学参数,从而更好地评估动脉瘤的破裂风险,并制定个性化的治疗方案。此外,该数据集还可以促进生物流体、生物医学工程等领域的研究。

📄 摘要(原文)

Intracranial aneurysms (IAs) are serious cerebrovascular lesions found in approximately 5\% of the general population. Their rupture may lead to high mortality. Current methods for assessing IA risk focus on morphological and patient-specific factors, but the hemodynamic influences on IA development and rupture remain unclear. While accurate for hemodynamic studies, conventional computational fluid dynamics (CFD) methods are computationally intensive, hindering their deployment in large-scale or real-time clinical applications. To address this challenge, we curated a large-scale, high-fidelity aneurysm CFD dataset to facilitate the development of efficient machine learning algorithms for such applications. Based on 427 real aneurysm geometries, we synthesized 10,660 3D shapes via controlled deformation to simulate aneurysm evolution. The authenticity of these synthetic shapes was confirmed by neurosurgeons. CFD computations were performed on each shape under eight steady-state mass flow conditions, generating a total of 85,280 blood flow dynamics data covering key parameters. Furthermore, the dataset includes segmentation masks, which can support tasks that use images, point clouds or other multimodal data as input. Additionally, we introduced a benchmark for estimating flow parameters to assess current modeling methods. This dataset aims to advance aneurysm research and promote data-driven approaches in biofluids, biomedical engineering, and clinical risk assessment. The code and dataset are available at: https://github.com/Xigui-Li/Aneumo.