Artificial Intelligence Virtual Cells: From Measurements to Decisions across Modality, Scale, Dynamics, and Evaluation
作者: Chengpeng Hu, Calvin Yu-Chian Chen
分类: cs.AI
发布日期: 2025-10-14 (更新: 2025-12-02)
💡 一句话要点
提出基于Cell-State Latent的AI虚拟细胞框架,提升跨模态、尺度和干预的细胞状态建模能力。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 人工智能虚拟细胞 多模态学习 跨尺度建模 细胞状态建模 算子语法
📋 核心要点
- 现有AI虚拟细胞模型在跨数据集、实验室和平台上的泛化能力有限,且易受数据泄漏和覆盖偏差的影响。
- 论文提出Cell-State Latent (CSL)视角,通过算子语法组织学习,实现跨尺度耦合和干预建模。
- 设计决策对齐的评估蓝图,强调功能空间读数,并建议算子感知的数据设计和抗泄漏分区。
📝 摘要(中文)
人工智能虚拟细胞(AIVCs)旨在从多模态、多尺度的测量数据中学习可执行的、与决策相关的细胞状态模型。最近的研究引入了单细胞和空间基础模型,改进了跨模态对齐,扩展了扰动图谱,并探索了通路水平的读数。然而,尽管留出验证是标准做法,但评估主要还是在单个数据集和设置中进行;证据表明,跨实验室和平台的迁移通常受到限制,一些数据分割容易受到泄漏和覆盖偏差的影响,并且剂量、时间和组合效应尚未得到系统处理。跨尺度耦合也受到限制,因为连接分子、细胞和组织水平的锚点很少,并且与科学或临床读数的对齐在不同研究中有所不同。我们提出了一个与模型无关的细胞状态潜在(CSL)视角,该视角通过算子语法来组织学习:测量、用于跨尺度耦合的提升/投影以及用于剂量和调度的干预。这种观点激发了一个跨模态、尺度、上下文和干预的决策对齐评估蓝图,并强调功能空间读数,例如通路活动、空间邻域和临床相关终点。我们建议采用算子感知的数据设计、抗泄漏分区以及透明的校准和报告,以实现可重复的、同类比较。
🔬 方法详解
问题定义:现有AI虚拟细胞模型在跨模态、多尺度数据上的泛化能力不足,尤其是在不同实验室和平台之间迁移时表现不佳。此外,现有方法容易受到数据泄漏和覆盖偏差的影响,无法系统地处理剂量、时间和组合效应。这限制了模型在实际应用中的可靠性和有效性。
核心思路:论文的核心思路是引入Cell-State Latent (CSL)视角,将细胞状态的学习过程视为一个由算子语法驱动的过程。通过测量算子获取数据,利用提升/投影算子实现跨尺度耦合,并使用干预算子模拟剂量和调度。这种方法旨在建立一个更通用、更鲁棒的细胞状态模型,能够更好地适应不同的实验条件和数据集。
技术框架:该框架包含三个主要阶段:1) 测量:从多模态、多尺度的数据中获取细胞状态的初始表示。2) 提升/投影:利用跨尺度耦合算子,将不同尺度的信息进行整合,例如将分子水平的数据与细胞水平的数据关联起来。3) 干预:通过干预算子模拟不同的实验条件,例如不同的药物剂量和处理时间。整个框架的目标是学习一个能够准确预测细胞状态,并对干预措施做出合理响应的模型。
关键创新:最重要的技术创新点在于CSL视角和算子语法的引入。这种方法将细胞状态的学习过程形式化为一个可操作的过程,使得模型能够更好地理解和处理不同尺度和模态的数据。与现有方法相比,CSL视角更加通用和灵活,能够更好地适应不同的实验条件和数据集。
关键设计:论文建议采用算子感知的数据设计,即在数据收集和预处理过程中考虑到算子的影响。此外,论文还强调了抗泄漏分区的重要性,以避免模型在训练过程中过度拟合。在模型评估方面,论文提出了一个决策对齐的评估蓝图,强调功能空间读数,例如通路活动、空间邻域和临床相关终点。
🖼️ 关键图片
📊 实验亮点
论文提出了一个与模型无关的细胞状态潜在(CSL)视角,并设计了一个决策对齐的评估蓝图,强调功能空间读数。虽然论文没有给出具体的性能数据,但强调了该方法在跨模态、尺度、上下文和干预方面的优势,并建议采用算子感知的数据设计、抗泄漏分区以及透明的校准和报告,以实现可重复的比较。
🎯 应用场景
该研究成果可应用于药物研发、疾病诊断和个性化治疗等领域。通过构建更准确、更鲁棒的AI虚拟细胞模型,可以加速药物筛选过程,预测药物疗效,并为患者提供更精准的治疗方案。此外,该研究还有助于深入理解细胞状态的调控机制,为生物学研究提供新的工具和视角。
📄 摘要(原文)
Artificial Intelligence Virtual Cells (AIVCs) aim to learn executable, decision-relevant models of cell state from multimodal, multiscale measurements. Recent studies have introduced single-cell and spatial foundation models, improved cross-modality alignment, scaled perturbation atlases, and explored pathway-level readouts. Nevertheless, although held-out validation is standard practice, evaluations remain predominantly within single datasets and settings; evidence indicates that transport across laboratories and platforms is often limited, that some data splits are vulnerable to leakage and coverage bias, and that dose, time and combination effects are not yet systematically handled. Cross-scale coupling also remains constrained, as anchors linking molecular, cellular and tissue levels are sparse, and alignment to scientific or clinical readouts varies across studies. We propose a model-agnostic Cell-State Latent (CSL) perspective that organizes learning via an operator grammar: measurement, lift/project for cross-scale coupling, and intervention for dosing and scheduling. This view motivates a decision-aligned evaluation blueprint across modality, scale, context and intervention, and emphasizes function-space readouts such as pathway activity, spatial neighborhoods and clinically relevant endpoints. We recommend operator-aware data design, leakage-resistant partitions, and transparent calibration and reporting to enable reproducible, like-for-like comparisons.