From Snapshots to Trajectories: Learning Single-Cell Gene Expression Dynamics via Conditional Flow Matching

📄 arXiv: 2605.22340v1 📥 PDF

作者: Siyu Pu, Qingqing Long, Xiaohan Huang, Haotian Chen, Jiajia Wang, Meng Xiao, Xiao Luo, Hengshu Zhu, Yuanchun Zhou, Xuezhi Wang

分类: cs.LG

发布日期: 2026-05-21


💡 一句话要点

提出scFM,通过条件流匹配学习单细胞基因表达动态,解决时间序列数据缺失问题。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 单细胞RNA测序 轨迹推断 条件流匹配 最优传输 生成模型

📋 核心要点

  1. 现有单细胞轨迹推断方法在处理非配对快照数据时,面临局部转换模糊和长程预测漂移的挑战。
  2. scFM通过耦合条件流匹配,学习时间依赖的速度场,并利用双向速度场一致性优化轨迹。
  3. 实验表明,scFM在时间插值和外推中提高了分布预测性能,并实现了更准确的轨迹重建。

📝 摘要(中文)

单细胞RNA测序(scRNA-seq)提供细胞状态的高维图谱,从而能够对细胞动态进行数据驱动建模。然而,实际中时间分辨的scRNA-seq数据仅在少数离散时间点收集,造成显著的时间间隔。这促使人们对未测量时间点的轨迹进行推断。现有方法主要分为两类:最优传输(OT)对齐提供观测快照之间的分布级匹配,而连续时间生成模型支持通过学习到的动态进行预测。然而,仍然存在两个挑战:(i)不成对的快照使得相邻时间点之间的局部转换不明确,导致不稳定的监督;(ii)长程预测依赖于重复积分,其中小的建模误差会累积并导致分布漂移。为了应对这些挑战,我们提出了单细胞流匹配(scFM),这是一个基于耦合条件流匹配的潜在生成框架。首先,我们计算相邻快照之间的熵正则化OT耦合,并使用它们来构建软的、加权的流匹配目标,以学习时间相关的速度场。其次,我们学习双向速度场,并利用它们的一致性来细化耦合,并在稀疏监督下提高时间连贯性。第三,我们引入分布级对齐和潜在动态正则化来锚定长程展开并减轻漂移。在真实世界的时间序列scRNA-seq数据集上的实验表明,scFM始终提高了时间插值和外推的分布预测性能。此外,scFM产生了更准确的轨迹重建和时间连贯的可视化,其中中间时间点缺失,表明更忠实地恢复了潜在的时间基因表达动态。

🔬 方法详解

问题定义:论文旨在解决单细胞RNA测序数据中,由于时间点采样稀疏和数据非配对,导致难以准确推断细胞基因表达随时间变化的动态轨迹的问题。现有方法,如基于最优传输的对齐和连续时间生成模型,在处理非配对快照时,局部转换信息不足,监督信号不稳定;进行长程预测时,误差累积导致分布漂移,影响预测精度。

核心思路:论文的核心思路是利用条件流匹配学习时间依赖的速度场,并结合双向速度场的一致性约束,来提高轨迹推断的准确性和鲁棒性。通过构建软的、加权的流匹配目标,利用相邻快照之间的最优传输耦合关系,为学习速度场提供更稳定的监督信号。同时,利用双向速度场的一致性来细化耦合,并在稀疏监督下提高时间连贯性。

技术框架:scFM的整体框架包含以下几个主要阶段:1) 计算相邻时间点快照之间的熵正则化最优传输(OT)耦合;2) 基于OT耦合构建软的、加权的流匹配目标,用于学习时间依赖的速度场;3) 学习双向速度场,并利用它们的一致性来细化OT耦合;4) 引入分布级对齐和潜在动态正则化,以锚定长程展开并减轻分布漂移。

关键创新:论文的关键创新在于:1) 提出了一种基于耦合条件流匹配的单细胞轨迹推断框架,能够有效处理非配对快照数据;2) 利用双向速度场的一致性来细化OT耦合,提高时间连贯性;3) 引入分布级对齐和潜在动态正则化,减轻长程预测中的分布漂移。与现有方法相比,scFM能够更准确地恢复潜在的时间基因表达动态。

关键设计:论文的关键设计包括:1) 使用熵正则化的最优传输来计算快照之间的耦合关系,提供更平滑的监督信号;2) 设计了双向速度场,并利用其一致性作为正则化项,提高模型的鲁棒性;3) 引入分布级对齐损失,鼓励模型生成的轨迹与真实数据分布对齐;4) 使用潜在动态正则化,约束潜在空间的动态变化,防止模型过度拟合。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,scFM在真实世界的时间序列scRNA-seq数据集上,显著提高了时间插值和外推的分布预测性能。与现有方法相比,scFM能够产生更准确的轨迹重建和时间连贯的可视化,表明其能够更忠实地恢复潜在的时间基因表达动态。具体性能提升数据未知。

🎯 应用场景

该研究成果可应用于单细胞生物学领域,例如细胞命运决定、疾病发生发展机制研究、药物响应预测等。通过更准确地推断细胞轨迹,可以深入理解细胞状态随时间的变化规律,为相关疾病的诊断和治疗提供新的思路和方法。此外,该方法还可以推广到其他时间序列数据分析领域。

📄 摘要(原文)

Single-cell RNA sequencing (scRNA-seq) provides high-dimensional profiles of cellular states, enabling data-driven modeling of cellular dynamics over time. In practice, time-resolved scRNA-seq is collected at only a few discrete time points as unpaired snapshot populations, leaving substantial temporal gaps. This motivates trajectory inference at unmeasured time points. Existing methods mainly follow two directions, optimal-transport (OT) alignment provides distribution-level matching between observed snapshots, while continuous-time generative models support forecasting via learned dynamics. However, two challenges remain: (i) unpaired snapshots render local transitions between adjacent time points ambiguous, leading to unstable supervision; and (ii) long-horizon prediction relies on repeated integration, where small modeling errors compound and cause distribution drift. To address these challenges, we propose single-cell Flow Matching (scFM), a latent generative framework based on coupling-conditioned flow matching. First, we compute entropically regularized OT couplings between adjacent snapshots and use them to construct soft, weighted flow-matching targets for learning time-dependent velocity fields. Second, we learn bidirectional velocity fields and leverage their consistency to refine couplings and improve temporal coherence under sparse supervision. Third, we introduce distribution-level alignment and latent dynamic regularization to anchor long rollouts and mitigate drift. Experiments on real-world time-series scRNA-seq datasets show that scFM consistently improves distributional prediction performance for both temporal interpolation and extrapolation. Moreover, scFM yields more accurate trajectory reconstruction and temporally coherent visualizations where intermediate time points are absent, indicating a more faithful recovery of underlying temporal gene expression dynamics.