PEaRL: Pathway-Enhanced Representation Learning for Gene and Pathway Expression Prediction from Histology

📄 arXiv: 2510.03455v1 📥 PDF

作者: Sejuti Majumder, Saarthak Kapse, Moinak Bhattacharya, Xuan Xu, Alisa Yurovsky, Prateek Prasanna

分类: cs.CV

发布日期: 2025-10-03


💡 一句话要点

PEaRL:通过通路增强表示学习,从组织学图像预测基因和通路表达

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 空间转录组学 组织病理学 多模态学习 通路分析 对比学习

📋 核心要点

  1. 现有方法依赖于少量高变异基因,限制了预测范围,忽略了塑造组织表型的协同生物学程序。
  2. PEaRL通过通路激活评分表示转录组学,利用Transformer编码通路信号,并通过对比学习对齐组织学特征。
  3. 实验结果表明,PEaRL在基因和通路水平的表达预测方面均优于现有方法,Pearson相关系数分别提高了高达58.9%和20.4%。

📝 摘要(中文)

本研究提出PEaRL(Pathway Enhanced Representation Learning),一个多模态框架,旨在整合组织病理学和空间转录组学,从而将组织形态与分子功能联系起来。PEaRL通过ssGSEA计算通路激活评分来表示转录组学信息。该方法利用Transformer编码生物学上一致的通路信号,并通过对比学习将其与组织学特征对齐,从而降低维度、提高可解释性并加强跨模态对应关系。在三个癌症空间转录组学数据集(乳腺癌、皮肤癌和淋巴结癌)上的实验结果表明,PEaRL始终优于现有方法,在基因和通路水平的表达预测方面均实现了更高的准确率(Pearson相关系数分别提高了高达58.9%和20.4%)。这些结果表明,将转录组表示建立在通路基础上,可以产生更具生物学意义且更易于解释的多模态模型,从而推动计算病理学超越基因水平的嵌入。

🔬 方法详解

问题定义:现有方法在整合组织病理学和空间转录组学时,主要依赖于少量高变异基因,这限制了预测范围,并且忽略了组织表型是由多个协同生物学通路共同决定的事实。因此,如何更有效地利用空间转录组数据,并将其与组织学图像信息融合,从而更准确地预测基因和通路表达,是一个重要的挑战。

核心思路:PEaRL的核心思路是将基因表达信息聚合到生物学通路层面,利用通路激活评分来表示转录组学数据。这样做的好处是,通路比单个基因更稳定,更能反映细胞的生物学状态,并且可以降低数据的维度,提高模型的可解释性。同时,通过对比学习,将通路表示与组织学图像特征对齐,从而建立跨模态的联系。

技术框架:PEaRL的整体框架包括以下几个主要模块:1) 使用ssGSEA算法计算每个样本的通路激活评分;2) 使用Transformer网络对通路激活评分进行编码,得到通路表示;3) 使用卷积神经网络(CNN)提取组织学图像的特征;4) 使用对比学习损失函数,将通路表示和组织学图像特征对齐;5) 使用对齐后的表示进行基因和通路表达预测。

关键创新:PEaRL最重要的创新点在于,它将转录组学数据表示为通路激活评分,而不是单个基因的表达水平。这种基于通路的表示方法,能够更好地捕捉细胞的生物学状态,并且可以降低数据的维度,提高模型的可解释性。此外,PEaRL还使用了对比学习,将通路表示和组织学图像特征对齐,从而建立跨模态的联系。

关键设计:在Transformer网络的设计上,论文采用了标准的Transformer编码器结构,并根据通路数量调整了输入维度。在对比学习损失函数的设计上,论文采用了InfoNCE损失函数,并设置了合适的温度参数。在训练过程中,论文使用了Adam优化器,并设置了合适的学习率和batch size。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

PEaRL在三个癌症空间转录组学数据集(乳腺癌、皮肤癌和淋巴结癌)上进行了评估,结果表明,PEaRL始终优于现有方法。在基因水平的表达预测方面,PEaRL的Pearson相关系数比现有最佳方法提高了高达58.9%。在通路水平的表达预测方面,PEaRL的Pearson相关系数比现有最佳方法提高了高达20.4%。这些结果表明,PEaRL能够更准确地预测基因和通路表达。

🎯 应用场景

PEaRL具有广泛的应用前景,可用于癌症诊断、预后预测和治疗方案选择。通过整合组织病理学和空间转录组学数据,PEaRL可以更准确地预测基因和通路表达,从而帮助医生更好地了解肿瘤的生物学特性,并制定更有效的治疗方案。此外,PEaRL还可以用于药物研发,例如,通过预测药物对特定通路的影响,筛选出潜在的候选药物。

📄 摘要(原文)

Integrating histopathology with spatial transcriptomics (ST) provides a powerful opportunity to link tissue morphology with molecular function. Yet most existing multimodal approaches rely on a small set of highly variable genes, which limits predictive scope and overlooks the coordinated biological programs that shape tissue phenotypes. We present PEaRL (Pathway Enhanced Representation Learning), a multimodal framework that represents transcriptomics through pathway activation scores computed with ssGSEA. By encoding biologically coherent pathway signals with a transformer and aligning them with histology features via contrastive learning, PEaRL reduces dimensionality, improves interpretability, and strengthens cross-modal correspondence. Across three cancer ST datasets (breast, skin, and lymph node), PEaRL consistently outperforms SOTA methods, yielding higher accuracy for both gene- and pathway-level expression prediction (up to 58.9 percent and 20.4 percent increase in Pearson correlation coefficient compared to SOTA). These results demonstrate that grounding transcriptomic representation in pathways produces more biologically faithful and interpretable multimodal models, advancing computational pathology beyond gene-level embeddings.