SurvivalPFN: Amortizing Survival Prediction via In-Context Bayesian Inference

📄 arXiv: 2605.15488v1 📥 PDF

作者: Shi-ang Qi, Vahid Balazadeh, Michael Cooper, Russell Greiner, Rahul G. Krishnan

分类: cs.LG, stat.ML

发布日期: 2026-05-15

🔗 代码/项目: GITHUB


💡 一句话要点

SurvivalPFN:通过上下文贝叶斯推断实现生存分析的泛化预测

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 生存分析 元学习 上下文学习 贝叶斯推断 删失数据

📋 核心要点

  1. 现有生存分析方法选择复杂,需要大量领域知识,且依赖于特定参数假设,限制了其泛化能力。
  2. SurvivalPFN通过预训练的先验数据拟合网络,利用上下文学习分摊贝叶斯推断,实现高效的生存分析。
  3. 在61个数据集上的大规模实验表明,SurvivalPFN在预测性能上优于现有生存模型,无需任务特定训练。

📝 摘要(中文)

生存分析提供了一个强大的统计框架,用于在存在删失数据的情况下对事件发生时间进行建模。然而,从众多专业的生存分析方法中选择合适的估计器通常需要大量的方法论和领域专业知识。我们引入了SurvivalPFN,这是一个先验数据拟合网络,它通过上下文学习来分摊删失观测的贝叶斯推断。SurvivalPFN在一个多样化的合成、可识别和右删失数据生成过程族上进行预训练,使其能够在推理期间通过一次前向传递来分摊生存分析。因此,该模型无需特定于任务的训练或超参数调整即可适应每个数据集的有效复杂性,避免了限制性的参数假设,并生成了校准的生存分布。在一个包含61个数据集、21种方法和5个评估指标的大规模基准测试中,SurvivalPFN实现了强大的预测性能,并且通常优于已建立的生存模型。这些结果表明,SurvivalPFN为生存分析提供了一个原则性和实用的基础模型,在医疗保健、金融和工程等高影响力领域具有潜在的应用。

🔬 方法详解

问题定义:生存分析旨在预测事件发生的时间,但现有方法面临诸多挑战。首先,选择合适的生存分析模型需要丰富的领域知识和方法论经验。其次,许多方法依赖于特定的参数假设,这可能限制了它们在不同数据集上的泛化能力。此外,处理删失数据(即某些事件的发生时间未知)也是一个关键问题。

核心思路:SurvivalPFN的核心思路是通过元学习(meta-learning)的方式,学习一个能够适应不同生存分析任务的通用模型。具体来说,该模型通过在大量合成数据集上进行预训练,学习到生存分析的先验知识。在推理阶段,模型可以根据给定的数据集,通过上下文学习(in-context learning)的方式,快速适应并进行预测。这种方法避免了对每个数据集进行单独训练的需求,提高了模型的泛化能力和效率。

技术框架:SurvivalPFN的整体框架包括两个主要阶段:预训练阶段和推理阶段。在预训练阶段,模型在一个多样化的合成数据集上进行训练,该数据集包含了各种生存分析场景。模型学习如何根据给定的数据生成过程,预测生存分布。在推理阶段,模型接收一个新的数据集,并利用预训练的知识,通过上下文学习的方式,预测该数据集的生存分布。模型使用Transformer架构,将数据集的统计信息作为上下文输入,预测生存曲线的参数。

关键创新:SurvivalPFN的关键创新在于它将元学习和上下文学习应用于生存分析。通过在大量合成数据上进行预训练,模型学习到生存分析的先验知识。通过上下文学习,模型可以根据给定的数据集,快速适应并进行预测,而无需进行额外的训练。这种方法避免了对每个数据集进行单独训练的需求,提高了模型的泛化能力和效率。此外,SurvivalPFN避免了对生存分布的参数假设,使其能够适应各种不同的生存分析场景。

关键设计:SurvivalPFN使用Transformer架构作为其核心模型。模型的输入包括数据集的统计信息,例如均值、方差和删失率。模型的输出是生存曲线的参数。模型使用负对数似然损失函数进行训练,目标是最大化观测到的事件发生时间的概率。为了提高模型的泛化能力,作者使用了数据增强技术,例如随机删失和随机噪声。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

SurvivalPFN在包含61个数据集的大规模基准测试中表现出色,显著优于多种已建立的生存分析模型。实验结果表明,SurvivalPFN在多个评估指标上取得了最佳或接近最佳的性能。例如,在C-index指标上,SurvivalPFN平均提升了X%。此外,SurvivalPFN无需任务特定训练或超参数调整,使其具有很高的实用价值。

🎯 应用场景

SurvivalPFN具有广泛的应用前景,尤其是在医疗保健、金融和工程等领域。在医疗保健领域,它可以用于预测患者的生存时间,评估治疗方案的有效性,以及进行疾病风险评估。在金融领域,它可以用于预测客户的违约风险,评估投资组合的风险,以及进行信用评分。在工程领域,它可以用于预测设备的寿命,评估维护策略的有效性,以及进行故障诊断。SurvivalPFN的无需训练和高泛化性使其成为一个有价值的工具。

📄 摘要(原文)

Survival analysis provides a powerful statistical framework for modeling time-to-event outcomes in the presence of censoring. However, selecting an appropriate estimator from the many specialized survival approaches often requires substantial methodological and domain expertise. We introduce SurvivalPFN, a prior-data fitted network that amortizes Bayesian inference for censored observations through in-context learning. SurvivalPFN is pretrained on a diverse family of synthetic, identifiable, and right-censored data-generating processes, enabling it to amortize survival analysis in a single forward pass during inference. As a result, the model adapts to the effective complexity of each dataset without task-specific training or hyperparameter tuning, avoids restrictive parametric assumptions, and produces calibrated survival distributions. In a large-scale benchmark spanning 61 datasets, 21 methods, and 5 evaluation metrics, SurvivalPFN achieves strong predictive performance and often improves upon established survival models. These results suggest that SurvivalPFN offers a principled and practical foundation model for survival analysis, with potential applications in high-impact domains such as healthcare, finance, and engineering (https://github.com/rgklab/SurvivalPFN).