Staying Alive: Uncensored Survival Analysis with Tabular Foundation Models
作者: Mariana Vargas Vieyra
分类: cs.LG, cs.AI
发布日期: 2026-06-02
💡 一句话要点
提出无训练生存回归方法以解决右删失问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 生存分析 右删失 表格基础模型 加速失效时间 非参数估计 医疗预测 客户流失
📋 核心要点
- 现有生存分析方法在处理右删失数据时面临挑战,尤其是需要进行复杂的参数拟合。
- 本文提出了一种无训练的生存回归方法,利用表格基础模型进行事件时间预测和右删失数据的插补。
- 实验结果显示,该方法在标准生存分析基准上与传统的生存回归模型相比表现出色,具有较高的竞争力。
📝 摘要(中文)
生存分析(SA)是一种统计框架,用于建模某事件发生的时间跨度。该方法广泛应用于医疗和客户流失预测等领域,但面临的主要挑战是事件时间的部分观测或右删失。近年来,表格基础模型(TFM)因其在单次前向传播中进行预测的能力而受到关注。然而,TFM在时间到事件数据的预测任务中的应用仍然困难。本文提出了一种无训练的生存回归方法,利用TFM预测事件时间并迭代插补右删失数据。我们的方法构建了一个加速失效时间(AFT)模型,仅需拟合一个标量参数。基于Buckley-James估计量,我们引入了一种非参数的上下文估计器来处理右删失数据。实验结果表明,我们的方法在标准生存分析基准上与多种需要训练的参数和半参数生存回归模型具有竞争力。
🔬 方法详解
问题定义:本文旨在解决生存分析中右删失数据的处理问题。现有方法通常需要复杂的参数拟合,限制了其在实际应用中的灵活性和效率。
核心思路:我们提出了一种无训练的生存回归方法,通过表格基础模型(TFM)来预测事件时间,并迭代插补右删失数据,从而简化了模型的训练过程。
技术框架:整体架构包括两个主要模块:首先,使用TFM构建加速失效时间(AFT)模型,仅需拟合一个标量参数;其次,基于Buckley-James估计量,设计非参数上下文估计器来处理右删失数据。
关键创新:本文的主要创新在于提出了一种无需训练的生存回归方法,利用TFM的特性来简化模型构建过程,与传统需要复杂训练的生存回归模型相比,显著提高了效率。
关键设计:在模型设计中,关键参数设置为一个标量,损失函数采用了适应性设计,以确保对右删失数据的有效处理。
🖼️ 关键图片
📊 实验亮点
实验结果表明,本文提出的方法在标准生存分析基准上表现出色,与多种传统的生存回归模型(如Cox回归和参数AFT模型)相比,具有相似甚至更优的性能,展示了在处理右删失数据时的有效性和竞争力。
🎯 应用场景
该研究的潜在应用领域包括医疗健康、客户流失预测以及金融风险评估等。通过提供一种高效的生存分析方法,能够帮助相关领域的研究人员和从业者更好地处理右删失数据,提升预测准确性和决策能力。未来,该方法有望在更多实际场景中得到应用,推动生存分析技术的发展。
📄 摘要(原文)
Survival Analysis (SA) is a statistical framework that models the time span until some event of interest occurs. Widely used in several domains, including healthcare and churn prediction, a central challenge in its applicability stems from the time of the event being partially observed or \emph{right-censoring}. Tabular Foundation Models (TFM) have attracted significant interest in recent years due to their ability to perform prediction tasks in a single forward pass, requiring no dataset-specific parameter fitting. Despite their success, their application to prediction tasks on time-to-event data remains difficult due to right censoring. In this work, we present a training-free method to survival regression by leveraging TFMs to both predict the time of the event and iteratively impute right-censored data. Our method uses a TFM to construct an Accelerated Failure Time (AFT) model requiring no training beyond fitting a single scalar parameter. Subsequently, by building on the Buckley-James estimator, we introduce a non-parametric in-context estimator for right-censored data. Our experiments on standard survival analysis benchmarks show that our method is competitive with several parametric and semi-parametric survival regression models that require training, including Cox regression and parametric AFT models.