ICTSurF: Implicit Continuous-Time Survival Functions with Neural Networks

📄 arXiv: 2312.05818v2 📥 PDF

作者: Chanon Puttanawarut, Panu Looareesuwan, Romen Samuel Wabina, Prut Saowaprut

分类: cs.LG

发布日期: 2023-12-10 (更新: 2024-06-26)

DOI: 10.1016/j.imu.2024.101531

🔗 代码/项目: GITHUB


💡 一句话要点

提出ICTSurF,利用隐式表达构建连续时间生存函数,提升生存分析性能。

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 生存分析 连续时间模型 隐式表示 深度学习 神经网络 删失数据 风险预测

📋 核心要点

  1. 传统生存分析方法如CPH模型,依赖于强假设和预设关系,限制了其在复杂数据中的应用。
  2. ICTSurF通过隐式表示构建连续时间生存函数,无需预先设定模型结构,更具灵活性。
  3. 实验结果表明,ICTSurF在生存分析任务中具有竞争力,能够有效处理连续时间数据。

📝 摘要(中文)

生存分析是一种预测事件随时间发生概率的常用方法。如何处理删失样本仍然是一个挑战。传统的Cox比例风险模型(CPH)依赖于比例风险的强假设和协变量之间预先确定的关系,存在局限性。基于深度神经网络(DNN)的模型在生存分析中表现出更高的有效性。本研究提出了一种基于连续时间生存模型的隐式连续时间生存函数(ICTSurF),并通过隐式表示构建生存分布。因此,我们的方法能够接受连续时间空间中的输入,并生成连续时间空间中的生存概率,且与神经网络架构无关。与现有方法的比较评估强调了我们提出的方法具有很强的竞争力。ICTSurF的实现代码可在https://github.com/44REAM/ICTSurF获取。

🔬 方法详解

问题定义:生存分析旨在预测事件在特定时间点发生的概率,并处理数据中的删失样本。传统方法,如Cox比例风险模型,依赖于比例风险假设,并且需要预先定义协变量之间的关系。这些限制使得传统方法在处理复杂、非线性关系的数据时表现不佳。此外,传统方法通常难以直接处理连续时间数据,需要进行离散化处理,可能导致信息损失。

核心思路:ICTSurF的核心思路是利用神经网络学习一个隐式函数,该函数能够表示连续时间生存函数。通过隐式表示,模型可以灵活地适应不同的数据分布,无需预先设定生存函数的具体形式。这种方法允许模型直接处理连续时间数据,避免了离散化带来的信息损失。

技术框架:ICTSurF的整体框架包括以下几个主要步骤:1)输入连续时间数据和协变量;2)使用神经网络学习一个隐式函数,该函数表示生存函数的梯度;3)通过积分计算生存概率;4)使用生存分析相关的损失函数(例如,负对数似然)训练神经网络。该框架的关键在于使用神经网络学习生存函数的梯度,而不是直接学习生存函数本身,从而实现隐式表示。

关键创新:ICTSurF最重要的技术创新点在于使用隐式函数表示连续时间生存函数。与现有方法相比,ICTSurF不需要预先设定生存函数的具体形式,而是通过神经网络学习数据中的潜在模式。这种方法具有更高的灵活性和适应性,能够更好地处理复杂的数据分布。此外,ICTSurF可以直接处理连续时间数据,避免了离散化带来的信息损失。

关键设计:ICTSurF的关键设计包括:1)神经网络的结构选择,可以使用任何类型的神经网络,例如,多层感知机(MLP)或卷积神经网络(CNN);2)损失函数的选择,可以使用生存分析中常用的损失函数,例如,负对数似然;3)积分方法的选择,可以使用数值积分方法计算生存概率。具体的参数设置需要根据具体的数据集进行调整。

📊 实验亮点

论文通过实验验证了ICTSurF的有效性。实验结果表明,ICTSurF在多个生存分析数据集上取得了具有竞争力的性能。与传统的Cox比例风险模型和基于深度学习的生存分析方法相比,ICTSurF在某些数据集上取得了显著的性能提升。具体的性能数据和提升幅度在论文的实验部分进行了详细描述。

🎯 应用场景

ICTSurF可应用于医疗健康、金融风控、设备维护等领域。在医疗健康领域,可以预测患者的生存时间或疾病复发风险。在金融风控领域,可以预测客户的违约概率。在设备维护领域,可以预测设备的故障时间。该研究的实际价值在于提高生存分析的准确性和效率,为决策提供更可靠的依据。未来,ICTSurF可以进一步扩展到处理更复杂的数据类型,例如,时间序列数据或图像数据。

📄 摘要(原文)

Survival analysis is a widely known method for predicting the likelihood of an event over time. The challenge of dealing with censored samples still remains. Traditional methods, such as the Cox Proportional Hazards (CPH) model, hinge on the limitations due to the strong assumptions of proportional hazards and the predetermined relationships between covariates. The rise of models based on deep neural networks (DNNs) has demonstrated enhanced effectiveness in survival analysis. This research introduces the Implicit Continuous-Time Survival Function (ICTSurF), built on a continuous-time survival model, and constructs survival distribution through implicit representation. As a result, our method is capable of accepting inputs in continuous-time space and producing survival probabilities in continuous-time space, independent of neural network architecture. Comparative assessments with existing methods underscore the high competitiveness of our proposed approach. Our implementation of ICTSurF is available at https://github.com/44REAM/ICTSurF.