Simulating clinical interventions with a generative multimodal model of human physiology

📄 arXiv: 2604.27899v1 📥 PDF

作者: Guy Lutsker, Gal Sapir, Jordi Merino, Smadar Shilo, Anastasia Godneva, Eli Meirom, Shie Mannor, Hagai Rossman, Gal Chechik, Eran Segal

分类: cs.AI

发布日期: 2026-04-30


💡 一句话要点

HealthFormer:基于Transformer的生成式多模态模型,用于模拟临床干预和预测生理轨迹。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多模态建模 生理轨迹预测 临床干预模拟 Transformer模型 健康世界模型

📋 核心要点

  1. 现有方法难以准确预测个体对不同临床干预的反应,以及健康随时间的变化。
  2. HealthFormer通过训练一个生成式Transformer模型,学习人体生理轨迹的潜在模式,从而模拟干预效果。
  3. 实验表明,HealthFormer在预测疾病风险和模拟干预效果方面优于现有方法,并在多个独立队列中验证了其有效性。

📝 摘要(中文)

本文提出了一种名为HealthFormer的decoder-only Transformer模型,用于生成式地建模人体生理轨迹。该模型基于包含超过15000名深度表型个体的人类表型项目数据进行训练。HealthFormer将每个参与者的健康轨迹token化为667个跨越七个领域的测量值,包括血液生物标志物、身体成分、睡眠生理学、连续血糖监测、肠道微生物组、可穿戴设备生理学以及行为和药物暴露。HealthFormer被训练来预测个体生理轨迹,并能将一系列临床相关任务表达为对模型的查询,而无需特定任务的训练。实验表明,HealthFormer在四个独立队列中表现出良好的泛化能力,并在30个事件疾病和死亡终点中的27个上提高了预测性能,优于已建立的临床风险评分。此外,该模型能够模拟体外干预,例如在个性化营养试验中,干预条件下的预测能够恢复个体六个月的生物标志物变化(例如,舒张压的Pearson r = 0.78)。在来自已发表试验的41个随机干预-结果比较中,预测效果方向一致,且预测均值在30个案例中落在报告的95%置信区间内。HealthFormer被定位为一个初始的健康世界模型,可用于预测、风险分层和干预条件下的模拟,为临床数字孪生提供基础。

🔬 方法详解

问题定义:现有方法难以准确预测个体对临床干预的反应,也难以捕捉个体健康随时间变化的复杂性。传统的临床风险评分和预测模型往往依赖于有限的特征,并且缺乏对个体生理轨迹的动态建模能力。因此,需要一种能够整合多模态数据并模拟干预效果的模型,以实现更精准的个性化医疗。

核心思路:HealthFormer的核心思路是利用Transformer模型的强大建模能力,学习人体生理轨迹的潜在模式。通过将个体的多模态健康数据表示为token序列,并训练模型预测未来的生理状态,HealthFormer能够捕捉个体生理轨迹的动态变化,并模拟不同干预措施对健康的影响。这种生成式建模方法允许将各种临床任务表达为对模型的查询,从而实现灵活的预测和模拟。

技术框架:HealthFormer采用decoder-only Transformer架构,以自回归的方式预测个体的生理轨迹。模型的输入是token化的多模态健康数据,包括血液生物标志物、身体成分、睡眠生理学、连续血糖监测、肠道微生物组、可穿戴设备生理学以及行为和药物暴露。模型通过多层Transformer解码器处理输入序列,并预测下一个时间步的生理状态。在训练过程中,模型采用负对数似然损失函数,以最大化观测数据的概率。

关键创新:HealthFormer的关键创新在于其生成式多模态建模方法,能够整合来自不同领域的健康数据,并学习个体生理轨迹的动态变化。与传统的判别式模型相比,HealthFormer能够更灵活地适应不同的临床任务,例如预测疾病风险、模拟干预效果等。此外,HealthFormer还采用了token化的数据表示方法,能够有效地处理不同类型和尺度的健康数据。

关键设计:HealthFormer的关键设计包括:1) 使用decoder-only Transformer架构,以自回归的方式预测生理轨迹;2) 采用token化的数据表示方法,将多模态健康数据转换为模型可处理的序列;3) 使用负对数似然损失函数,训练模型最大化观测数据的概率;4) 在训练过程中,采用数据增强技术,例如随机掩码和时间扭曲,以提高模型的泛化能力。

📊 实验亮点

HealthFormer在四个独立队列中表现出良好的泛化能力,并在30个事件疾病和死亡终点中的27个上提高了预测性能,优于已建立的临床风险评分。在个性化营养试验中,干预条件下的预测能够恢复个体六个月的生物标志物变化(例如,舒张压的Pearson r = 0.78)。在来自已发表试验的41个随机干预-结果比较中,预测效果方向一致,且预测均值在30个案例中落在报告的95%置信区间内。

🎯 应用场景

HealthFormer具有广泛的应用前景,可用于个性化医疗、药物研发和临床试验设计。通过模拟不同干预措施对个体健康的影响,HealthFormer可以帮助医生制定更精准的治疗方案。此外,HealthFormer还可以用于预测疾病风险,提前发现潜在的健康问题。在药物研发方面,HealthFormer可以用于筛选候选药物,并预测药物的疗效和副作用。在临床试验设计方面,HealthFormer可以用于优化试验方案,提高试验效率。

📄 摘要(原文)

Understanding how human health changes over time, and why responses to interventions vary between individuals, remains a central challenge in medicine. Here we present HealthFormer, a decoder-only transformer that models the human physiological trajectory generatively, by training on data from the Human Phenotype Project, a multi-visit cohort of over 15,000 deeply phenotyped individuals. We tokenise each participant's health trajectory across 667 measurements spanning seven domains: blood biomarkers, body composition, sleep physiology, continuous glucose monitoring, gut microbiome, wearable-derived physiology, and behaviour and medication exposure. We train HealthFormer to forecast individual physiological trajectories across these domains, and from this single generative objective a range of clinically relevant tasks can be expressed as queries on the model. We show that, without task-specific training, HealthFormer transfers to four independent cohorts and improves prediction for 27 of 30 incident-disease and mortality endpoints, exceeding established clinical risk scores in every comparison. We further show that the model can simulate interventions in silico: in a held-out personalised-nutrition trial, intervention-conditioned predictions recover individual six-month biomarker changes (e.g., Pearson r = 0.78 for diastolic blood pressure). Across 41 randomised intervention-outcome comparisons drawn from published trials, our results show that the predicted direction of effect agrees in every case, and the predicted mean falls within the reported 95% confidence interval in 30 cases. We position HealthFormer as an initial health world model, from which forecasting, risk stratification, and intervention-conditioned simulation arise as queries, providing a basis for clinical digital twins.