Simulating clinical interventions with a generative multimodal model of human physiology

作者: Guy Lutsker, Gal Sapir, Jordi Merino, Smadar Shilo, Anastasia Godneva, Eli Meirom, Shie Mannor, Hagai Rossman, Gal Chechik, Eran Segal

分类: cs.AI

发布日期: 2026-04-30

💡 一句话要点

HealthFormer：基于Transformer的生成式多模态模型，用于模拟临床干预和预测生理轨迹。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多模态建模 生理轨迹预测 临床干预模拟 Transformer模型 健康世界模型

📋 核心要点

现有方法难以准确预测个体对不同临床干预的反应，以及健康随时间的变化。
HealthFormer通过训练一个生成式Transformer模型，学习人体生理轨迹的潜在模式，从而模拟干预效果。
实验表明，HealthFormer在预测疾病风险和模拟干预效果方面优于现有方法，并在多个独立队列中验证了其有效性。

📝 摘要（中文）

本文提出了一种名为HealthFormer的decoder-only Transformer模型，用于生成式地建模人体生理轨迹。该模型基于包含超过15000名深度表型个体的人类表型项目数据进行训练。HealthFormer将每个参与者的健康轨迹token化为667个跨越七个领域的测量值，包括血液生物标志物、身体成分、睡眠生理学、连续血糖监测、肠道微生物组、可穿戴设备生理学以及行为和药物暴露。HealthFormer被训练来预测个体生理轨迹，并能将一系列临床相关任务表达为对模型的查询，而无需特定任务的训练。实验表明，HealthFormer在四个独立队列中表现出良好的泛化能力，并在30个事件疾病和死亡终点中的27个上提高了预测性能，优于已建立的临床风险评分。此外，该模型能够模拟体外干预，例如在个性化营养试验中，干预条件下的预测能够恢复个体六个月的生物标志物变化（例如，舒张压的Pearson r = 0.78）。在来自已发表试验的41个随机干预-结果比较中，预测效果方向一致，且预测均值在30个案例中落在报告的95%置信区间内。HealthFormer被定位为一个初始的健康世界模型，可用于预测、风险分层和干预条件下的模拟，为临床数字孪生提供基础。

🔬 方法详解

问题定义：现有方法难以准确预测个体对临床干预的反应，也难以捕捉个体健康随时间变化的复杂性。传统的临床风险评分和预测模型往往依赖于有限的特征，并且缺乏对个体生理轨迹的动态建模能力。因此，需要一种能够整合多模态数据并模拟干预效果的模型，以实现更精准的个性化医疗。

核心思路：HealthFormer的核心思路是利用Transformer模型的强大建模能力，学习人体生理轨迹的潜在模式。通过将个体的多模态健康数据表示为token序列，并训练模型预测未来的生理状态，HealthFormer能够捕捉个体生理轨迹的动态变化，并模拟不同干预措施对健康的影响。这种生成式建模方法允许将各种临床任务表达为对模型的查询，从而实现灵活的预测和模拟。

技术框架：HealthFormer采用decoder-only Transformer架构，以自回归的方式预测个体的生理轨迹。模型的输入是token化的多模态健康数据，包括血液生物标志物、身体成分、睡眠生理学、连续血糖监测、肠道微生物组、可穿戴设备生理学以及行为和药物暴露。模型通过多层Transformer解码器处理输入序列，并预测下一个时间步的生理状态。在训练过程中，模型采用负对数似然损失函数，以最大化观测数据的概率。

关键创新：HealthFormer的关键创新在于其生成式多模态建模方法，能够整合来自不同领域的健康数据，并学习个体生理轨迹的动态变化。与传统的判别式模型相比，HealthFormer能够更灵活地适应不同的临床任务，例如预测疾病风险、模拟干预效果等。此外，HealthFormer还采用了token化的数据表示方法，能够有效地处理不同类型和尺度的健康数据。

关键设计：HealthFormer的关键设计包括：1) 使用decoder-only Transformer架构，以自回归的方式预测生理轨迹；2) 采用token化的数据表示方法，将多模态健康数据转换为模型可处理的序列；3) 使用负对数似然损失函数，训练模型最大化观测数据的概率；4) 在训练过程中，采用数据增强技术，例如随机掩码和时间扭曲，以提高模型的泛化能力。

📊 实验亮点

HealthFormer在四个独立队列中表现出良好的泛化能力，并在30个事件疾病和死亡终点中的27个上提高了预测性能，优于已建立的临床风险评分。在个性化营养试验中，干预条件下的预测能够恢复个体六个月的生物标志物变化（例如，舒张压的Pearson r = 0.78）。在来自已发表试验的41个随机干预-结果比较中，预测效果方向一致，且预测均值在30个案例中落在报告的95%置信区间内。

🎯 应用场景

HealthFormer具有广泛的应用前景，可用于个性化医疗、药物研发和临床试验设计。通过模拟不同干预措施对个体健康的影响，HealthFormer可以帮助医生制定更精准的治疗方案。此外，HealthFormer还可以用于预测疾病风险，提前发现潜在的健康问题。在药物研发方面，HealthFormer可以用于筛选候选药物，并预测药物的疗效和副作用。在临床试验设计方面，HealthFormer可以用于优化试验方案，提高试验效率。

📄 摘要（原文）

Understanding how human health changes over time, and why responses to interventions vary between individuals, remains a central challenge in medicine. Here we present HealthFormer, a decoder-only transformer that models the human physiological trajectory generatively, by training on data from the Human Phenotype Project, a multi-visit cohort of over 15,000 deeply phenotyped individuals. We tokenise each participant's health trajectory across 667 measurements spanning seven domains: blood biomarkers, body composition, sleep physiology, continuous glucose monitoring, gut microbiome, wearable-derived physiology, and behaviour and medication exposure. We train HealthFormer to forecast individual physiological trajectories across these domains, and from this single generative objective a range of clinically relevant tasks can be expressed as queries on the model. We show that, without task-specific training, HealthFormer transfers to four independent cohorts and improves prediction for 27 of 30 incident-disease and mortality endpoints, exceeding established clinical risk scores in every comparison. We further show that the model can simulate interventions in silico: in a held-out personalised-nutrition trial, intervention-conditioned predictions recover individual six-month biomarker changes (e.g., Pearson r = 0.78 for diastolic blood pressure). Across 41 randomised intervention-outcome comparisons drawn from published trials, our results show that the predicted direction of effect agrees in every case, and the predicted mean falls within the reported 95% confidence interval in 30 cases. We position HealthFormer as an initial health world model, from which forecasting, risk stratification, and intervention-conditioned simulation arise as queries, providing a basis for clinical digital twins.

Simulating clinical interventions with a generative multimodal model of human physiology

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理