A Gait Foundation Model Predicts Multi-System Health Phenotypes from 3D Skeletal Motion
作者: Adam Gabet, Sarah Kohn, Guy Lutsker, Shira Gelman, Anastasia Godneva, Gil Sasson, Arad Zulti, David Krongauz, Rotem Shaulitch, Assaf Rotem, Ohad Doron, Yuval Brodsky, Adina Weinberger, Eran Segal
分类: cs.AI, q-bio.QM
发布日期: 2026-03-26
备注: Preprint. Under review
💡 一句话要点
提出步态基础模型,通过3D骨骼运动预测多系统健康表型
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 步态分析 3D骨骼运动 健康表型预测 深度学习 基础模型
📋 核心要点
- 现有步态分析方法主要关注特定疾病的症状,缺乏将其作为全身性生物标志物的潜力。
- 本研究提出一种步态基础模型,通过学习3D骨骼运动的嵌入特征,实现对多种健康表型的预测。
- 实验结果表明,该模型在预测年龄、BMI、内脏脂肪面积等方面表现出色,并能独立预测多个身体系统的健康状况。
📝 摘要(中文)
步态正日益被认为是重要的生命体征,但现有方法通常将其视为特定病理的症状,而非全身性生物标志物。本研究开发了一个步态基础模型,利用深度相机记录的3414名成年人在五个运动任务中的3D骨骼运动数据进行训练。学习到的嵌入特征优于人工设计的特征,能够预测年龄(Pearson r = 0.69)、BMI(r = 0.90)和内脏脂肪面积(r = 0.82)。嵌入特征显著预测了3210个表型目标中的1980个;在校正年龄、BMI、VAT和身高后,步态在男性所有18个身体系统和女性18个中的17个系统中提供了独立的增益,并改善了临床诊断和药物使用的预测。解剖消融实验表明,腿部主导代谢和虚弱预测,而躯干编码睡眠和生活方式表型。这些发现确立了步态作为独立的全身生物信号的地位,推动了向消费级视频的转化及其作为可扩展的被动生命体征的整合。
🔬 方法详解
问题定义:现有步态分析方法通常将步态视为特定病理的症状,缺乏将其作为全身性生物标志物进行系统性研究的视角。这些方法依赖于人工设计的特征,难以捕捉步态中蕴含的复杂信息,限制了其在健康预测方面的潜力。
核心思路:本研究的核心思路是将步态视为一个全身性的生物信号,通过深度学习方法自动学习3D骨骼运动的嵌入特征,从而捕捉步态中蕴含的丰富信息。这种方法避免了人工特征设计的局限性,能够更全面地反映个体的健康状况。
技术框架:该研究的技术框架主要包括数据采集、模型训练和表型预测三个阶段。首先,利用深度相机记录大量成年人在不同运动任务中的3D骨骼运动数据。然后,使用这些数据训练一个步态基础模型,学习步态的嵌入特征。最后,利用学习到的嵌入特征预测个体的年龄、BMI、内脏脂肪面积等多种健康表型。
关键创新:该研究的关键创新在于提出了一个步态基础模型,能够自动学习3D骨骼运动的嵌入特征,并将其用于预测多种健康表型。与现有方法相比,该模型避免了人工特征设计的局限性,能够更全面地捕捉步态中蕴含的复杂信息。此外,该研究还通过解剖消融实验,揭示了不同身体部位在步态中的作用,为步态分析提供了新的视角。
关键设计:该研究使用了3414名成年人的3D骨骼运动数据进行模型训练,这些数据是在五个不同的运动任务中采集的。模型结构未知(论文未明确说明),但强调了学习到的嵌入特征的有效性。损失函数和优化算法未知,但目标是最小化预测误差,提高模型在各种健康表型预测任务中的性能。
📊 实验亮点
该研究表明,学习到的步态嵌入特征在预测年龄(Pearson r = 0.69)、BMI(r = 0.90)和内脏脂肪面积(r = 0.82)方面表现出色,优于人工设计的特征。在校正年龄、BMI、VAT和身高后,步态在男性所有18个身体系统和女性18个中的17个系统中提供了独立的增益,并改善了临床诊断和药物使用的预测。解剖消融实验揭示了腿部和躯干在不同健康表型预测中的作用。
🎯 应用场景
该研究成果可应用于远程健康监测、运动康复、老年人跌倒风险评估等领域。通过分析消费级视频中的步态信息,可以实现对个体健康状况的被动、可扩展的评估,有助于疾病的早期发现和预防,提高医疗效率和患者生活质量。未来,该技术有望集成到智能手机、智能穿戴设备等消费电子产品中,实现随时随地的健康监测。
📄 摘要(原文)
Gait is increasingly recognized as a vital sign, yet current approaches treat it as a symptom of specific pathologies rather than a systemic biomarker. We developed a gait foundation model for 3D skeletal motion from 3,414 deeply phenotyped adults, recorded via a depth camera during five motor tasks. Learned embeddings outperformed engineered features, predicting age (Pearson r = 0.69), BMI (r = 0.90), and visceral adipose tissue area (r = 0.82). Embeddings significantly predicted 1,980 of 3,210 phenotypic targets; after adjustment for age, BMI, VAT, and height, gait provided independent gains in all 18 body systems in males and 17 of 18 in females, and improved prediction of clinical diagnoses and medication use. Anatomical ablation revealed that legs dominated metabolic and frailty predictions while torso encoded sleep and lifestyle phenotypes. These findings establish gait as an independent multi-system biosignal, motivating translation to consumer-grade video and its integration as a scalable, passive vital sign.