Towards a General Intelligence and Interface for Wearable Health Data

📄 arXiv: 2605.22759v1 📥 PDF

作者: Girish Narayanswamy, Maxwell A. Xu, A. Ali Heydari, Samy Abdel-Ghaffar, Marius Guerard, Kara Vaillancourt, Zhihan Zhang, Jake Garrison, Levi Albuquerque, Dimitris Spathis, Hong Yu, Hamid Palangi, Xuhai "Orson" Xu, David G. T. Barrett, Joseph Breda, Jed McGiffin, Yubin Kim, Yuwei Zhang, Naghmeh Rezaei, Samuel Solomon, Karan Ahuja, Tim Althoff, Jake Sunshine, Ming-Zher Poh, Benjamin Yetton, Ari Winbush, Nicholas B. Allen, James M. Rehg, Isaac Galatzer-Levy, Yun Liu, John Hernandez, Anupam Pathak, Conor Heneghan, Yuzhe Yang, Ahmed A. Metwally, Pushmeet Kohli, Mark Malhotra, Shwetak Patel, Xin Liu, Daniel McDuff

分类: cs.AI

发布日期: 2026-05-21


💡 一句话要点

提出可穿戴健康数据通用智能接口,通过大规模预训练实现个性化健康洞察。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 可穿戴设备 健康数据 预训练模型 通用智能 个性化健康 LLM代理 少样本学习

📋 核心要点

  1. 现有方法难以将可穿戴传感器数据转化为个性化健康洞察,面临表型多样性和数据标注稀缺的挑战。
  2. 论文提出一种基于大规模无标签可穿戴数据的预训练基础模型,学习通用的健康表征。
  3. 实验表明,该模型在多种健康预测任务上表现出显著提升,并支持少样本学习和生成能力。

📝 摘要(中文)

本文提出了一种可穿戴健康的基础模型,旨在将无处不在的可穿戴传感器捕获的行为和生理信息转化为个性化的健康洞察。由于表型多样性以及个体基线健康、生理和生活方式因素的差异,将低级传感器数据转换为能够表征高级状态的表示形式非常困难。此外,收集与健康结果注释配对的可穿戴数据既费力又昂贵,回顾性注释在实践中仍然不可行,导致高质量标签的数据稀缺。为了克服这些限制,该模型在来自五百万参与者的大型队列中提取的超过一万亿分钟的未标记传感器信号上进行了预训练。实验表明,模型容量和预训练数据量的联合扩展可系统地提高性能,在涵盖心血管、代谢、睡眠和心理健康以及生活方式选择和人口统计因素的35项健康预测任务中得到了验证。该模型还实现了标签高效的少样本学习和生成能力,用于稳健的日常指标估计。此外,利用LLM代理自主搜索基于模型嵌入构建的下游预测头,进一步提高了性能。最后,将这些下游预测器集成到个人健康代理中,可以支持更相关、上下文感知和安全的模型响应,并通过来自临床医生的1860个评分进行了验证。

🔬 方法详解

问题定义:论文旨在解决如何有效利用大规模可穿戴传感器数据,将其转化为个性化的健康洞察。现有方法面临的痛点在于:1)个体差异大,难以建立通用的健康状态表征;2)高质量标注数据稀缺,限制了监督学习的效果。

核心思路:论文的核心思路是利用大规模无标签的可穿戴传感器数据进行预训练,学习通用的健康表征。通过增加模型容量和预训练数据量,使模型能够捕捉到不同个体之间的共性,并克服数据标注稀缺的问题。这样设计的目的是为了提高模型在各种健康预测任务上的泛化能力。

技术框架:整体框架包含三个主要阶段:1)大规模无标签数据预训练:使用来自五百万参与者的一万亿分钟的传感器数据训练基础模型;2)下游任务预测头搜索:利用LLM代理自主搜索基于模型嵌入构建的下游预测头,针对特定健康预测任务进行优化;3)个人健康代理集成:将下游预测器集成到个人健康代理中,提供个性化的健康建议。

关键创新:最重要的技术创新点在于利用大规模无标签数据进行预训练,学习通用的健康表征。与传统的监督学习方法相比,该方法能够更好地利用可穿戴传感器数据,并克服数据标注稀缺的问题。此外,利用LLM代理自主搜索下游预测头,可以自动优化模型在不同任务上的性能。

关键设计:论文的关键设计包括:1)大规模预训练数据的选择和处理;2)基础模型的架构设计,需要能够处理长时间序列的传感器数据;3)LLM代理搜索下游预测头的策略,需要平衡搜索效率和性能;4)个人健康代理的集成方式,需要保证模型响应的相关性、上下文感知和安全性。

📊 实验亮点

该研究在35项健康预测任务上进行了评估,涵盖心血管、代谢、睡眠和心理健康等多个领域,结果表明,随着模型容量和预训练数据量的增加,性能得到系统性提升。此外,该模型还展现出标签高效的少样本学习能力,并能生成稳健的日常指标估计。通过LLM代理搜索下游预测头,进一步提高了性能。临床医生对集成下游预测器的个人健康代理的评分表明,模型响应更相关、上下文感知和安全。

🎯 应用场景

该研究成果可应用于个性化健康管理、疾病早期预警、远程患者监护等领域。通过可穿戴设备收集的健康数据,结合该模型提供的智能分析,可以为用户提供更精准、更及时的健康建议,从而改善生活方式、预防疾病,提高生活质量。未来,该技术有望成为智能健康领域的重要组成部分。

📄 摘要(原文)

While ubiquitous wearable sensors capture a wealth of behavioral and physiological information, effectively transforming these signals into personalized health insights is challenging. Specifically, converting low-level sensor data into representations capable of characterizing higher-level states is difficult due to high phenotypic diversity and variation in individual baseline health, physiology, and lifestyle factors. Moreover, collecting wearable data paired with health outcome annotations is laborious and expensive, and retrospective annotation remains practically unfeasible, contributing to a scarcity of data with high-quality labels. To overcome these limitations, we propose a foundation model for wearable health that is pretrained on more than one trillion minutes of unlabeled sensor signals drawn from a large cohort of five million participants. We demonstrate that the joint scaling of model capacity and pretraining data volume leads to systematic improvements in performance, as evaluated on a diverse set of 35 health prediction tasks, spanning cardiovascular, metabolic, sleep, and mental health, as well as lifestyle choices and demographic factors. We find that this population scale representation unlocks label-efficient few-shot learning and generative capabilities for robust daily metric estimation. To further leverage this learned representation, we deploy a classroom of LLM agents to autonomously search the space of downstream predictive heads built on the model embeddings, showing broad performance improvements that increase with LLM model capacity. Finally, we show how integrating these downstream predictors into a Personal Health Agent can support model responses that are more relevant, contextually aware, and safe, and we validate this via 1,860 ratings from a cohort of clinicians.