GlucoFM: A Dual-Stream Foundation Model for Continuous Glucose Monitoring
作者: Zechen Li, Keerthana Natarajan, Weizhi Zhang, Menglian Zhou, Simon A. Lee, Yuwei Zhang, Maxwell A. Xu, Zeinab Esmaeilpour, Flora D. Salim, Mark Malhotra, Lindsey Sunden, Shwetak Patel, Yuzhe Yang, Ahmed A. Metwally
分类: cs.LG
发布日期: 2026-05-29
💡 一句话要点
GlucoFM:用于连续血糖监测的双流基础模型,提升代谢预测性能。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 连续血糖监测 基础模型 双流模型 时间序列分析 自监督学习
📋 核心要点
- 现有时间序列和CGM专用基础模型通常将血糖轨迹编码为纠缠的单流序列,忽略了血糖动态的独特时间结构。
- GlucoFM将CGM数据分解为慢速生理状态流和瞬时事件流,显式建模血糖基线和短期偏差,从而更好地捕捉血糖动态。
- GlucoFM在多个临床预测任务中表现出色,显著提升了代谢预测性能,并展现出强大的跨数据集迁移能力和少样本适应性。
📝 摘要(中文)
本文提出GlucoFM,一个轻量级的连续血糖监测(CGM)基础模型。该模型将不规则的CGM记录对齐到24小时的时间网格,保留观测掩码,并将血糖动态分解为慢速生理状态流和瞬时事件流,从而捕获低频血糖基线和可能反映急性生理反应或传感器伪影的短期偏差。GlucoFM在来自477名受试者的109,066小时未标记CGM记录上进行预训练,目标是融合每日表示上的掩码上下文潜在预测以及状态和事件流上的时间动态预测。在四个不同的队列和七个临床预测任务中,GlucoFM在评估的基线中实现了最强的subject-disjoint线性探测性能,平均PR-AUC比最佳CGM专用基础模型提高了4.1个百分点。其增益在核心代谢结果上最为明显,在所有糖尿病风险和β细胞功能障碍任务以及4个胰岛素抵抗任务中的3个上领先PR-AUC。GlucoFM还在评估的方法中实现了最佳的整体跨数据集迁移性能和强大的少样本适应性,以及在聚合多天进行受试者级别预测时的一致增益,突出了生理感知分解作为可迁移CGM表示学习的有效归纳偏置。
🔬 方法详解
问题定义:现有方法通常将连续血糖监测(CGM)数据视为单一时间序列,忽略了血糖动态中蕴含的生理状态和瞬时事件的差异。这种处理方式无法有效捕捉血糖变化的底层机制,限制了模型在临床预测任务中的性能。现有CGM专用模型和通用时间序列模型都存在这个问题。
核心思路:GlucoFM的核心思路是将CGM数据分解为两个独立的流:一个代表慢速变化的生理状态,另一个代表快速发生的瞬时事件。通过这种分解,模型可以更好地捕捉血糖动态的长期趋势和短期波动,从而提高预测精度。同时,将不规则的CGM记录对齐到24小时的时间网格,并保留观测掩码,以处理数据缺失和时间间隔不一致的问题。
技术框架:GlucoFM包含两个主要模块:数据预处理模块和双流Transformer编码器。数据预处理模块负责将不规则的CGM记录对齐到24小时的时间网格,并生成生理状态流和瞬时事件流。双流Transformer编码器分别处理这两个流,并融合它们的表示以进行下游任务预测。模型采用自监督学习的方式进行预训练,包括掩码上下文潜在预测和时间动态预测两个目标。
关键创新:GlucoFM的关键创新在于其双流架构,能够显式地建模血糖动态中的生理状态和瞬时事件。这种分解方式更符合血糖变化的生理机制,并能够提高模型的泛化能力。此外,GlucoFM还采用了掩码上下文潜在预测和时间动态预测两种自监督学习目标,进一步提升了模型的表示学习能力。
关键设计:GlucoFM使用Transformer作为其核心编码器。生理状态流和瞬时事件流分别通过独立的Transformer层进行处理。在预训练阶段,模型采用掩码自编码器(MAE)的策略,随机掩盖输入序列的一部分,并预测被掩盖的部分。时间动态预测任务旨在预测未来一段时间内的血糖变化趋势。损失函数包括掩码重建损失和时间动态预测损失。具体参数设置(如Transformer层数、隐藏层维度等)根据实验结果进行调整。
🖼️ 关键图片
📊 实验亮点
GlucoFM在七个临床预测任务中取得了显著的性能提升,平均PR-AUC比最佳CGM专用基础模型提高了4.1个百分点。在糖尿病风险和β细胞功能障碍任务中,GlucoFM均取得了最佳性能。此外,GlucoFM在跨数据集迁移学习和少样本学习方面也表现出色,证明了其强大的泛化能力。
🎯 应用场景
GlucoFM具有广泛的应用前景,可用于糖尿病风险预测、胰岛素抵抗评估、β细胞功能障碍诊断等临床任务。此外,该模型还可以用于个性化血糖管理,为患者提供更精准的饮食和运动建议。未来,GlucoFM有望成为糖尿病管理的重要工具,改善患者的生活质量。
📄 摘要(原文)
Continuous glucose monitoring (CGM) provides a dense view of daily metabolic physiology, yet existing generic time-series and CGM-specific foundation models often encode glucose traces as entangled single-stream sequences, leaving the distinct temporal structure of glycemic dynamics only implicitly modeled. We present GlucoFM, a lightweight CGM foundation model that aligns irregular recordings to a 24-hour chronological grid, preserves observation masks, and decomposes glucose dynamics into slow physiological state and transient event streams, capturing low-frequency glycemic baselines and short-term deviations that may reflect acute physiological responses or sensor artifacts. GlucoFM is pretrained on 109,066 hours of unlabeled CGM recordings from 477 subjects with two complementary objectives: masked contextual latent prediction over fused daily representations and temporal dynamics prediction over state and event streams. Across four diverse cohorts and seven clinical prediction tasks, GlucoFM achieves the strongest subject-disjoint linear-probing performance among evaluated baselines, improving average PR-AUC by 4.1 points over the best CGM-specific foundation model. Its gains are most pronounced on core metabolic outcomes, leading PR-AUC on all diabetes-risk and $β$-cell dysfunction tasks and on 3 of 4 insulin-resistance tasks. GlucoFM also achieves the best overall cross-dataset transfer performance and strong few-shot adaptation among evaluated methods, and consistent gains when aggregating multiple days for subject-level prediction, highlighting physiology-aware decomposition as an effective inductive bias for transferable CGM representation learning.