LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet

📄 arXiv: 2503.03935v2 📥 PDF

作者: Abdullah Mamun, Asiful Arefeen, Susan B. Racette, Dorothy D. Sears, Corrie M. Whisner, Matthew P. Buman, Hassan Ghasemzadeh

分类: cs.LG, cs.AI

发布日期: 2025-03-05 (更新: 2025-07-03)

备注: 16 pages, 10 figures

🔗 代码/项目: GITHUB


💡 一句话要点

提出GlucoLens以预测餐后高血糖并发现行为治疗路径

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 高血糖预测 可穿戴设备 机器学习 多模态数据 个性化健康管理

📋 核心要点

  1. 餐后高血糖的预测依赖于个体的生活方式因素,目前缺乏有效的可解释模型来帮助个体调整生活方式以维持正常血糖水平。
  2. 本研究提出的GlucoLens系统结合了可穿戴设备的数据,利用机器学习和大型语言模型,提供可解释的餐后血糖预测。
  3. GlucoLens在临床试验中表现出色,NRMSE达到0.123,且在高血糖预测中准确率为73.3%,显示出显著的性能提升。

📝 摘要(中文)

餐后高血糖是指餐后血糖水平超过正常范围,是2型糖尿病进展的重要指标。理解餐后血糖动态的关键指标是餐后曲线下面积(AUC)。本研究开发了可解释的机器学习解决方案GlucoLens,利用传感器输入、先进的数据处理、大型语言模型和可训练的机器学习模型,基于饮食、身体活动和近期血糖模式预测餐后AUC和高血糖。我们在为期五周的临床试验中使用了来自可穿戴设备的数据,评估了该计算模型。GlucoLens系统在最佳配置下实现了0.123的归一化均方根误差(NRMSE),平均性能比对比模型提高了16%。此外,该技术以73.3%的准确率和0.716的F1分数预测高血糖,并推荐不同的治疗方案以帮助避免高血糖。

🔬 方法详解

问题定义:本研究旨在解决餐后高血糖的预测问题,现有方法在个体化预测和可解释性方面存在不足,难以有效指导生活方式调整。

核心思路:GlucoLens通过整合来自可穿戴设备的多模态数据,结合机器学习和大型语言模型,提供餐后血糖的可解释预测,帮助用户理解影响血糖的因素。

技术框架:GlucoLens系统包括数据采集模块(可穿戴传感器)、数据处理模块(数据清洗与特征提取)、预测模型模块(机器学习模型训练与预测)和解释模块(生成可解释的预测结果)。

关键创新:该研究的主要创新在于将可穿戴设备数据与大型语言模型结合,形成了一种新的可解释预测框架,显著提高了预测的准确性和可解释性。

关键设计:模型采用了多模态输入,包括活动监测、血糖监测和饮食日志,使用了特定的损失函数来优化预测性能,网络结构经过调优以适应不同类型的数据输入。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

GlucoLens在最佳配置下实现了0.123的归一化均方根误差(NRMSE),相比对比模型平均提高了16%。此外,该系统在高血糖预测中准确率达到73.3%,F1分数为0.716,展示了其在实际应用中的有效性和可靠性。

🎯 应用场景

GlucoLens的研究成果在糖尿病管理、个性化健康监测和生活方式干预等领域具有广泛的应用潜力。通过提供个体化的血糖预测和可解释的建议,能够帮助用户更好地管理自身健康,降低糖尿病风险,具有重要的社会价值和实际意义。

📄 摘要(原文)

Postprandial hyperglycemia, marked by the blood glucose level exceeding the normal range after consuming a meal, is a critical indicator of progression toward type 2 diabetes in people with prediabetes and in healthy individuals. A key metric for understanding blood glucose dynamics after eating is the postprandial area under the curve (AUC). Predicting postprandial AUC in advance based on a person's lifestyle factors, such as diet and physical activity level, and explaining the factors that affect postprandial blood glucose could allow an individual to adjust their lifestyle accordingly to maintain normal glucose levels. In this study, we developed an explainable machine learning solution, GlucoLens, that takes sensor-driven inputs and uses advanced data processing, large language models, and trainable machine learning models to predict postprandial AUC and hyperglycemia from diet, physical activity, and recent glucose patterns. We used data obtained from wearables in a five-week clinical trial of 10 adults who worked full-time to develop and evaluate the proposed computational model that integrates wearable sensing, multimodal data, and machine learning. Our machine learning model takes multimodal data from wearable activity and glucose monitoring sensors, along with food and work logs, and provides an interpretable prediction of the postprandial glucose pattern. Our GlucoLens system achieves a normalized root mean squared error (NRMSE) of 0.123 in its best configuration. On average, the proposed technology provides a 16% better performance level compared to the comparison models. Additionally, our technique predicts hyperglycemia with an accuracy of 73.3% and an F1 score of 0.716 and recommends different treatment options to help avoid hyperglycemia through diverse counterfactual explanations. Code available: https://github.com/ab9mamun/GlucoLens.