Multimodal AI for Body Fat Estimation: Computer Vision and Anthropometry with DEXA Benchmarks

📄 arXiv: 2511.17576v1 📥 PDF

作者: Rayan Aldajani

分类: cs.CV, cs.AI, cs.LG

发布日期: 2025-11-15

备注: 2 pages, 2 figures, accepted at IEEE CASCON 2025


💡 一句话要点

提出基于计算机视觉和人体测量数据的多模态AI模型,用于低成本的体脂率估计。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 体脂率估计 计算机视觉 人体测量 深度学习 ResNet 多模态融合 健康管理

📋 核心要点

  1. 现有体脂率测量金标准DEXA扫描昂贵且难以获取,限制了其广泛应用。
  2. 利用AI模型,结合正面身体图像和人体测量数据,提供低成本的体脂率估计替代方案。
  3. 基于ResNet的图像模型RMSE为4.44%,R^2为0.807,验证了AI辅助模型的有效性。

📝 摘要(中文)

体脂率的追踪对于有效的体重管理至关重要,但诸如DEXA扫描等金标准方法对大多数人来说仍然昂贵且难以获得。本研究评估了使用正面身体图像和基本人体测量数据,利用人工智能(AI)模型作为低成本替代方案的可行性。数据集包含535个样本:253个案例具有记录的人体测量数据(体重、身高、颈围、踝围和腕围),以及282张通过网络抓取自Reddit帖子中的图像,这些帖子包含自我报告的体脂率,其中一些由发帖者报告为DEXA衍生。由于不存在用于基于计算机视觉的体脂率估计的公共数据集,因此专门为本研究编译了该数据集。开发了两种方法:(1)基于ResNet的图像模型和(2)使用人体测量数据的回归模型。还概述了一个多模态融合框架,以便在配对数据集可用后进行未来的扩展。基于图像的模型实现了4.44%的均方根误差(RMSE)和0.807的决定系数(R^2)。这些发现表明,AI辅助模型可以提供可访问且低成本的体脂率估计,从而支持未来健康和健身领域的消费者应用。

🔬 方法详解

问题定义:论文旨在解决体脂率精确测量成本高昂且不易获取的问题。现有金标准方法,如DEXA扫描,设备昂贵,操作复杂,难以普及到大众用户,限制了人们对自身健康状况的有效管理。因此,需要一种低成本、易于获取的体脂率估计方法。

核心思路:论文的核心思路是利用人工智能技术,特别是计算机视觉和机器学习方法,结合容易获取的身体图像和人体测量数据,建立体脂率预测模型。通过训练模型学习图像特征和人体测量数据与体脂率之间的关系,从而实现低成本的体脂率估计。

技术框架:论文构建了两个主要模型:基于ResNet的图像模型和基于人体测量数据的回归模型。图像模型使用ResNet提取图像特征,然后进行体脂率预测。回归模型则直接使用人体测量数据(体重、身高、颈围、踝围和腕围)作为输入,预测体脂率。此外,论文还提出了一个多模态融合框架,旨在未来将图像模型和回归模型的结果进行融合,以进一步提高预测精度。

关键创新:论文的关键创新在于探索了使用计算机视觉和人体测量数据进行体脂率估计的可行性,并构建了相应的AI模型。此外,论文还专门为此研究编译了一个包含身体图像和体脂率标签的数据集,填补了公开数据集的空白。多模态融合框架的提出也为未来的研究方向提供了思路。

关键设计:图像模型采用预训练的ResNet网络作为特征提取器,并根据具体任务进行微调。回归模型则采用线性回归或支持向量回归等方法。损失函数采用均方根误差(RMSE)来衡量预测值与真实值之间的差异。数据集包含从Reddit抓取的图像,以及人工测量的人体测量数据。数据预处理包括图像大小调整、归一化等操作。

🖼️ 关键图片

fig_0
fig_1

📊 实验亮点

实验结果表明,基于ResNet的图像模型在体脂率估计任务上取得了较好的性能,RMSE为4.44%,R^2为0.807。这表明,仅使用正面身体图像,AI模型就能较为准确地估计体脂率。虽然论文中没有直接与其他基线方法进行比较,但该结果为后续研究提供了有价值的参考。

🎯 应用场景

该研究成果可应用于健康管理、健身指导等领域。通过手机APP或可穿戴设备,用户可以方便地上传身体照片或输入人体测量数据,获得体脂率估计,从而更好地了解自身健康状况,制定个性化的健身计划。该技术还有潜力应用于远程医疗和健康监测,为用户提供更便捷的健康服务。

📄 摘要(原文)

Tracking body fat percentage is essential for effective weight management, yet gold-standard methods such as DEXA scans remain expensive and inaccessible for most people. This study evaluates the feasibility of artificial intelligence (AI) models as low-cost alternatives using frontal body images and basic anthropometric data. The dataset consists of 535 samples: 253 cases with recorded anthropometric measurements (weight, height, neck, ankle, and wrist) and 282 images obtained via web scraping from Reddit posts with self-reported body fat percentages, including some reported as DEXA-derived by the original posters. Because no public datasets exist for computer-vision-based body fat estimation, this dataset was compiled specifically for this study. Two approaches were developed: (1) ResNet-based image models and (2) regression models using anthropometric measurements. A multimodal fusion framework is also outlined for future expansion once paired datasets become available. The image-based model achieved a Root Mean Square Error (RMSE) of 4.44% and a Coefficient of Determination (R^2) of 0.807. These findings demonstrate that AI-assisted models can offer accessible and low-cost body fat estimates, supporting future consumer applications in health and fitness.