What's Under the Skin? Estimating Swine Body Condition

📄 arXiv: 2606.05611v1 📥 PDF

作者: Mk Bashar, Kuljit Bhatti, Gary Rohrer, Madonna Benjamin, Tami Brown-Brandl, Daniel Morris

分类: cs.CV

发布日期: 2026-06-04

🔗 代码/项目: GITHUB


💡 一句话要点

提出PigFormer以解决猪体况监测的自动化问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知与语义 (Perception & Semantics) 支柱七:动作重定向 (Motion Retargeting)

关键词: 体况监测 深度学习 RGB-D相机 自动化 非接触式 猪只健康 机器学习

📋 核心要点

  1. 现有的母猪体况评估方法如视觉评分和卡尺测量与实际组织成分的相关性较差,难以准确反映猪只的健康状况。
  2. PigFormer通过将RGB-D相机获取的深度图像进行处理,预测皮下脂肪厚度和肌肉深度,提供了一种自动化、非接触的体况监测方案。
  3. 在多站点数据集上,PigFormer的脂肪MAE为2.43mm,总体MAE为3.87mm,显著优于传统的单阶段模型,展示了其有效性。

📝 摘要(中文)

母猪体况是影响泌乳性能和仔猪存活的重要指标。然而,现有的体况测量方法如视觉评分和卡尺与实际组织成分相关性较差。超声扫描虽然能直接测量皮下脂肪厚度和肌肉深度,但操作繁琐且难以规模化生产。本文提出了PigFormer,一个端到端的两阶段系统,利用RGB-D相机的深度图像预测皮下脂肪厚度、肌肉深度和总组织厚度。通过在319个母猪实例上的多站点数据集实验,PigFormer实现了2.43mm的脂肪平均绝对误差(MAE)和3.87mm的总体MAE,超越了强基线模型ResNet-18和ViT-small。PigFormer为商业化猪只体况监测提供了可行的自动化解决方案。

🔬 方法详解

问题定义:本文旨在解决母猪体况监测中现有方法的不足,尤其是视觉评分和卡尺测量的低相关性与超声扫描的劳动强度问题。

核心思路:PigFormer通过将RGB-D相机获取的深度数据转化为标准化的高度图,利用深度学习模型进行体况参数的预测,旨在实现自动化和非接触式监测。

技术框架:PigFormer的整体架构分为两个阶段:第一阶段为几何前端,负责将原始深度数据转换为标准化的高度图;第二阶段为Slice Attention Encoder,处理高度图并捕捉空间关系。

关键创新:PigFormer的主要创新在于结合了SAM3与MaskDINO的分割蒸馏技术,提升了深度图的处理精度,并通过Slice Attention机制有效捕捉了全背部表面的空间关系。

关键设计:在关键设计上,PigFormer采用了标准化高度图的生成流程,包括地面平面去除和方向归一化,同时在模型训练中使用了特定的损失函数以优化预测精度。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

PigFormer在319个母猪实例的多站点数据集上取得了2.43mm的皮下脂肪MAE和3.87mm的总体MAE,显著优于传统的ResNet-18和ViT-small基线模型,展示了其在体况监测中的有效性和优势。

🎯 应用场景

PigFormer的研究成果在商业化猪只生产中具有广泛的应用潜力。通过实现自动化的体况监测,养殖者可以实时获取猪只的健康信息,从而优化饲养管理,提高生产效率和经济效益。此外,该技术还可推广至其他动物健康监测领域,具有重要的实际价值和未来影响。

📄 摘要(原文)

Sow body condition is an important indicator for growers as it has a large impact on lactation performance and piglet survival. However, body condition measures used during production, such as visual scoring and calipers, correlate poorly with underlying tissue composition. Ultrasound scans can provide direct measurements of subcutaneous backfat thickness and loin muscle depth, but their operation is labor intensive and not scalable for production. We present PigFormer, an end-to-end two-stage system that takes raw depth frames from a ceiling-mounted RGB-D camera and predicts subcutaneous backfat thickness, loin muscle depth, and total tissue thickness at the last rib. Stage 1 is a geometric front-end that converts raw depth into a standardized height map via SAM3-to-MaskDINO segmentation distillation, ground-plane removal, and orientation normalization. Stage 2 is a Slice Attention Encoder that treats each height map as a sequence of cross-sectional slices and captures spatial relationships along the full dorsal surface. On a multi-site dataset of 319 sow and gilt instances from two facilities, PigFormer achieves 2.43 mm backfat MAE and 3.87 mm overall MAE. It outperforms strong single-stage ResNet-18 and ViT-small baselines. PigFormer offers a practical path toward continuous, automated, non-contact body condition monitoring in commercial swine production. Code is available at https://github.com/iambashar/Pigformer.