Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition

📄 arXiv: 2503.09378v1 📥 PDF

作者: Fangzheng Qi, Zhenjie Hou, En Lin, Xing Li, iuzhen Liang, Xinwen Zhou

分类: cs.CV, cs.AI

发布日期: 2025-03-12


💡 一句话要点

提出基于注意力机制的时空感知增强网络,用于猪行为识别,并构建了相关数据集。

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation)

关键词: 猪行为识别 时空感知 注意力机制 行为识别数据集 智慧农业

📋 核心要点

  1. 缺乏公开的猪行为数据集阻碍了相关算法的创新和优化,限制了模型鲁棒性。
  2. 提出一种基于注意力机制的时空感知增强网络,建模猪行为的时空特征和交互区域。
  3. 实验结果表明,该模型在自建数据集上MAP达到75.92%,相比传统模型提升了8.17%。

📝 摘要(中文)

猪行为识别在智慧农业和猪福利保障中至关重要。当前,该领域缺乏公开的行为数据集,限制了算法创新、模型鲁棒性和算法优化。本文提出了一个包含13种对猪福利有重要影响的行为的数据集。基于此数据集,本文提出了一种基于注意力机制的时空感知增强网络,用于建模视频数据中猪行为的时空特征及其相关的交互区域。该网络由时空感知网络和时空特征增强网络组成。时空感知网络负责建立猪与视频数据中其行为的关键区域之间的连接。时空特征增强网络通过重塑这些连接,进一步加强个体猪的重要空间特征,并捕获个体行为时空特征的长期依赖关系,从而增强模型对猪行为时空变化的感知。实验结果表明,在本文建立的数据集上,所提出的模型实现了75.92%的MAP,比性能最佳的传统模型提高了8.17%。这项研究不仅提高了单个猪行为识别的准确性和泛化性,还为现代智慧农业提供了新的技术工具。数据集和相关代码将与本文一起公开发布。

🔬 方法详解

问题定义:论文旨在解决猪行为识别中缺乏高质量数据集以及现有模型对猪行为时空特征建模能力不足的问题。现有方法难以准确捕捉猪行为的长期依赖关系和关键交互区域,导致识别精度不高。

核心思路:论文的核心思路是利用注意力机制增强模型对猪行为时空特征的感知能力。通过构建时空感知网络和时空特征增强网络,显式地建模猪与行为关键区域之间的关系,并捕获行为的长期时序依赖性。

技术框架:该方法包含两个主要模块:时空感知网络和时空特征增强网络。时空感知网络负责建立猪与视频数据中其行为的关键区域之间的连接。时空特征增强网络通过重塑这些连接,进一步加强个体猪的重要空间特征,并捕获个体行为时空特征的长期依赖关系。整体流程是先通过时空感知网络提取初步的时空特征,然后利用时空特征增强网络进一步提炼特征,最后进行行为分类。

关键创新:该方法最重要的创新点在于提出了一个基于注意力机制的时空特征增强网络,能够有效地建模猪行为的时空依赖关系和关键交互区域。与传统方法相比,该网络能够更准确地捕捉猪行为的时空变化,从而提高识别精度。

关键设计:时空感知网络和时空特征增强网络都使用了注意力机制来选择重要的时空特征。具体的网络结构和损失函数等技术细节在论文中未详细描述,属于未知信息。数据集包含13种猪行为,这些行为对猪的福利有重要影响。

📊 实验亮点

该研究在自建的包含13种猪行为的数据集上进行了实验,提出的模型取得了显著的性能提升。实验结果表明,该模型实现了75.92%的MAP,相比于最佳的传统模型,性能提升了8.17%。这表明该模型能够更准确地识别猪的行为,具有较强的实用价值。

🎯 应用场景

该研究成果可应用于智慧养殖领域,实现对猪行为的自动监测和识别,从而及时发现异常行为,保障猪的健康和福利。通过对猪行为的分析,可以优化饲养管理策略,提高养殖效率。该技术还可扩展到其他动物行为识别领域,具有广阔的应用前景。

📄 摘要(原文)

The recognition of pig behavior plays a crucial role in smart farming and welfare assurance for pigs. Currently, in the field of pig behavior recognition, the lack of publicly available behavioral datasets not only limits the development of innovative algorithms but also hampers model robustness and algorithm optimization.This paper proposes a dataset containing 13 pig behaviors that significantly impact welfare.Based on this dataset, this paper proposes a spatial-temporal perception and enhancement networks based on the attention mechanism to model the spatiotemporal features of pig behaviors and their associated interaction areas in video data. The network is composed of a spatiotemporal perception network and a spatiotemporal feature enhancement network. The spatiotemporal perception network is responsible for establishing connections between the pigs and the key regions of their behaviors in the video data. The spatiotemporal feature enhancement network further strengthens the important spatial features of individual pigs and captures the long-term dependencies of the spatiotemporal features of individual behaviors by remodeling these connections, thereby enhancing the model's perception of spatiotemporal changes in pig behaviors. Experimental results demonstrate that on the dataset established in this paper, our proposed model achieves a MAP score of 75.92%, which is an 8.17% improvement over the best-performing traditional model. This study not only improces the accuracy and generalizability of individual pig behavior recognition but also provides new technological tools for modern smart farming. The dataset and related code will be made publicly available alongside this paper.