A Novel Computer Vision Approach for Assessing Fish Responses to Intrusive Objects in Aquaculture
作者: Hanne-Grete Alvheim, Stian Mjelde Jakobsen, Martin Føre, Eleni Kelasidi
分类: q-bio.QM, cs.LG, eess.IV
发布日期: 2026-05-28
💡 一句话要点
提出一种基于计算机视觉的水产养殖中鱼类对入侵物体反应评估方法
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 水产养殖 计算机视觉 鱼类行为分析 目标检测 立体视觉
📋 核心要点
- 现有方法难以准确、高效地分析鱼类在复杂水产养殖环境中的行为,尤其是在个体层面。
- 该方法利用YOLOv8和ByteTrack进行鱼类检测与跟踪,结合SuperGlue进行立体匹配,并进行三维重建。
- 实验结果验证了该方法在海笼养殖环境中行为分析的有效性,并为深入了解鱼类行为动态提供了潜力。
📝 摘要(中文)
为了满足日益增长的全球需求,水产养殖业需要解决若干挑战,以确保可持续的海产品生产。其中一个主要挑战是确保鱼类的良好健康和可接受的福利,因为改善鱼类福利在当前和未来的生产系统中至关重要。本研究通过开发和实施方法来识别鱼类对入侵物体的行为反应,包括个体和群体层面,从而解决这个问题。开发了一种新的方法来检测、跟踪和估计单个鱼类的3D位置,专门设计用于跟踪工业化海笼养殖鱼类的尾鳍。跟踪数据经过一种新的立体视觉方法处理,用于估计鱼的位置、速度、加速度以及转弯和俯仰角度。然后分析从工业规模养鱼场获得的数据集,以识别不同形状、大小和颜色的结构对鱼类行为的影响。
🔬 方法详解
问题定义:论文旨在解决水产养殖环境中,如何准确、高效地评估鱼类对入侵物体的行为反应的问题。现有方法在复杂环境下,尤其是在工业规模的海笼中,难以实现对个体鱼类的精确跟踪和行为分析,缺乏对鱼类行为动态的深入理解。
核心思路:论文的核心思路是利用计算机视觉技术,构建一个能够自动检测、跟踪和分析鱼类行为的系统。通过立体视觉方法,重建鱼类的三维位置信息,并分析其运动轨迹和姿态变化,从而评估鱼类对入侵物体的反应。
技术框架:该方法主要包含以下几个阶段:1) 使用YOLOv8目标检测器检测图像中的鱼类尾鳍;2) 使用ByteTrack算法跟踪检测到的鱼类;3) 使用SuperGlue算法匹配左右图像中的鱼类检测结果,建立对应关系;4) 使用三角测量法,根据立体图像的对应关系,重建鱼类的三维位置信息;5) 对鱼类的位置、速度、加速度、转弯和俯仰角度等行为特征进行分析。
关键创新:该方法的主要创新在于:1) 针对水产养殖环境,设计了一种鲁棒的鱼类尾鳍检测和跟踪算法;2) 提出了一种基于立体视觉的鱼类三维位置重建方法,能够准确估计鱼类的空间位置;3) 将计算机视觉技术应用于鱼类行为分析,为水产养殖业提供了一种新的研究手段。
关键设计:在目标检测阶段,使用了YOLOv8模型,并针对水下图像的特点,采用了图像预处理和数据增强方法,以提高检测精度。在立体匹配阶段,使用了SuperGlue算法,该算法能够有效地处理图像噪声和光照变化等问题。此外,论文还测试了RAFT-Stereo用于深度估计,并比较了不同图像预处理和增强方法对目标检测精度的影响。
🖼️ 关键图片
📊 实验亮点
该研究成功地将计算机视觉技术应用于水产养殖领域,实现对鱼类个体行为的精确跟踪和分析。通过对工业规模养鱼场数据的分析,验证了该方法在复杂环境下的有效性。该方法能够准确估计鱼类的三维位置、速度、加速度以及转弯和俯仰角度等行为特征,为评估鱼类对入侵物体的反应提供了新的手段。
🎯 应用场景
该研究成果可应用于水产养殖业,用于评估养殖环境中各种因素(如设施结构、环境变化等)对鱼类行为和福利的影响。通过实时监测鱼类的行为反应,可以及时发现潜在的问题,并采取相应的措施,从而提高鱼类的健康水平和养殖效率。此外,该方法还可以用于研究鱼类的社会行为、觅食行为等,为深入了解鱼类生物学特性提供支持。
📄 摘要(原文)
The aquaculture industry needs to address several challenges to secure sustainable seafood production that can serve an increasing global demand. One major challenge is to ensure good fish health and acceptable welfare during production since the improvement of fish welfare is of vital importance in current and future production systems. In this study, this is addressed by developing and implementing methods to identify fish behaviors in response to intrusive objects both on individual and on a group basis. A novel approach for detecting, tracking, and estimating the 3D position of individual fish has thus been developed, and specifically designed to track the caudal fins of farmed fish in industrial sea cages. The tracking data was subjected to a novel stereo-vision method adapted to estimate fish positions, velocities, accelerations, and turning and pitch angles. Datasets obtained from industrial-scale fish farms were then analyzed to identify the impact of structures of varying shapes, sizes, and colors on fish behavior. The method was trained using manually labeled caudal fins, and used YOLOv8 with ByteTrack as an object detector and tracker, SuperGlue for matching detections in the left and right frames, and triangulation to reconstruct the 3D positions of the fish. Different image pre-processing and augmentation methods for enhancing object detection accuracy were tested and their performance compared, while RAFT-Stereo was tested for depth estimation purposes. The obtained results both validate the method's performance against previous research efforts, and demonstrate the novelty and potential of this method in providing more insight into behavioral dynamics in sea-cages.