Creating a Segmented Pointcloud of Grapevines by Combining Multiple Viewpoints Through Visual Odometry

📄 arXiv: 2408.16472v1 📥 PDF

作者: Michael Adlerstein, Angelo Bratta, João Carlos Virgolino Soares, Giovanni Dessy, Miguel Fernandes, Matteo Gatti, Claudio Semini

分类: cs.CV

发布日期: 2024-08-29


💡 一句话要点

结合视觉里程计多视角融合,构建葡萄藤分割点云用于冬季修剪

🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)

关键词: 葡萄藤修剪 点云重建 视觉里程计 Detectron2 图像分割

📋 核心要点

  1. 葡萄藤冬季修剪依赖人工,效率低且成本高,需要自动化解决方案。
  2. 论文提出结合detectron2分割网络和视觉里程计,从多视角构建葡萄藤的完整点云。
  3. 该点云可用于辅助或自动进行葡萄藤修剪决策,提升修剪效率和质量。

📝 摘要(中文)

葡萄藤冬季修剪是一项劳动密集且重复性的工作,它显著影响葡萄收成和葡萄酒的质量与产量。这项工作需要仔细且专业地检测切割点。由于其复杂性、重复性和时间限制,该任务需要训练有素的劳动力。本文介绍Vinum项目中使用的计算机视觉流程,该流程使用detectron2作为分割网络,并使用关键点视觉里程计将不同的观测结果合并到单个点云中,用于做出明智的修剪决策。

🔬 方法详解

问题定义:葡萄藤冬季修剪是葡萄种植中至关重要的一环,直接影响下一季的产量和质量。然而,这项工作非常耗时耗力,需要经验丰富的工人进行精确的切割点判断。现有方法难以实现自动化,主要痛点在于如何从有限的视角获取葡萄藤的完整三维结构,并准确分割出需要修剪的部分。

核心思路:论文的核心思路是利用视觉里程计技术,将从不同视角获取的葡萄藤图像信息进行融合,构建一个完整的、分割好的三维点云模型。通过多视角的融合,可以克服单一视角下的遮挡问题,从而更准确地重建葡萄藤的结构。

技术框架:该计算机视觉流程主要包含两个核心模块:1) 基于Detectron2的分割网络,用于从单张图像中分割出葡萄藤的各个部分;2) 基于关键点视觉里程计的多视角融合模块,用于将不同视角的分割结果转换到统一的三维坐标系下,并构建完整的点云模型。具体流程为:首先,使用相机从不同角度拍摄葡萄藤图像;然后,利用Detectron2对每张图像进行分割,得到葡萄藤各部分的像素级掩码;接着,提取图像中的关键点,并利用视觉里程计算法估计相机的运动轨迹;最后,将分割结果和相机位姿信息融合,生成葡萄藤的分割点云。

关键创新:该方法的主要创新在于将视觉里程计技术应用于葡萄藤点云重建,从而能够有效地融合多视角信息,克服遮挡问题,提高点云的完整性和准确性。此外,利用Detectron2进行分割,可以实现对葡萄藤各部分的精细化分割,为后续的修剪决策提供更丰富的信息。

关键设计:论文中使用了Detectron2作为分割网络,具体配置未知。视觉里程计部分,关键在于特征点的选择和匹配,以及位姿估计的精度。损失函数和网络结构等细节信息未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

由于是扩展摘要,论文中没有提供具体的实验结果数据。但是,该研究提出了一种可行的葡萄藤点云重建方案,为后续的自动化修剪研究奠定了基础。未来的工作可以集中在提高点云重建的精度和效率,以及开发基于点云的自动化修剪算法。

🎯 应用场景

该研究成果可应用于智能农业领域,特别是葡萄种植的自动化管理。通过构建葡萄藤的分割点云,可以辅助人工进行修剪决策,提高修剪效率和质量,降低人工成本。未来,结合机器人技术,有望实现葡萄藤的自动化修剪,进一步提升葡萄种植的智能化水平。

📄 摘要(原文)

Grapevine winter pruning is a labor-intensive and repetitive process that significantly influences the quality and quantity of the grape harvest and produced wine of the following season. It requires a careful and expert detection of the point to be cut. Because of its complexity, repetitive nature and time constraint, the task requires skilled labor that needs to be trained. This extended abstract presents the computer vision pipeline employed in project Vinum, using detectron2 as a segmentation network and keypoint visual odometry to merge different observation into a single pointcloud used to make informed pruning decisions.