HortiMulti: A Multi-Sensor Dataset for Localisation and Mapping in Horticultural Polytunnels

📄 arXiv: 2603.20150v1 📥 PDF

作者: Shuoyuan Xu, Zhipeng Zhong, Tiago Barros, Matthew Coombes, Cristiano Premebida, Hao Wu, Cunjia Liu

分类: cs.RO

发布日期: 2026-03-20


💡 一句话要点

HortiMulti:用于园艺温室定位与建图的多传感器数据集

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 农业机器人 园艺温室 多模态数据集 定位与建图 SLAM

📋 核心要点

  1. 现有定位和感知算法在园艺温室环境中表现不佳,面临外观变化大、动态叶片、镜面反射和GNSS信号弱等挑战。
  2. HortiMulti数据集旨在通过提供多模态传感器数据,以及精确的地面真值轨迹,来促进园艺机器人感知算法的开发和测试。
  3. 基线SLAM算法在HortiMulti数据集上的表现验证了该数据集的挑战性,并突出了现有方法在园艺环境中的局限性。

📝 摘要(中文)

农业机器人正在研究和实际部署中变得越来越重要。由于这些系统需要在更复杂的任务中自主运行,因此具有代表性的真实世界数据集的可用性至关重要。虽然城市和林业机器人等领域受益于大型且已建立的基准,但园艺环境的探索相对不足,尽管该部门具有重要的经济意义。为了解决这一差距,我们提出了HortiMulti,这是一个多模态、跨季节的数据集,在整个生长季节中,于商业草莓和覆盆子温室中收集,捕捉了大量的外观变化、动态叶片、塑料覆盖物的镜面反射、严重的感知混淆以及GNSS不可靠的条件,所有这些都直接降低了现有定位和感知算法的性能。传感器套件包括两个3D LiDAR、四个RGB相机、一个IMU、GNSS和轮式里程计。地面真值轨迹来自全站仪测量、AprilTag fiducial markers和LiDAR-惯性里程计的组合,跨越密集、稀疏和无标记覆盖,以支持在受控和真实条件下的评估。我们发布了时间同步的原始测量数据、校准文件、参考轨迹以及视觉、LiDAR和多传感器SLAM的基线基准,结果证实当前最先进的方法仍然不足以可靠地进行温室部署,从而将HortiMulti确立为开发和测试园艺环境中机器人感知系统的一站式资源。

🔬 方法详解

问题定义:论文旨在解决农业机器人,特别是在园艺温室环境中,缺乏高质量、多模态数据集的问题。现有方法在应对温室环境的复杂性(如光照变化、动态植被、遮挡和GNSS信号差)时表现不佳,阻碍了相关算法的开发和评估。

核心思路:论文的核心思路是构建一个包含多种传感器数据(LiDAR、相机、IMU、GNSS、轮式里程计)的综合数据集,并提供精确的地面真值轨迹,以便研究人员能够开发和评估在园艺温室环境中运行的机器人感知算法。通过模拟真实场景中的挑战,促进更鲁棒和可靠的算法的开发。

技术框架:HortiMulti数据集的构建流程包括:1) 在商业草莓和覆盆子温室中进行数据采集,覆盖整个生长季节;2) 使用多种传感器同步采集数据;3) 采用全站仪测量、AprilTag fiducial markers和LiDAR-惯性里程计融合的方法生成地面真值轨迹;4) 提供校准文件和基线SLAM算法的benchmark,方便研究人员使用。

关键创新:该数据集的关键创新在于其多模态、跨季节的特性,以及在具有挑战性的园艺温室环境中采集数据。此外,地面真值轨迹的生成采用了多种方法的融合,提高了精度和可靠性。该数据集还提供了基线SLAM算法的benchmark,方便研究人员进行比较和评估。

关键设计:传感器套件的选择考虑了园艺环境的特殊性,包括两个3D LiDAR用于获取几何信息,四个RGB相机用于获取视觉信息,IMU用于提供惯性信息,GNSS和轮式里程计用于提供定位信息。地面真值轨迹的生成采用了全站仪测量、AprilTag fiducial markers和LiDAR-惯性里程计融合的方法,以提高精度和鲁棒性。数据集的组织方式方便研究人员访问和使用,包括时间同步的原始测量数据、校准文件和参考轨迹。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文提供了视觉、LiDAR和多传感器SLAM的基线benchmark。实验结果表明,当前最先进的SLAM方法在HortiMulti数据集上表现不佳,验证了该数据集的挑战性。例如,在某些场景下,视觉SLAM算法的定位精度显著下降,表明其对光照变化和动态植被的鲁棒性不足。

🎯 应用场景

HortiMulti数据集可用于开发和评估各种农业机器人应用,如自主导航、作物监测、病虫害检测和精准农业。该数据集能够促进更鲁棒和可靠的机器人感知算法的开发,从而提高农业生产效率和可持续性,并降低人工成本。

📄 摘要(原文)

Agricultural robotics is gaining increasing relevance in both research and real-world deployment. As these systems are expected to operate autonomously in more complex tasks, the availability of representative real-world datasets becomes essential. While domains such as urban and forestry robotics benefit from large and established benchmarks, horticultural environments remain comparatively under-explored despite the economic significance of this sector. To address this gap, we present HortiMulti, a multimodal, cross-season dataset collected in commercial strawberry and raspberry polytunnels across an entire growing season, capturing substantial appearance variation, dynamic foliage, specular reflections from plastic covers, severe perceptual aliasing, and GNSS-unreliable conditions, all of which directly degrade existing localisation and perception algorithms. The sensor suite includes two 3D LiDARs, four RGB cameras, an IMU, GNSS, and wheel odometry. Ground truth trajectories are derived from a combination of Total Station surveying, AprilTag fiducial markers, and LiDAR-inertial odometry, spanning dense, sparse, and marker-free coverage to support evaluation under both controlled and realistic conditions. We release time-synchronised raw measurements, calibration files, reference trajectories, and baseline benchmarks for visual, LiDAR, and multi-sensor SLAM, with results confirming that current state-of-the-art methods remain inadequate for reliable polytunnel deployment, establishing HortiMulti as a one-stop resource for developing and testing robotic perception systems in horticulture environments.