AQUAIR: A High-Resolution Indoor Environmental Quality Dataset for Smart Aquaculture Monitoring
作者: Youssef Sabiri, Walid Houmaidi, Ouail El Maadi, Yousra Chtouki
分类: cs.LG, cs.AI, cs.CV, stat.AP
发布日期: 2025-09-28
备注: 6 pages, 6 figures, 3 tables. Accepted at the 9th IEEE Global Conference on Artificial Intelligence & Internet of Things (IEEE GCAIoT) 2025. Final camera-ready manuscript. Math expressions in this field are rendered via MathJax
💡 一句话要点
AQUAIR:用于智能水产养殖监测的高分辨率室内环境质量数据集
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 智能水产养殖 室内环境质量 数据集 环境监测 时间序列分析
📋 核心要点
- 现有智能水产养殖系统缺乏高质量的室内环境数据,限制了对鱼类健康和环境控制的优化。
- AQUAIR数据集通过提供高分辨率的室内环境质量数据,旨在填补智能水产养殖信息学中的数据空白。
- 该数据集包含超过23,000个时间戳观测数据,并经过严格的质量控制,为相关研究提供可靠的数据基础。
📝 摘要(中文)
智能水产养殖系统依赖于丰富的环境数据流,以保护鱼类健康、优化喂养并减少能源消耗。然而,描述室内水箱周围空气的公共数据集仍然稀缺,这限制了预测和异常检测工具的开发,这些工具将顶空条件与水质动态相结合。因此,我们推出了AQUAIR,这是一个开放获取的公共数据集,记录了摩洛哥阿兹鲁Amghass鱼类养殖设施内的六个室内环境质量(IEQ)变量——空气温度、相对湿度、二氧化碳、总挥发性有机化合物、PM2.5和PM10。一个Awair HOME监测器从2024年10月14日到2025年1月9日每五分钟采样一次,产生了超过23,000个带时间戳的观测数据,这些数据经过完全的质量控制,并在Figshare上公开存档。我们描述了传感器放置、符合ISO标准的安装高度、针对参考仪器的校准检查以及一个开源处理管道,该管道标准化时间戳、插补短缺口并导出可供分析的表格。探索性统计显示了稳定的条件(中值CO2 = 758 ppm;PM2.5 = 12 微克/立方米),并具有明显的喂食时间峰值,为短期预测、事件检测和传感器漂移研究提供了丰富的结构。因此,AQUAIR填补了智能水产养殖信息学中的一个关键空白,并为以数据为中心的机器学习课程和专注于循环水产养殖系统中顶空动态的环境传感研究提供了一个可重复的基准。
🔬 方法详解
问题定义:智能水产养殖系统需要精确的环境数据来优化鱼类福利、饲养和能源效率。然而,缺乏公开可用的、描述室内水箱环境空气质量的数据集,阻碍了预测模型和异常检测算法的发展,这些算法需要将顶空环境与水质动态关联起来。现有方法难以有效利用顶空环境信息进行水产养殖管理。
核心思路:论文的核心思路是构建一个高质量、公开可用的室内环境质量数据集AQUAIR,该数据集包含多种关键环境参数,如温度、湿度、二氧化碳、挥发性有机物和颗粒物浓度。通过提供详尽且经过质量控制的数据,促进相关研究和应用的发展。
技术框架:AQUAIR数据集的构建流程包括以下几个主要阶段:1) 传感器选择与部署:选择Awair HOME监测器,并按照ISO标准安装在水产养殖设施内。2) 数据采集:每五分钟采样一次,记录六种室内环境质量变量。3) 数据质量控制:对采集的数据进行时间戳标准化、缺失值插补等处理,确保数据质量。4) 数据发布:将处理后的数据以开放获取的形式发布在Figshare平台上。
关键创新:AQUAIR数据集的关键创新在于其高分辨率、多变量和开放获取的特性。与现有数据集相比,AQUAIR提供了更详细的室内环境信息,涵盖了多种关键环境参数,并且以开放获取的形式发布,方便研究人员使用。
关键设计:传感器选择Awair HOME,采样频率为每5分钟一次。数据处理流程包括时间戳标准化和线性插值填充缺失值。数据集以CSV格式存储,方便用户使用。传感器安装高度符合ISO标准,以保证数据的代表性。
🖼️ 关键图片
📊 实验亮点
AQUAIR数据集包含超过23,000个时间戳观测数据,涵盖六种关键室内环境质量变量。探索性统计分析显示,该数据集具有稳定的环境条件(中值CO2 = 758 ppm;PM2.5 = 12 微克/立方米),并具有明显的喂食时间峰值,为短期预测和事件检测提供了丰富的数据基础。
🎯 应用场景
AQUAIR数据集可应用于智能水产养殖系统的环境监测、预测和控制。研究人员可以利用该数据集开发预测模型,提前预警环境异常,优化饲养策略,降低能源消耗,从而提高水产养殖的效率和可持续性。此外,该数据集还可用于传感器漂移研究和数据驱动的机器学习课程。
📄 摘要(原文)
Smart aquaculture systems depend on rich environmental data streams to protect fish welfare, optimize feeding, and reduce energy use. Yet public datasets that describe the air surrounding indoor tanks remain scarce, limiting the development of forecasting and anomaly-detection tools that couple head-space conditions with water-quality dynamics. We therefore introduce AQUAIR, an open-access public dataset that logs six Indoor Environmental Quality (IEQ) variables--air temperature, relative humidity, carbon dioxide, total volatile organic compounds, PM2.5 and PM10--inside a fish aquaculture facility in Amghass, Azrou, Morocco. A single Awair HOME monitor sampled every five minutes from 14 October 2024 to 9 January 2025, producing more than 23,000 time-stamped observations that are fully quality-controlled and publicly archived on Figshare. We describe the sensor placement, ISO-compliant mounting height, calibration checks against reference instruments, and an open-source processing pipeline that normalizes timestamps, interpolates short gaps, and exports analysis-ready tables. Exploratory statistics show stable conditions (median CO2 = 758 ppm; PM2.5 = 12 micrograms/m3) with pronounced feeding-time peaks, offering rich structure for short-horizon forecasting, event detection, and sensor drift studies. AQUAIR thus fills a critical gap in smart aquaculture informatics and provides a reproducible benchmark for data-centric machine learning curricula and environmental sensing research focused on head-space dynamics in recirculating aquaculture systems.