Robust and Label-Efficient Deep Waste Detection
作者: Hassan Abid, Khan Muhammad, Muhammad Haris Khan
分类: cs.CV
发布日期: 2025-08-26 (更新: 2025-09-08)
备注: Accepted at BMVC 2025
🔗 代码/项目: GITHUB
💡 一句话要点
提出基于集成的半监督学习框架以提升废物检测效率
🎯 匹配领域: 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 废物检测 半监督学习 目标检测 集成学习 数据集 深度学习 可持续发展
📋 核心要点
- 现有的废物检测方法依赖于有限的数据集和传统的目标检测器,导致性能不足。
- 本文提出了一种基于集成的半监督学习框架,结合了空间和共识加权的伪标记策略。
- 在ZeroWaste-s子集上应用该方法后,性能提升超过了完全监督训练,达到了51.6 mAP的新基线。
📝 摘要(中文)
有效的废物分类对可持续回收至关重要,但由于数据集有限和依赖传统目标检测器,AI在该领域的研究仍落后于商业系统。本文通过建立强基线和引入基于集成的半监督学习框架,推动了AI驱动的废物检测。我们首先在真实世界的ZeroWaste数据集上基准测试了最先进的开放词汇目标检测(OVOD)模型,发现仅使用类提示的效果较差,而优化的提示显著提高了零样本准确率。接着,我们微调现代基于变换器的检测器,达到了51.6 mAP的新基线。最后,我们提出了一种软伪标记策略,通过空间和共识加权融合集成预测,实现了稳健的半监督训练。我们的工作为研究社区提供了严格的基线,建立了强大的伪标记管道,并为未标记的ZeroWaste-s子集生成了高质量注释。
🔬 方法详解
问题定义:本文旨在解决废物检测领域中由于数据集有限和传统检测器依赖导致的性能不足问题。现有方法在实际应用中面临准确性和效率的挑战。
核心思路:论文提出了一种基于集成的半监督学习框架,通过优化提示和伪标记策略来提升检测性能,旨在减少对标注数据的依赖。
技术框架:整体架构包括三个主要阶段:首先基准测试OVOD模型,其次微调变换器检测器,最后应用伪标记策略进行半监督训练。
关键创新:最重要的创新在于提出了一种软伪标记策略,利用空间和共识加权融合集成预测,显著提升了模型在未标记数据上的表现。
关键设计:在模型训练中,采用了优化的提示设计和新的损失函数,以适应特定的废物检测任务,确保了模型的鲁棒性和准确性。
📊 实验亮点
实验结果显示,基于集成的半监督学习框架在ZeroWaste-s子集上取得了超过51.6 mAP的性能,显著优于完全监督训练的结果,展示了该方法在实际应用中的有效性和可扩展性。
🎯 应用场景
该研究的潜在应用领域包括城市垃圾分类、废物管理和可持续发展等。通过提高废物检测的准确性和效率,能够促进资源的回收利用,减少环境污染,具有重要的实际价值和社会影响。未来,该方法还可扩展到其他领域的物体检测任务。
📄 摘要(原文)
Effective waste sorting is critical for sustainable recycling, yet AI research in this domain continues to lag behind commercial systems due to limited datasets and reliance on legacy object detectors. In this work, we advance AI-driven waste detection by establishing strong baselines and introducing an ensemble-based semi-supervised learning framework. We first benchmark state-of-the-art Open-Vocabulary Object Detection (OVOD) models on the real-world ZeroWaste dataset, demonstrating that while class-only prompts perform poorly, LLM-optimized prompts significantly enhance zero-shot accuracy. Next, to address domain-specific limitations, we fine-tune modern transformer-based detectors, achieving a new baseline of 51.6 mAP. We then propose a soft pseudo-labeling strategy that fuses ensemble predictions using spatial and consensus-aware weighting, enabling robust semi-supervised training. Applied to the unlabeled ZeroWaste-s subset, our pseudo-annotations achieve performance gains that surpass fully supervised training, underscoring the effectiveness of scalable annotation pipelines. Our work contributes to the research community by establishing rigorous baselines, introducing a robust ensemble-based pseudo-labeling pipeline, generating high-quality annotations for the unlabeled ZeroWaste-s subset, and systematically evaluating OVOD models under real-world waste sorting conditions. Our code is available at: https://github.com/h-abid97/robust-waste-detection.