Iterative Definition Refinement for Zero-Shot Classification via LLM-Based Semantic Prototype Optimization

作者: Naeem Rehmat, Muhammad Saad Saeed, Ijaz Ul Haq, Khalid Malik

分类: cs.CV

发布日期: 2026-04-30

备注: Accepted at CVPR NeXD Workshop (2026)

🔗 代码/项目: GITHUB

💡 一句话要点

提出基于LLM语义原型优化的迭代定义精炼方法，提升零样本分类性能

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 零样本分类 类别定义优化 大型语言模型 迭代精炼 网络内容分类

📋 核心要点

现有零样本分类方法依赖于类别定义，但定义质量差会导致语义重叠和分类错误。
论文提出迭代定义精炼框架，利用LLM优化类别定义，无需训练即可提升分类性能。
实验表明，该方法在多个嵌入模型上均能有效提升分类准确率，证明定义质量的重要性。

📝 摘要（中文）

网络过滤系统依赖于准确的网络内容分类来阻止网络威胁、防止数据泄露和确保合规性。然而，由于现代网络动态和快速发展的特性，分类变得越来越困难。基于嵌入的零样本方法将内容和类别描述映射到共享的语义空间中，从而无需标记训练数据即可进行标签分配，但仍然对定义质量高度敏感。定义不明确或含糊不清会在嵌入空间中产生语义重叠，导致系统性错误分类。本文提出了一种无需训练的自适应迭代定义精炼框架，通过逐步优化类别定义而不是更新模型参数来改进零样本网络内容分类。使用LLM作为反馈驱动的定义优化器，我们研究了三种精炼策略，即示例引导、混淆感知和历史感知，每种策略都使用来自错误分类实例的结构化信号来精炼类别描述。此外，我们引入了一个人工标记的基准数据集，包含10个URL类别，每个类别1000个样本，并在13个最先进的嵌入基础模型上进行了评估。结果表明，迭代定义精炼能够持续提高各种架构的分类性能，从而确立了定义质量作为基于嵌入的系统中一个关键且未被充分探索的因素。该数据集可在https://github.com/naeemrehmat/B2MWT-10C上获取。

🔬 方法详解

问题定义：论文旨在解决零样本分类中，由于类别定义质量不高导致的分类性能下降问题。现有的基于嵌入的零样本方法对类别定义非常敏感，模糊或不准确的定义会导致语义空间中的重叠，从而导致分类错误。

核心思路：论文的核心思路是通过迭代地优化类别定义来提高零样本分类的准确性。作者没有直接训练模型参数，而是利用大型语言模型（LLM）作为反馈驱动的定义优化器，根据分类结果不断改进类别描述。

技术框架：整体框架包含以下几个主要步骤：1) 使用初始类别定义对样本进行零样本分类；2) 分析分类结果，识别被错误分类的样本；3) 利用LLM根据错误分类样本的特征，采用示例引导、混淆感知和历史感知等策略来优化类别定义；4) 使用优化后的类别定义重新进行分类，并重复步骤2和3，直到达到预定的迭代次数或性能收敛。

关键创新：该方法最重要的创新点在于将LLM引入到零样本分类的类别定义优化过程中，通过迭代精炼类别定义来提高分类性能，而无需训练模型参数。与传统的侧重于模型训练的方法不同，该方法关注于提高输入（类别定义）的质量。

关键设计：论文提出了三种不同的定义精炼策略：1) 示例引导：利用错误分类的样本作为示例，引导LLM生成更准确的类别定义；2) 混淆感知：考虑容易混淆的类别，引导LLM生成能够更好区分这些类别的定义；3) 历史感知：利用之前的迭代历史信息，避免重复之前的错误，并进一步优化定义。具体参数设置和损失函数未提及，网络结构方面，主要依赖于预训练的LLM。

🖼️ 关键图片

📊 实验亮点

实验结果表明，迭代定义精炼方法在13个最先进的嵌入模型上均能有效提升零样本分类性能。例如，在某些模型上，该方法可以将分类准确率提高5%以上。此外，论文还构建了一个包含10个URL类别，每个类别1000个样本的人工标注数据集，为零样本网络内容分类研究提供了新的基准。

🎯 应用场景

该研究成果可应用于各种需要快速适应新类别且缺乏标注数据的场景，例如：网络内容过滤、恶意软件检测、新闻分类、产品分类等。通过迭代优化类别定义，可以有效提高分类系统的准确性和鲁棒性，降低人工标注成本，并提升系统的自适应能力。

📄 摘要（原文）

Web filtering systems rely on accurate web content classification to block cyber threats, prevent data exfiltration, and ensure compliance. However, classification is increasingly difficult due to the dynamic and rapidly evolving nature of the modern web. Embedding-based zero-shot approaches map content and category descriptions into a shared semantic space, enabling label assignment without labeled training data, but remain highly sensitive to definition quality. Poorly specified or ambiguous definitions create semantic overlap in the embedding space, leading to systematic misclassification. In this paper, we propose a training-free, adaptive iterative definition refinement framework that improves zero-shot web content classification by progressively optimizing category definitions rather than updating model parameters. Using LLMs as feedback-driven definition optimizers, we investigate three refinement strategies namely example-guided, confusion-aware, and history-aware, each refining class descriptions using structured signals from misclassified instances. Furthermore, we introduce a human-labeled benchmark of 10 URL categories with 1,000 samples per class and evaluate across 13 state-of-the-art embedding foundation models. Results demonstrate that iterative definition refinement consistently improves classification performance across diverse architectures, establishing definition quality as a critical and underexplored factor in embedding-based systems. The dataset is available at https://github.com/naeemrehmat/B2MWT-10C.

Iterative Definition Refinement for Zero-Shot Classification via LLM-Based Semantic Prototype Optimization

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理