Label-Guided Prompt for Multi-label Few-shot Aspect Category Detection

📄 arXiv: 2407.20673v1 📥 PDF

作者: ChaoFeng Guan, YaoHui Zhu, Yu Bai, LingYun Wang

分类: cs.CL, cs.AI

发布日期: 2024-07-30


💡 一句话要点

提出标签引导Prompt方法,解决多标签少样本Aspect Category Detection问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 多标签分类 少样本学习 方面类别检测 Prompt学习 自然语言处理

📋 核心要点

  1. 现有方法在多标签少样本Aspect Category Detection任务中,依赖关键词提取进行句子和类别表示,易受类别无关词干扰。
  2. 论文提出标签引导的Prompt方法,通过标签特定Prompt表示句子,并利用大语言模型生成包含类别特征的类别描述。
  3. 实验结果表明,该方法在两个公共数据集上优于现有方法,Macro-F1指标提升了3.86% - 4.75%。

📝 摘要(中文)

本文针对多标签少样本Aspect Category Detection任务,旨在有限的训练样本下识别句子中的多个方面类别。句子和类别的表示是该任务的关键。现有方法大多提取关键词来表示句子和类别,但句子中常包含许多与类别无关的词,导致基于关键词的方法性能欠佳。本文提出一种标签引导的Prompt方法来表示句子和类别。具体而言,我们设计了标签特定的Prompt,通过结合关键的上下文和语义信息来表示句子。此外,我们将标签引入Prompt中,利用大型语言模型获得类别描述。这种类别描述包含方面类别的特征,引导判别性类别原型的构建。在两个公共数据集上的实验结果表明,我们的方法优于当前最先进的方法,Macro-F1指标提升了3.86% - 4.75%。

🔬 方法详解

问题定义:论文旨在解决多标签少样本Aspect Category Detection问题。现有方法主要依赖提取关键词来表示句子和类别,但句子中包含大量与类别无关的词汇,导致表示不够准确,影响最终的检测性能。此外,如何有效利用少量样本进行学习也是一个挑战。

核心思路:论文的核心思路是利用Prompt技术,通过标签引导的方式,更有效地表示句子和类别。对于句子,设计标签特定的Prompt,融入上下文和语义信息,减少无关词的干扰。对于类别,利用大型语言模型生成包含类别特征的描述,从而构建更具判别性的类别原型。

技术框架:整体框架包含以下几个主要模块:1) 句子表示模块:使用标签特定的Prompt模板,将句子转化为Prompt形式,输入预训练语言模型(如BERT)得到句子表示。2) 类别描述生成模块:将类别标签作为Prompt输入大型语言模型,生成包含类别特征的描述文本。3) 类别原型构建模块:基于类别描述文本,构建类别原型向量。4) 分类模块:计算句子表示与类别原型之间的相似度,进行多标签分类。

关键创新:最重要的创新点在于标签引导的Prompt设计。传统方法直接提取关键词,容易受到噪声干扰。而本文通过标签引导,能够更精准地捕捉与类别相关的语义信息。此外,利用大型语言模型生成类别描述,能够有效利用先验知识,提升类别表示的质量。

关键设计:在句子表示模块,Prompt模板的设计至关重要,需要根据具体任务进行调整。类别描述生成模块,需要选择合适的预训练语言模型,并设计合适的Prompt形式。分类模块,可以使用余弦相似度等方法计算句子表示与类别原型之间的相似度。损失函数可以使用二元交叉熵损失函数,对每个标签进行独立预测。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该方法在两个公共数据集上取得了显著的性能提升。具体而言,在Macro-F1指标上,相比于当前最先进的方法,分别提升了3.86%和4.75%。这表明标签引导的Prompt方法能够更有效地表示句子和类别,从而提升多标签少样本Aspect Category Detection的性能。

🎯 应用场景

该研究成果可应用于情感分析、用户评论挖掘、产品特征提取等领域。例如,在电商平台上,可以自动识别用户评论中提到的产品特征(如“电池续航”、“屏幕显示效果”),从而帮助商家更好地了解用户需求,改进产品设计。该方法在少样本场景下的优势,使其在数据标注成本较高的实际应用中具有重要价值。

📄 摘要(原文)

Multi-label few-shot aspect category detection aims at identifying multiple aspect categories from sentences with a limited number of training instances. The representation of sentences and categories is a key issue in this task. Most of current methods extract keywords for the sentence representations and the category representations. Sentences often contain many category-independent words, which leads to suboptimal performance of keyword-based methods. Instead of directly extracting keywords, we propose a label-guided prompt method to represent sentences and categories. To be specific, we design label-specific prompts to represent sentences by combining crucial contextual and semantic information. Further, the label is introduced into a prompt to obtain category descriptions by utilizing a large language model. This kind of category descriptions contain the characteristics of the aspect categories, guiding the construction of discriminative category prototypes. Experimental results on two public datasets show that our method outperforms current state-of-the-art methods with a 3.86% - 4.75% improvement in the Macro-F1 score.