DualCoTs: Dual Chain-of-Thoughts Prompting for Sentiment Lexicon Expansion of Idioms

📄 arXiv: 2409.17588v1 📥 PDF

作者: Fuqiang Niu, Minghuan Tan, Bowen Zhang, Min Yang, Ruifeng Xu

分类: cs.CL

发布日期: 2024-09-26


💡 一句话要点

提出DualCoTs方法,利用双重思维链提示扩展成语情感词典。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 成语情感分析 情感词典扩展 大型语言模型 思维链提示 自然语言处理

📋 核心要点

  1. 现有成语情感分析语料库不足,限制了文本情感分析研究的深入开展。
  2. 提出DualCoTs方法,结合语言学和心理语言学,利用大型语言模型进行成语情感词典的自动扩展。
  3. 实验结果表明,DualCoTs方法在中文和英文成语情感词典扩展任务中表现有效。

📝 摘要(中文)

成语是日常交流中表达情感的常用方式,因此对成语情感的细致分析对于全面理解真实文本中的情感表达至关重要。然而,现有的成语情感分析语料库在很大程度上限制了文本情感分析的研究。本文提出了一种创新的方法,通过应用思维链提示,利用大型语言模型自动扩展成语的情感词典。为了证明该方法的有效性,我们整合了多个现有资源,构建了一个情感成语词典扩展数据集(EmoIdiomE),其中包含中文和英文成语的综合库。然后,我们设计了双重思维链(DualCoTs)方法,该方法结合了语言学和心理语言学的见解,以证明使用大型模型自动扩展成语情感词典的有效性。实验表明,DualCoTs在中文和英文的成语情感词典扩展中均有效。为了可重复性,我们将在接受后发布数据和代码。

🔬 方法详解

问题定义:论文旨在解决成语情感词典规模有限的问题。现有方法要么依赖人工标注,成本高昂且难以覆盖所有成语;要么依赖简单的规则或统计方法,准确率较低,无法捕捉成语情感的细微差别。

核心思路:论文的核心思路是利用大型语言模型(LLM)的强大推理能力,通过思维链(Chain-of-Thoughts, CoT)提示,引导LLM模拟人类专家进行成语情感分析的过程,从而自动生成高质量的情感标签。DualCoTs进一步结合了语言学和心理语言学的知识,提升了LLM推理的准确性和可靠性。

技术框架:DualCoTs方法包含以下主要步骤: 1. 数据准备:构建包含中英文成语的数据集EmoIdiomE,作为LLM进行情感分析的基础。 2. 提示工程:设计双重思维链提示(DualCoTs),包括两个并行的CoT分支,分别从语言学和心理语言学的角度分析成语的情感。 3. LLM推理:将带有DualCoTs提示的成语输入LLM,LLM生成包含情感分析过程的推理链。 4. 情感标签提取:从LLM生成的推理链中提取最终的情感标签。 5. 词典扩展:将带有情感标签的成语添加到情感词典中,完成词典的扩展。

关键创新:DualCoTs方法的关键创新在于: 1. 双重思维链:结合语言学和心理语言学,从多个角度分析成语情感,提升了LLM推理的准确性和鲁棒性。 2. 自动化扩展:无需人工标注,即可自动扩展成语情感词典,降低了成本,提高了效率。 3. 利用LLM的推理能力:充分利用LLM的知识和推理能力,生成高质量的情感标签。

关键设计:DualCoTs的关键设计包括: 1. 语言学CoT:提示LLM从成语的字面意义、语法结构等方面分析其情感。 2. 心理语言学CoT:提示LLM从成语的文化背景、社会认知等方面分析其情感。 3. 提示词的选择:精心设计提示词,引导LLM进行有效的推理。 4. 情感标签的提取规则:设计清晰的规则,从LLM生成的推理链中准确提取情感标签。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,DualCoTs方法在成语情感词典扩展任务中取得了显著的性能提升。与现有方法相比,DualCoTs能够生成更准确的情感标签,扩展后的词典质量更高。具体性能数据(例如准确率、召回率等)和对比基线将在论文发表后公布。

🎯 应用场景

该研究成果可应用于情感分析、舆情监控、智能对话系统等领域。扩展后的成语情感词典能够提升机器对文本情感的理解能力,从而提高相关应用的效果。例如,在舆情监控中,能够更准确地识别和分析包含成语的文本的情感倾向,及时发现和预警潜在的舆情风险。在智能对话系统中,能够更自然地理解用户的情感表达,从而提供更贴心的服务。

📄 摘要(原文)

Idioms represent a ubiquitous vehicle for conveying sentiments in the realm of everyday discourse, rendering the nuanced analysis of idiom sentiment crucial for a comprehensive understanding of emotional expression within real-world texts. Nevertheless, the existing corpora dedicated to idiom sentiment analysis considerably limit research in text sentiment analysis. In this paper, we propose an innovative approach to automatically expand the sentiment lexicon for idioms, leveraging the capabilities of large language models through the application of Chain-of-Thought prompting. To demonstrate the effectiveness of this approach, we integrate multiple existing resources and construct an emotional idiom lexicon expansion dataset (called EmoIdiomE), which encompasses a comprehensive repository of Chinese and English idioms. Then we designed the Dual Chain-of-Thoughts (DualCoTs) method, which combines insights from linguistics and psycholinguistics, to demonstrate the effectiveness of using large models to automatically expand the sentiment lexicon for idioms. Experiments show that DualCoTs is effective in idioms sentiment lexicon expansion in both Chinese and English. For reproducibility, we will release the data and code upon acceptance.