Acquiring Common Chinese Emotional Events Using Large Language Model
作者: Ya Wang, Guangzheng Zhu, Cungen Cao, Jingjing Li, He Li, Xin Huang
分类: cs.CL
发布日期: 2025-11-07
备注: I am the second author (Guangzheng Zhu) and I am submitting this paper on behalf of all co-authors
💡 一句话要点
利用大型语言模型获取通用中文情感事件知识库,提升情感分析效果
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 情感事件 大型语言模型 知识库构建 情感分析 情感原因抽取
📋 核心要点
- 现有情感事件知识获取方法难以获得通用的、与上下文无关的情感事件,限制了情感分析等应用的效果。
- 利用中文大型语言模型,通过情感事件指示词提示生成情感事件,并训练过滤器保证生成质量,实现高效获取。
- 构建了包含102,218个高质量情感事件的中文通用情感事件知识库,并在情感原因抽取任务中验证了其有效性。
📝 摘要(中文)
情感事件知识对于提升各种应用的效果至关重要。然而,情感事件难以获取,特别是那些与上下文无关的通用情感事件。本文旨在获取中文通用情感事件,例如“中奖”和“被批评”。该方法首先收集全面的中文情感事件指示词列表,然后利用这些指示词提示中文大型语言模型(LLM)生成情感事件。为了保证情感事件的质量,训练一个过滤器来丢弃无效的生成结果。同时,使用不同的技术将这些情感事件分类为积极事件和消极事件。最终,获得了总共102,218个高质量的带有情感极性标签的通用情感事件,这是唯一的中文大规模通用情感事件常识知识库。内在评估结果表明,本文提出的方法可以有效地用于获取通用中文情感事件。外在用例也证明了通用情感事件在情感原因抽取(ECE)领域的强大潜力。相关资源,包括情感事件指示词和情感事件,将在本文发表后发布。
🔬 方法详解
问题定义:论文旨在解决中文通用情感事件知识库构建的问题。现有方法难以有效获取此类知识,因为通用情感事件需要具备上下文无关的特性,而传统方法往往依赖于特定语境或人工标注,成本高且覆盖面有限。因此,如何高效、自动地构建大规模的中文通用情感事件知识库是一个挑战。
核心思路:论文的核心思路是利用大型语言模型(LLM)的强大生成能力,结合情感事件指示词,自动生成大量候选情感事件。通过训练过滤器来筛选高质量的情感事件,并进行情感极性分类,最终构建高质量的知识库。这种方法能够显著降低人工成本,并扩大知识库的规模。
技术框架:整体框架包含三个主要阶段:1) 情感事件指示词收集:构建一个全面的中文情感事件指示词列表。2) 情感事件生成:使用指示词提示LLM生成候选情感事件。3) 情感事件过滤与分类:训练过滤器去除无效事件,并对剩余事件进行情感极性分类(积极或消极)。最终得到高质量的中文通用情感事件知识库。
关键创新:关键创新在于利用LLM的生成能力,结合情感事件指示词,实现自动化、大规模的情感事件知识获取。与传统方法相比,该方法无需大量人工标注,能够显著降低成本并提高效率。此外,训练过滤器保证了生成事件的质量,避免了LLM生成内容的随意性。
关键设计:情感事件指示词的选择至关重要,需要覆盖各种情感类别和场景。LLM的提示工程需要精心设计,以引导模型生成符合要求的事件描述。过滤器的训练需要使用标注数据,以区分有效和无效的生成结果。情感极性分类可以使用现有的情感分析模型或规则方法。
📊 实验亮点
论文构建了一个包含102,218个高质量中文通用情感事件的知识库,这是目前唯一的中文大规模情感事件常识知识库。实验结果表明,该方法能够有效获取高质量的情感事件,并在情感原因抽取任务中表现出强大的潜力,验证了知识库的有效性。
🎯 应用场景
该研究成果可广泛应用于情感分析、情感原因抽取、对话系统、舆情监控等领域。高质量的中文通用情感事件知识库能够提升这些应用的情感理解能力,使其能够更准确地识别和理解用户的情感状态,从而提供更智能、更个性化的服务。未来,该知识库还可以用于构建更复杂的情感推理系统。
📄 摘要(原文)
Knowledge about emotional events is an important kind of knowledge which has been applied to improve the effectiveness of different applications. However, emotional events cannot be easily acquired, especially common or generalized emotional events that are context-independent. The goal of this paper is to obtain common emotional events in Chinese language such as "win a prize" and "be criticized". Our approach begins by collecting a comprehensive list of Chinese emotional event indicators. Then, we generate emotional events by prompting a Chinese large language model (LLM) using these indicators. To ensure the quality of these emotional events, we train a filter to discard invalid generated results. We also classify these emotional events as being positive events and negative events using different techniques. Finally, we harvest a total of 102,218 high-quality common emotional events with sentiment polarity labels, which is the only large-scale commonsense knowledge base of emotional events in Chinese language. Intrinsic evaluation results show that the proposed method in this paper can be effectively used to acquire common Chinese emotional events. An extrinsic use case also demonstrates the strong potential of common emotional events in the field of emotion cause extraction (ECE). Related resources including emotional event indicators and emotional events will be released after the publication of this paper.