SAGA: A Participant-specific Examination of Story Alternatives and Goal Applicability for a Deeper Understanding of Complex Events

📄 arXiv: 2408.05793v1 📥 PDF

作者: Sai Vallurupalli, Katrin Erk, Francis Ferraro

分类: cs.CL

发布日期: 2024-08-11

备注: Accepted to Findings of the Association for Computational Linguistics 2024


💡 一句话要点

SAGA:通过参与者视角的故事替代方案和目标适用性,深入理解复杂事件

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 故事理解 事件推理 目标驱动行为 知识获取 参与者视角

📋 核心要点

  1. 理解复杂事件需要对参与者的目标驱动行为进行推理,现有方法难以有效获取相关知识。
  2. 论文提出一种基于参与者成就视角的知识获取方法,通过分析故事替代方案和目标适用性来理解事件。
  3. 实验表明,在收集的数据集上微调的小模型性能优于大型语言模型,验证了该方法的有效性。

📝 摘要(中文)

理解和评估目标驱动的行为对于理解和推理复杂事件至关重要。获取这种理解所需的知识非常重要,但也具有挑战性。我们认为,可以通过参与者成就的视角来引出这些知识。我们根据叙述中参与者的预期成就、参与者可能的未来行为以及目标成功的可能性来分析叙述中的复杂事件。我们收集了6.3K高质量的目标和行动注释,反映了我们提出的参与者成就视角,平均加权Fleiss-Kappa IAA为80%。我们的集合包含每个叙述的注释替代版本。这些替代版本与“原始”故事略有不同,但可以产生截然不同的推论。我们的研究结果表明,虽然现代大型语言模型可以反映我们研究的某些基于目标的知识,但它们发现很难完全捕捉到协同行动背后的设计和意图,即使模型预训练包括了我们从中提取目标知识的数据。我们表明,在我们数据集上微调的较小模型可以实现超越大型模型的性能。

🔬 方法详解

问题定义:现有方法在理解复杂事件时,难以有效获取参与者的目标、意图以及行动背后的知识。大型语言模型虽然具备一定的推理能力,但难以完全捕捉到协同行动背后的设计和意图。这导致模型在理解故事的细微变化以及进行相关推断时表现不佳。

核心思路:论文的核心思路是通过分析故事中参与者的目标和行动,以及故事的替代版本,来显式地建模参与者的意图和目标。通过比较原始故事和略有不同的替代版本,可以揭示哪些行动对于实现特定目标至关重要,从而更深入地理解复杂事件。这种方法强调了参与者在事件中的作用,并利用故事的变体来突出因果关系。

技术框架:该研究主要集中在数据集的构建和分析上。首先,研究人员设计了一套标注方案,用于标注故事中参与者的目标、行动以及目标成功的可能性。然后,他们收集了包含原始故事和替代版本的数据集,并邀请标注人员对这些故事进行标注。最后,他们使用标注的数据集来训练和评估语言模型,并分析模型的表现。

关键创新:该研究的关键创新在于提出了基于参与者成就视角的知识获取方法,并构建了一个包含故事替代版本的高质量数据集。通过分析故事的替代版本,可以更清晰地揭示参与者的意图和目标,从而提高模型对复杂事件的理解能力。此外,该研究还表明,在特定数据集上微调的小模型可以超越大型模型的性能,这为知识获取和模型训练提供了一种新的思路。

关键设计:数据集包含原始故事和略有不同的替代版本,这些替代版本旨在改变故事中某些事件的结果,从而影响参与者的目标实现。标注方案包括标注参与者的目标、行动以及目标成功的可能性。研究人员使用了Fleiss-Kappa系数来评估标注的一致性,并确保数据的质量。在模型训练方面,研究人员使用了标准的语言模型架构,并在收集的数据集上进行了微调。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

该研究构建了一个包含6.3K高质量目标和行动注释的数据集,平均加权Fleiss-Kappa IAA为80%。实验结果表明,在收集的数据集上微调的小模型可以超越大型语言模型的性能。例如,在特定任务上,微调的小模型比未经过微调的大型模型性能提升了显著百分比(具体数值未知)。

🎯 应用场景

该研究成果可应用于故事理解、事件推理、智能对话等领域。例如,可以利用该方法构建更智能的对话系统,使其能够更好地理解用户的意图,并生成更自然、更相关的回复。此外,该方法还可以用于分析新闻报道、法律文件等复杂文本,从而提高信息提取和知识发现的效率。

📄 摘要(原文)

Interpreting and assessing goal driven actions is vital to understanding and reasoning over complex events. It is important to be able to acquire the knowledge needed for this understanding, though doing so is challenging. We argue that such knowledge can be elicited through a participant achievement lens. We analyze a complex event in a narrative according to the intended achievements of the participants in that narrative, the likely future actions of the participants, and the likelihood of goal success. We collect 6.3K high quality goal and action annotations reflecting our proposed participant achievement lens, with an average weighted Fleiss-Kappa IAA of 80%. Our collection contains annotated alternate versions of each narrative. These alternate versions vary minimally from the "original" story, but can license drastically different inferences. Our findings suggest that while modern large language models can reflect some of the goal-based knowledge we study, they find it challenging to fully capture the design and intent behind concerted actions, even when the model pretraining included the data from which we extracted the goal knowledge. We show that smaller models fine-tuned on our dataset can achieve performance surpassing larger models.