Characterizing the Investigative Methods of Fictional Detectives with Large Language Models

📄 arXiv: 2505.07601v1 📥 PDF

作者: Edirlei Soares de Lima, Marco A. Casanova, Bruno Feijó, Antonio L. Furtado

分类: cs.CL, cs.AI

发布日期: 2025-05-12


💡 一句话要点

利用大型语言模型刻画虚构侦探的调查方法,为计算叙事学提供可扩展的角色分析框架。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 计算叙事学 角色分析 虚构侦探 自动化叙事 文本理解 特征提取

📋 核心要点

  1. 现有文学研究对侦探角色的分析缺乏可扩展性,难以提取用于指导叙事生成的独特特征。
  2. 论文提出一种AI驱动的方法,利用大型语言模型提取、综合和验证虚构侦探的调查特征。
  3. 实验结果表明,该方法能够有效捕捉不同侦探的独特调查方法,准确率达到91.43%。

📝 摘要(中文)

侦探小说以其复杂的叙事结构和角色驱动的故事情节为特征,对计算叙事学提出了独特的挑战。计算叙事学是一个致力于将文学理论融入自动化叙事生成的研究领域。虽然传统的文学研究对虚构侦探的方法和原型提供了深刻的见解,但这些分析通常侧重于有限数量的角色,并且缺乏提取独特特征的可扩展性,而这些特征可以用于指导叙事生成方法。在本文中,我们提出了一种AI驱动的方法,用于系统地刻画虚构侦探的调查方法。我们的多阶段工作流程探索了15个大型语言模型(LLM)的能力,以提取、综合和验证虚构侦探的独特调查特征。该方法在一组不同的七位标志性侦探身上进行了测试——赫尔克里·波洛、夏洛克·福尔摩斯、威廉·默多克、科伦坡、布朗神父、马普尔小姐和奥古斯特·杜宾——捕捉了定义每个角色的独特调查风格。识别出的特征经过了现有文学分析的验证,并在反向识别阶段进行了进一步测试,总体准确率达到91.43%,证明了该方法在捕捉每个侦探的独特调查方法方面的有效性。这项工作通过提供一个可扩展的角色分析框架,为更广泛的计算叙事学领域做出了贡献,并具有在AI驱动的交互式故事讲述和自动化叙事生成中的潜在应用。

🔬 方法详解

问题定义:论文旨在解决计算叙事学中角色分析的可扩展性问题。现有方法主要依赖人工分析,无法处理大规模的角色数据,难以提取出足够细粒度的角色特征,从而限制了AI在叙事生成中的应用。

核心思路:论文的核心思路是利用大型语言模型(LLMs)的强大文本理解和生成能力,自动化地从文本中提取和分析虚构侦探的调查方法。通过多阶段的工作流程,LLMs能够识别、综合和验证侦探角色的独特特征,从而构建可用于叙事生成的角色画像。

技术框架:该方法采用多阶段工作流程,主要包括以下几个阶段: 1. 特征提取:使用LLMs从侦探小说文本中提取侦探的调查方法和相关特征。 2. 特征综合:对提取的特征进行整理和归纳,形成对侦探角色的初步描述。 3. 特征验证:将提取的特征与现有的文学分析进行对比,验证其准确性和一致性。 4. 反向识别:使用提取的特征来识别侦探角色,进一步评估特征的区分度。

关键创新:该方法最重要的创新点在于将大型语言模型应用于角色分析,实现了角色特征提取的自动化和可扩展性。与传统的人工分析方法相比,该方法能够处理更大规模的数据,提取更细粒度的特征,并能够自动验证特征的准确性。

关键设计:论文使用了15个不同的LLMs,并对每个LLM进行了微调,以提高其在角色分析任务中的性能。在特征验证阶段,论文采用了多种指标来评估特征的准确性和区分度,包括准确率、召回率和F1值。反向识别阶段使用了分类模型,根据提取的特征来预测侦探角色。

📊 实验亮点

实验结果表明,该方法能够有效捕捉不同侦探的独特调查方法,总体准确率达到91.43%。反向识别实验进一步验证了提取特征的区分度,证明了该方法在角色分析方面的有效性。该方法为计算叙事学提供了一个可扩展的角色分析框架。

🎯 应用场景

该研究成果可应用于AI驱动的交互式故事讲述和自动化叙事生成。通过构建详细的角色画像,AI系统可以生成更真实、更引人入胜的故事,并能够根据用户的选择和互动,动态地调整故事情节和角色行为。此外,该方法还可用于分析其他类型的虚构角色,甚至可以应用于现实世界中的人物分析。

📄 摘要(原文)

Detective fiction, a genre defined by its complex narrative structures and character-driven storytelling, presents unique challenges for computational narratology, a research field focused on integrating literary theory into automated narrative generation. While traditional literary studies have offered deep insights into the methods and archetypes of fictional detectives, these analyses often focus on a limited number of characters and lack the scalability needed for the extraction of unique traits that can be used to guide narrative generation methods. In this paper, we present an AI-driven approach for systematically characterizing the investigative methods of fictional detectives. Our multi-phase workflow explores the capabilities of 15 Large Language Models (LLMs) to extract, synthesize, and validate distinctive investigative traits of fictional detectives. This approach was tested on a diverse set of seven iconic detectives - Hercule Poirot, Sherlock Holmes, William Murdoch, Columbo, Father Brown, Miss Marple, and Auguste Dupin - capturing the distinctive investigative styles that define each character. The identified traits were validated against existing literary analyses and further tested in a reverse identification phase, achieving an overall accuracy of 91.43%, demonstrating the method's effectiveness in capturing the distinctive investigative approaches of each detective. This work contributes to the broader field of computational narratology by providing a scalable framework for character analysis, with potential applications in AI-driven interactive storytelling and automated narrative generation.