The Theater Stage as Laboratory: Review of Real-Time Comedy LLM Systems for Live Performance

📄 arXiv: 2501.08474v1 📥 PDF

作者: Piotr Wojciech Mirowski, Boyd Branch, Kory Wallace Mathewson

分类: cs.CL

发布日期: 2025-01-14

备注: 8 pages, 1st Workshop on Computational Humor (CHum), COLING 2025


💡 一句话要点

评估实时喜剧LLM系统:剧场舞台作为AI喜剧的实验场所

🎯 匹配领域: 支柱六:视频提取与匹配 (Video Extraction)

关键词: 计算幽默 现场表演 即兴喜剧 人机协作 评估方法

📋 核心要点

  1. 现有计算幽默系统缺乏在真实场景,特别是现场表演中的有效评估,难以捕捉实时互动和观众反馈。
  2. 论文提出应在现场即兴喜剧表演中评估AI喜剧系统,利用剧场舞台作为实验场所,考察人机协作和观众反应。
  3. 通过分析AI融合的喜剧表演,揭示了机器人化身、喜剧时机和人类解读等关键挑战,为评估方法选择提供依据。

📝 摘要(中文)

本文回顾了近期关于幽默生成计算系统的学术和艺术作品,特别关注现场表演。我们认为,AI喜剧应该在现场条件下,在物理或在线空间中与观众互动,并在实时约束下进行评估。因此,即兴喜剧是部署和评估计算幽默系统的理想载体。通过成功的AI融合表演的例子,我们展示了现场表演对计算幽默生成提出了三个方面的挑战:1)机器人化身、拟人化以及人机竞争的问题;2)喜剧时机和观众互动性质的问题;3)人类对看似荒谬的AI生成幽默的解读问题。我们认为,这些问题影响了计算幽默评估方法选择,因为任何此类方法都需要适应现场观众和表演空间的限制。这些探讨也突出了人类喜剧演员与AI工具之间不同类型的协作关系。

🔬 方法详解

问题定义:现有计算幽默系统在实验室环境之外的真实场景,特别是现场表演中的评估不足。缺乏对实时互动、观众反馈以及人机协作的有效考量。现有方法难以捕捉喜剧的时机、节奏以及观众的即时反应,导致评估结果与实际应用效果存在偏差。

核心思路:将剧场舞台作为AI喜剧的实验场所,利用即兴喜剧的实时性和互动性,评估计算幽默系统在真实场景下的表现。通过观察观众的反应、分析人机协作模式,以及研究人类对AI生成幽默的解读,更全面地了解AI喜剧的优势和局限性。

技术框架:本文并非提出一个具体的AI系统框架,而是侧重于评估方法论。其核心在于将AI喜剧系统融入到现场即兴喜剧表演中,并从以下三个方面进行观察和分析:1) 机器人化身、拟人化以及人机竞争;2) 喜剧时机和观众互动;3) 人类对AI生成幽默的解读。通过这些观察,反思现有评估方法的不足,并为未来的评估方法设计提供指导。

关键创新:本文的创新之处在于评估视角和评估场景的转变。将评估环境从实验室转移到真实的剧场舞台,并强调现场表演的实时性和互动性。这种评估方式更贴近实际应用场景,能够更全面地反映AI喜剧系统的性能和潜力。

关键设计:本文没有涉及具体的参数设置或网络结构设计,而是侧重于评估框架的设计。关键在于如何将AI系统融入到现场表演中,以及如何收集和分析观众的反应数据。例如,可以通过问卷调查、访谈、面部表情识别等方式收集观众的反馈,并分析人机协作的模式和效果。

📊 实验亮点

本文通过分析多个AI融合的喜剧表演案例,揭示了现场表演对计算幽默生成提出的挑战,包括机器人化身、喜剧时机和人类解读等方面。这些案例为评估计算幽默系统提供了宝贵的经验和启示,并为未来的研究方向提供了指导。

🎯 应用场景

该研究成果可应用于开发更具互动性和适应性的AI喜剧系统,提升人机交互体验。潜在应用领域包括娱乐、教育、社交机器人等,例如,辅助喜剧演员进行创作,或为社交机器人提供幽默对话能力,从而增强其亲和力。

📄 摘要(原文)

In this position paper, we review the eclectic recent history of academic and artistic works involving computational systems for humor generation, and focus specifically on live performance. We make the case that AI comedy should be evaluated in live conditions, in front of audiences sharing either physical or online spaces, and under real-time constraints. We further suggest that improvised comedy is therefore the perfect substrate for deploying and assessing computational humor systems. Using examples of successful AI-infused shows, we demonstrate that live performance raises three sets of challenges for computational humor generation: 1) questions around robotic embodiment, anthropomorphism and competition between humans and machines, 2) questions around comedic timing and the nature of audience interaction, and 3) questions about the human interpretation of seemingly absurd AI-generated humor. We argue that these questions impact the choice of methodologies for evaluating computational humor, as any such method needs to work around the constraints of live audiences and performance spaces. These interrogations also highlight different types of collaborative relationship of human comedians towards AI tools.