Slide Deck Q&A Quality Assurance App: A Multi-Stage Pipeline for Pedagogical Question Generation

📄 arXiv: 2605.26428v1 📥 PDF

作者: Jim Salsman

分类: cs.CL, cs.HC

发布日期: 2026-05-26

备注: 15 pages, 3 research questions, 1 figure, 1 table, 6 references, 2 appendices

🔗 代码/项目: GITHUB


💡 一句话要点

提出Slide Deck Q&A Quality Assurance系统,用于从幻灯片生成高质量教学问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 幻灯片问答 教学问题生成 大型语言模型 多模态学习 教育技术

📋 核心要点

  1. 现有方法难以从幻灯片中生成高质量教学问题,因为内容分散在文本和图像中,且问题需要连贯组织。
  2. Slide Deck Q&A Quality Assurance系统通过多阶段LLM流水线,综合考虑幻灯片模态和教学作用,生成高质量问题。
  3. 实验表明,该系统能够过滤非教学幻灯片,并为复杂视觉内容生成高保真、教学连贯的问题。

📝 摘要(中文)

本文介绍了一个名为Slide Deck Q&A Quality Assurance (slidesqaqa)的软件系统,该系统基于Flask框架,旨在从讲座幻灯片中生成高质量、具有教学意义的问题。由于重要的教学内容分散在文本和视觉元素中,且有用的问题必须在演示流程中进行组织,而不是孤立地逐张幻灯片生成,因此这项任务具有挑战性。该系统从PDF幻灯片中提取文本和渲染图像,并通过一个四阶段的大型语言模型流水线进行处理,包括窗口规划、内容整合、幻灯片注释和结果调和。系统综合考虑幻灯片模态和教学作用,分配有界的问题预算,并在内容整合阶段修改草稿注释,以减少冗余并提高覆盖率。最终输出是一个结构化的JSON注释,包含幻灯片级别的目标、章节结构、幻灯片级别的摘要、问题集和评估分数。在两个技术讲座幻灯片上的初步实验表明,该流水线可以过滤非教学幻灯片,并为视觉上复杂的内容生成高保真、具有教学连贯性的问题。

🔬 方法详解

问题定义:论文旨在解决从幻灯片中自动生成高质量、具有教学意义的问题的难题。现有方法通常孤立地处理每张幻灯片,忽略了幻灯片之间的上下文联系以及视觉信息,导致生成的问题缺乏连贯性和深度,难以有效辅助教学。

核心思路:论文的核心思路是采用多阶段的流水线,利用大型语言模型(LLM)对整个幻灯片进行全局理解和推理,从而生成更具教学价值的问题。通过综合考虑幻灯片的文本、图像以及它们在整个演示文稿中的位置,系统能够生成更连贯、更深入的问题,更好地促进学习。

技术框架:该系统采用一个四阶段的流水线:1) 窗口规划:确定需要关注的幻灯片窗口。2) 内容整合:将幻灯片中的文本和图像信息整合起来,形成对整个幻灯片内容的理解。3) 幻灯片注释:基于内容整合的结果,生成幻灯片级别的摘要和问题。4) 结果调和:对生成的问题进行调整和优化,以减少冗余并提高覆盖率。整个系统基于Flask框架实现。

关键创新:该系统的关键创新在于其多阶段的流水线设计,能够对幻灯片进行全局理解和推理,从而生成更具教学价值的问题。此外,系统还考虑了幻灯片的模态(文本和图像)和教学作用,并分配了问题预算,以确保生成的问题能够覆盖幻灯片中的关键知识点。

关键设计:系统使用大型语言模型(LLM)作为核心组件,用于内容理解、问题生成和结果调和。具体的LLM选择和参数设置在论文中未明确说明(未知)。系统还设计了一套评估指标,用于评估生成问题的质量,包括问题相关性、教学价值和覆盖率等(具体指标未知)。

📊 实验亮点

初步实验在两个技术讲座幻灯片上进行,结果表明该系统能够有效过滤非教学幻灯片,并为视觉上复杂的内容生成高保真、具有教学连贯性的问题。具体的性能数据(如问题质量评分、过滤准确率等)未在摘要中明确给出(未知)。

🎯 应用场景

该研究成果可应用于在线教育平台、企业培训系统等领域,帮助教师或培训师自动生成高质量的教学问题,提高教学效率和学习效果。此外,该系统还可以用于辅助学生自主学习,帮助他们更好地理解和掌握课程内容。未来,该技术有望进一步发展,实现个性化问题生成,根据学生的学习情况和知识水平,生成更具针对性的问题。

📄 摘要(原文)

Generating high-quality, pedagogically useful questions from lecture slide decks is difficult because important instructional content is distributed across both text and visual elements, and because useful questions must be scaffolded across the flow of a presentation rather than generated slide by slide in isolation. This paper describes Slide Deck Q\&A Quality Assurance (slidesqaqa), a Flask-based software system that extracts text and rendered images from PDF slides and processes them through a four-stage large language model pipeline comprising window planning, deck synthesis, slide annotation, and reconciliation. The system reasons jointly about slide modality and pedagogical role, allocates bounded question budgets, and revises draft annotations at the deck level to reduce redundancy and improve coverage. The final output is a structured JSON annotation containing deck-level goals, section structure, slide-level summaries, question sets, and evaluation scores. Initial experiments on two technical lecture decks indicate that the pipeline can filter non-instructional slides and produce high-fidelity, pedagogically coherent questions for visually complex content. The working system is at https://slidesqaqa-974767694043.us-west1.run.app The software repository is at https://github.com/blinding2submit/slidesqaqa