From Surface Learning to Deep Understanding: A Grounded AI Tutoring System for Moodle
作者: Anna Ostrowska, Michał Kukla, Gabriela Majstrak, Jan Opala, Sebastian Pergała, Jan Skwarek, Anna Wróblewska
分类: cs.HC, cs.AI, cs.CL, cs.IR
发布日期: 2026-05-07
备注: 5 pages, accepted as demo paper at IJCAI 2026
💡 一句话要点
提出基于检索增强生成(RAG)的Moodle AI教学助手,实现教育内容的精准溯源与苏格拉底式交互。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 检索增强生成 教育人工智能 苏格拉底教学法 人在回路 Moodle插件 大语言模型评估
📋 核心要点
- 核心问题:大语言模型在教育应用中存在幻觉风险,且缺乏对特定教学材料的深度整合,难以满足严谨的学术教学需求。
- 方法要点:构建基于RAG的模块化Moodle插件,通过教师监督的“人在回路”机制,将模型输出锚定在权威教材中,并采用苏格拉底式提问引导学习。
- 实验或效果:利用Ragas评估框架验证了系统的可靠性,忠实度得分达0.97,用户反馈显示其在辅助教学方面具有极高的实用价值。
📝 摘要(中文)
本文介绍了一款名为“AI教学与学习助手”的模块化Moodle插件。该系统利用检索增强生成(RAG)技术,旨在提供高质量且无幻觉的教育体验。系统采用双中心设计:一方面为学生提供基于苏格拉底教学法的交互式辅导,另一方面为教师提供“人在回路”(Human-in-the-loop)的工作空间,用于监督内容的生成。通过将大语言模型(LLM)的响应锚定在教师提供的教学材料中,该助手有效降低了信息误导风险,并促进了学生对概念的深度掌握。通过Ragas(LLM-as-a-Judge)框架评估及初步用户研究表明,该系统表现优异,忠实度得分高达0.97,推荐评分达到4.00/5.00。
🔬 方法详解
问题定义:论文旨在解决通用大语言模型在教育场景中因缺乏领域知识锚定而产生的“幻觉”问题,以及传统在线学习平台缺乏个性化、交互式辅导工具的痛点。
核心思路:引入检索增强生成(RAG)架构,将教师提供的课程材料作为唯一的知识源,确保模型回答的准确性与可追溯性,同时通过苏格拉底式交互策略提升学生的认知深度。
技术框架:系统架构分为三个核心模块:知识库检索模块(负责从Moodle课程资源中提取上下文)、LLM推理引擎(执行苏格拉底式对话逻辑)、以及教师监督工作台(支持对生成内容进行人工审核与修正)。
关键创新:实现了“人在回路”的教育内容生成闭环,将AI的生成能力与教师的专业知识权威性相结合,不仅解决了准确性问题,还通过苏格拉底式教学法将学习过程从被动接收转变为主动思考。
关键设计:系统采用了基于Ragas的自动化评估指标,重点优化了检索增强的忠实度(Faithfulness)与相关性,确保模型输出严格遵循教师提供的教学大纲与参考资料,避免了脱离教材的自由发挥。
🖼️ 关键图片
📊 实验亮点
实验通过Ragas框架对系统性能进行了量化评估,结果显示系统在回答忠实度(Faithfulness)指标上达到了0.97的高分,证明了其在抑制幻觉方面的卓越表现。初步用户研究中,系统获得了4.00/5.00的推荐评分,验证了其在实际教学环境中提升学生参与度与学习效果的潜力。
🎯 应用场景
该系统适用于各类高等教育及在线培训平台,特别是在需要严格遵循教学大纲、避免知识偏差的学科领域。其“人在回路”的设计使其成为教师辅助教学的有力工具,未来可扩展至大规模在线开放课程(MOOCs),实现个性化学习路径的自动生成与实时辅导。
📄 摘要(原文)
This demo paper describes the development of the AI Teaching \& Learning Assistant, a modular Moodle plugin that leverages Retrieval-Augmented Generation (RAG) to deliver high-quality, hallucination-free education. The system employs a dual-centric design, providing students with interactive, Socratic-based tutoring and educators with a "human-in-the-loop" workspace for supervised content generation. By grounding Large Language Model (LLM) responses in teacher-provided materials, the assistant addresses the risks of misinformation while encouraging deep conceptual mastery. Evaluation via the Ragas (LLM-as-a-Judge) framework and a preliminary user study confirms its effectiveness, achieving faithfulness scores up to 0.97 and a 4.00/5.00 recommendation rate.