COIVis: Eye tracking-based Visual Exploration of Concept Learning in MOOC Videos

📄 arXiv: 2512.06834v1 📥 PDF

作者: Zhiguang Zhou, Ruiqi Yu, Yuming Ma, Hao Ni, Guojun Li, Li Ye, Xiaoying Wang, Yize Li, Yong Wang

分类: cs.HC, cs.GR

发布日期: 2025-12-07

备注: 18pages, 5 figures


💡 一句话要点

提出COIVis以解决MOOC视频学习过程分析问题

🎯 匹配领域: 支柱八:物理动画 (Physics-based Animation) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 眼动追踪 可视分析 MOOC 学习过程 个性化教学 教育数据分析 概念学习

📋 核心要点

  1. 现有的分析方法如点击流日志和测验成绩无法深入了解学习者的瞬时认知状态,限制了教学效果的提升。
  2. COIVis通过眼动追踪技术提取课程概念,并将其与视频内容的时空结构对齐,提供概念级的学习过程分析。
  3. 通过案例研究,COIVis为教师提供了关于学习者学习模式的一致性和异常的有价值洞察,支持个性化干预。

📝 摘要(中文)

大规模开放在线课程(MOOCs)使高质量的教学变得可及,但缺乏面对面互动使得教师难以获取学生的反馈并提供有效的指导。传统的分析方法如点击流日志或测验成绩只能捕捉粗粒度的学习结果,无法深入了解学习者的瞬时认知状态。本研究提出了COIVis,一个基于眼动追踪的可视分析系统,支持对MOOC视频中学习过程的概念级探索。COIVis首先从多模态视频内容中提取课程概念,并将其与讲座的时间结构和屏幕空间对齐,定义了“关注概念”(COIs),将抽象概念锚定到特定的时空区域。通过眼动追踪指标计算出五个可解释的学习者状态特征,COIVis为教师提供了叙述性、多视图的可视化,帮助教师快速定位问题概念并比较不同的学习策略。通过案例研究和用户反馈访谈评估COIVis,结果表明该系统有效提供了学习模式的一致性和异常情况的洞察,从而支持及时的个性化干预和优化教学设计。

🔬 方法详解

问题定义:本论文旨在解决MOOC视频学习过程中教师难以获取学生反馈和深入分析学习状态的问题。现有方法主要依赖粗粒度的数据,无法捕捉学习者的瞬时认知状态。

核心思路:COIVis通过眼动追踪技术,将学习者的注视轨迹与课程概念相结合,提供更细致的学习过程分析。这种设计使得教师能够更好地理解学习者的认知状态和学习策略。

技术框架:COIVis的整体架构包括概念提取模块、眼动数据处理模块和可视化展示模块。首先,从视频内容中提取课程概念,然后将眼动数据转化为COI序列,最后通过多视图可视化展示学习者的状态特征。

关键创新:COIVis的主要创新在于将眼动追踪与概念级分析相结合,提供了五个可解释的学习者状态特征。这种方法与传统的粗粒度分析方法有本质区别,能够提供更深入的学习洞察。

关键设计:在技术细节上,COIVis使用了特定的眼动追踪指标来计算学习者的注意力、认知负荷、兴趣、偏好和同步性等特征,确保了分析的准确性和可解释性。具体的参数设置和损失函数设计在论文中进行了详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,COIVis能够有效识别学习者的学习模式一致性和异常情况,提供了比传统方法更深入的分析。通过两项案例研究,COIVis帮助教师快速定位问题概念,提升了教学干预的及时性和个性化程度。

🎯 应用场景

COIVis的潜在应用领域包括在线教育、个性化学习和教育数据分析等。通过提供对学习者认知状态的深入理解,教师可以更有效地调整教学策略,优化课程设计,从而提升学习效果。未来,该系统可能在教育技术领域产生深远影响,推动个性化学习的进步。

📄 摘要(原文)

Massive Open Online Courses (MOOCs) make high-quality instruction accessible. However, the lack of face-to-face interaction makes it difficult for instructors to obtain feedback on learners' performance and provide more effective instructional guidance. Traditional analytical approaches, such as clickstream logs or quiz scores, capture only coarse-grained learning outcomes and offer limited insight into learners' moment-to-moment cognitive states. In this study, we propose COIVis, an eye tracking-based visual analytics system that supports concept-level exploration of learning processes in MOOC videos. COIVis first extracts course concepts from multimodal video content and aligns them with the temporal structure and screen space of the lecture, defining Concepts of Interest (COIs), which anchor abstract concepts to specific spatiotemporal regions. Learners' gaze trajectories are transformed into COI sequences, and five interpretable learner-state features -- Attention, Cognitive Load, Interest, Preference, and Synchronicity -- are computed at the COI level based on eye tracking metrics. Building on these representations, COIVis provides a narrative, multi-view visualization enabling instructors to move from cohort-level overviews to individual learning paths, quickly locate problematic concepts, and compare diverse learning strategies. We evaluate COIVis through two case studies and in-depth user-feedback interviews. The results demonstrate that COIVis effectively provides instructors with valuable insights into the consistency and anomalies of learners' learning patterns, thereby supporting timely and personalized interventions for learners and optimizing instructional design.