Towards LLM-Empowered Knowledge Tracing via LLM-Student Hierarchical Behavior Alignment in Hyperbolic Space

📄 arXiv: 2602.22879 📥 PDF

作者: Xingcheng Fu, Shengpeng Wang, Yisen Gao, Xianxian Li, Chunpei Li, Qingyun Sun, Dongran Yu

分类: cs.AI

发布日期: 2026-02-28


💡 一句话要点

提出L-HAKT,利用LLM和双曲空间对齐学生行为,提升知识追踪效果。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 知识追踪 大语言模型 双曲空间 对比学习 层级结构

📋 核心要点

  1. 现有知识追踪方法难以捕捉认知状态的层级演化和个体化问题难度感知。
  2. L-HAKT利用LLM构建知识点层级依赖,并用双曲空间对齐合成与真实数据。
  3. 实验表明,L-HAKT在多个数据集上有效提升了知识追踪的性能。

📝 摘要(中文)

知识追踪(KT)旨在通过持续监测学习状态来诊断学生对概念的掌握程度。现有方法主要关注基于ID或文本的行为序列。然而,这些方法依赖于ID序列或浅层文本特征,难以捕捉(1)认知状态的层级演化和(2)由于有限的语义建模而导致的个体化问题难度感知。因此,本文提出了一种基于大语言模型双曲对齐的知识追踪(L-HAKT)方法。首先,教师代理深入解析问题语义,显式构建知识点的层级依赖关系;学生代理模拟学习行为以生成合成数据。然后,在双曲空间中对合成数据和真实数据进行对比学习,以减少问题难度和遗忘模式等关键特征的分布差异。最后,通过优化双曲曲率,我们显式地建模知识点的树状层级结构,精确地表征不同层级知识点的学习曲线形态差异。在四个真实世界教育数据集上的大量实验验证了我们的大语言模型双曲对齐知识追踪(L-HAKT)框架的有效性。

🔬 方法详解

问题定义:现有知识追踪方法主要依赖于ID或浅层文本特征,无法充分捕捉知识点之间的层级关系以及学生对问题难度的个体化感知。这导致了对学生认知状态评估的不准确,影响了知识追踪的有效性。

核心思路:L-HAKT的核心思路是利用大语言模型(LLM)来增强对问题语义的理解,并显式地建模知识点之间的层级依赖关系。通过在双曲空间中对齐合成数据和真实数据,可以减少分布差异,从而提高知识追踪的准确性。

技术框架:L-HAKT框架包含以下几个主要模块:1) 教师代理:利用LLM解析问题语义,构建知识点的层级依赖关系。2) 学生代理:模拟学生的学习行为,生成合成数据。3) 双曲空间对齐:在双曲空间中进行对比学习,对齐合成数据和真实数据,减少分布差异。4) 双曲曲率优化:通过优化双曲曲率,显式地建模知识点的树状层级结构。

关键创新:L-HAKT的关键创新在于:1) 利用LLM进行知识点层级关系的建模,克服了传统方法对知识点之间关系的忽略。2) 采用双曲空间进行数据对齐,更好地捕捉了知识点之间的层级结构和学生行为的复杂关系。3) 通过优化双曲曲率,显式地建模了知识点的树状层级结构,提高了知识追踪的准确性。

关键设计:在教师代理中,使用了LLM来解析问题语义,并根据知识点的相关性构建层级依赖关系。在双曲空间对齐中,使用了对比学习损失函数来最小化合成数据和真实数据之间的距离。双曲曲率的优化目标是使得知识点之间的距离能够反映其层级关系。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

L-HAKT在四个真实世界教育数据集上进行了广泛的实验,结果表明L-HAKT显著优于现有的知识追踪方法。具体的性能提升数据在论文中给出,证明了L-HAKT在知识追踪任务中的有效性。

🎯 应用场景

L-HAKT可应用于在线教育平台、智能辅导系统等领域,能够更准确地评估学生的知识掌握程度,并提供个性化的学习建议。该研究有助于提升在线教育的智能化水平,提高学生的学习效率和效果,并为未来的自适应学习系统提供技术支持。

📄 摘要(原文)

Knowledge Tracing (KT) diagnoses students' concept mastery through continuous learning state monitoring inthis http URLmethods primarily focus on studying behavioral sequences based on ID or textualthis http URLexisting methods rely on ID-based sequences or shallow textual features, they often fail to capture (1) the hierarchical evolution of cognitive states and (2) individualized problem difficulty perception due to limited semantic modeling. Therefore, this paper proposes a Large Language Model Hyperbolic Aligned Knowledge Tracing(L-HAKT). First, the teacher agent deeply parses question semantics and explicitly constructs hierarchical dependencies of knowledge points; the student agent simulates learning behaviors to generate synthetic data. Then, contrastive learning is performed between synthetic and real data in hyperbolic space to reduce distribution differences in key features such as question difficulty and forgetting patterns. Finally, by optimizing hyperbolic curvature, we explicitly model the tree-like hierarchical structure of knowledge points, precisely characterizing differences in learning curve morphology for knowledge points at different levels. Extensive experiments on four real-world educational datasets validate the effectiveness of our Large Language Model Hyperbolic Aligned Knowledge Tracing (L-HAKT) framework.