CurricuLLM: Designing Personalized and Workforce-Aligned Cybersecurity Curricula Using Fine-Tuned LLMs

📄 arXiv: 2601.04940v1 📥 PDF

作者: Arthur Nijdam, Harri Kähkönen, Valtteri Niemi, Paul Stankovski Wagner, Sara Ramezanian

分类: cs.CR, cs.AI

发布日期: 2026-01-08


💡 一句话要点

CurricuLLM:利用微调LLM设计个性化、符合行业需求的网络安全课程

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 网络安全课程 大型语言模型 自动化课程设计 BERT模型 自然语言处理

📋 核心要点

  1. 现有网络安全课程设计耗时费力,难以跟上快速演进的网络安全威胁,导致毕业生技能与行业需求脱节。
  2. CurricuLLM利用微调的大型语言模型,自动化网络安全课程设计与分析,实现个性化和行业对齐的课程。
  3. 通过专家验证,CurricuLLM能够有效替代人工课程分析,并能根据岗位需求调整课程内容,提升学生就业竞争力。

📝 摘要(中文)

面对日益增长的数字化和新型网络安全威胁,网络安全领域正不断发展。然而,网络安全课程往往无法使毕业生掌握劳动力市场所需的技能,尤其是在网络安全领域的最新发展方面,因为课程设计成本高且劳动密集。为了解决这种不匹配问题,我们提出了一个基于大型语言模型(LLM)的创新框架CurricuLLM,用于自动化设计和分析网络安全课程。我们的方法提供了三个关键贡献:(1)自动化个性化课程设计,(2)与行业需求对齐的数据驱动流程,以及(3)一种利用微调LLM进行课程开发的综合方法。CurricuLLM采用双层方法,包括用于标准化输入数据的PreprocessLM和用于将课程内容分配到网络安全九个知识领域的ClassifyLM。我们系统地评估了多种自然语言处理(NLP)架构和微调策略,最终选择Bidirectional Encoder Representations from Transformers(BERT)模型作为ClassifyLM,并在基础网络安全概念和劳动力能力上进行了微调。我们是第一个通过分析真实世界网络安全课程和框架的人工专家来验证我们的方法,这证明CurricuLLM是替代劳动密集型课程分析的有效解决方案。此外,一旦课程内容被分类,它就可以与已建立的基于角色的网络安全权重集成,从而使教育计划与特定的工作角色、劳动力类别或一般市场需求保持一致。这为个性化的、符合劳动力需求的网络安全课程奠定了基础,使学生为网络安全领域不断变化的需求做好准备。

🔬 方法详解

问题定义:当前网络安全课程设计面临的主要问题是:一是课程内容更新速度慢,无法及时反映最新的网络安全威胁和技术发展;二是课程设计过程高度依赖人工,成本高昂且效率低下;三是课程内容与行业需求存在偏差,导致毕业生难以胜任实际工作。

核心思路:CurricuLLM的核心思路是利用大型语言模型(LLM)的自然语言处理能力,自动化课程设计和分析过程。通过对LLM进行微调,使其能够理解网络安全领域的专业知识和行业需求,从而生成个性化、符合行业标准的课程。

技术框架:CurricuLLM采用双层架构。第一层是PreprocessLM,负责对输入数据进行标准化处理,例如清洗、转换和格式化。第二层是ClassifyLM,负责将课程内容分配到网络安全的九个知识领域。ClassifyLM基于微调的BERT模型,能够根据课程描述和行业标准,自动对课程内容进行分类。

关键创新:该论文的关键创新在于将大型语言模型应用于网络安全课程设计领域,实现了课程设计的自动化和个性化。与传统的人工设计方法相比,CurricuLLM能够显著提高课程设计的效率和质量,并能更好地满足行业需求。

关键设计:ClassifyLM的关键设计在于BERT模型的微调策略。作者在基础网络安全概念和劳动力能力上对BERT模型进行了微调,使其能够更好地理解网络安全领域的专业知识。此外,作者还系统地评估了多种NLP架构和微调策略,最终选择了BERT模型作为ClassifyLM。

📊 实验亮点

该论文通过人工专家对CurricuLLM的输出结果进行了验证,证明了该方法能够有效替代人工课程分析。实验结果表明,CurricuLLM能够准确地将课程内容分配到不同的知识领域,并能根据行业需求调整课程权重,从而实现课程与行业需求的对齐。具体性能数据未知,但专家评估表明其效率显著高于人工方法。

🎯 应用场景

CurricuLLM可应用于高校、职业培训机构等,用于快速生成和优化网络安全课程,提升教学质量和学生就业竞争力。该框架还可用于分析现有课程体系,发现知识盲点和技能缺口,为课程改革提供数据支持。此外,CurricuLLM可以根据不同行业和岗位的需求,定制个性化的培训方案,满足企业的人才培养需求。

📄 摘要(原文)

The cybersecurity landscape is constantly evolving, driven by increased digitalization and new cybersecurity threats. Cybersecurity programs often fail to equip graduates with skills demanded by the workforce, particularly concerning recent developments in cybersecurity, as curriculum design is costly and labor-intensive. To address this misalignment, we present a novel Large Language Model (LLM)-based framework for automated design and analysis of cybersecurity curricula, called CurricuLLM. Our approach provides three key contributions: (1) automation of personalized curriculum design, (2) a data-driven pipeline aligned with industry demands, and (3) a comprehensive methodology for leveraging fine-tuned LLMs in curriculum development. CurricuLLM utilizes a two-tier approach consisting of PreprocessLM, which standardizes input data, and ClassifyLM, which assigns course content to nine Knowledge Areas in cybersecurity. We systematically evaluated multiple Natural Language Processing (NLP) architectures and fine-tuning strategies, ultimately selecting the Bidirectional Encoder Representations from Transformers (BERT) model as ClassifyLM, fine-tuned on foundational cybersecurity concepts and workforce competencies. We are the first to validate our method with human experts who analyzed real-world cybersecurity curricula and frameworks, motivating that CurricuLLM is an efficient solution to replace labor-intensive curriculum analysis. Moreover, once course content has been classified, it can be integrated with established cybersecurity role-based weights, enabling alignment of the educational program with specific job roles, workforce categories, or general market needs. This lays the foundation for personalized, workforce-aligned cybersecurity curricula that prepare students for the evolving demands in cybersecurity.