CVE-LLM : Ontology-Assisted Automatic Vulnerability Evaluation Using Large Language Models

📄 arXiv: 2502.15932v1 📥 PDF

作者: Rikhiya Ghosh, Hans-Martin von Stockhausen, Martin Schmitt, George Marica Vasile, Sanjeev Kumar Karn, Oladimeji Farri

分类: cs.CL, cs.CR

发布日期: 2025-02-21

备注: arXiv admin note: substantial text overlap with arXiv:2407.14640


💡 一句话要点

提出CVE-LLM,利用LLM和本体知识自动评估医疗设备漏洞

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 漏洞评估 网络安全本体 医疗设备安全 自动化安全

📋 核心要点

  1. 现有漏洞评估方法速度慢,无法应对日益增长的漏洞数量,需要更高效的自动化解决方案。
  2. 利用LLM学习历史漏洞评估数据,并结合网络安全本体知识,提升LLM对新漏洞的理解能力。
  3. 该LLM系统集成到西门子医疗的CSMS中,辅助专家进行漏洞评估,并提供LLM集成指南。

📝 摘要(中文)

国家漏洞数据库(NVD)每月发布超过一千个新漏洞,预计2024年将增加25%,这突显了快速识别漏洞以减轻网络安全攻击和节约成本和资源的关键需求。本文提出使用大型语言模型(LLM)从单个制造商的医疗设备漏洞的历史评估中学习漏洞评估。我们重点介绍了使用LLM进行自动漏洞评估的有效性和挑战,并介绍了一种使用网络安全本体丰富历史数据的方法,使系统无需重新训练LLM即可理解新漏洞。我们的LLM系统与内部应用程序——网络安全管理系统(CSMS)——集成,以帮助西门子医疗(SHS)产品网络安全专家有效地评估我们产品中的漏洞。此外,我们还提出了将LLM有效集成到网络安全工具中的指南。

🔬 方法详解

问题定义:当前网络安全领域面临着海量新增漏洞的挑战,人工评估效率低下且成本高昂。现有的漏洞评估方法难以快速准确地识别和评估新出现的漏洞,尤其是在特定行业(如医疗设备)中,漏洞的特殊性和专业性使得通用方法效果不佳。因此,需要一种能够自动、高效且准确地评估漏洞的方法,以减轻网络安全风险。

核心思路:论文的核心思路是利用大型语言模型(LLM)的强大学习能力,通过学习历史漏洞评估数据,自动进行漏洞评估。同时,为了增强LLM对新漏洞的理解能力,引入网络安全本体知识,将领域知识融入到LLM中,使其能够更好地理解漏洞的语义信息。这种方法旨在提高漏洞评估的效率和准确性,并减少对人工干预的依赖。

技术框架:该系统的整体框架包括以下几个主要模块:1) 历史漏洞数据收集与预处理:收集特定制造商(西门子医疗)的历史漏洞评估数据,并进行清洗和格式化。2) 网络安全本体构建:构建或利用现有的网络安全本体,对漏洞相关的概念、属性和关系进行建模。3) LLM训练与微调:使用历史漏洞数据对LLM进行训练或微调,使其能够学习漏洞评估的模式和规则。4) 本体知识融合:将网络安全本体知识融入到LLM中,例如通过知识图谱嵌入或提示学习等方法。5) 漏洞评估:使用训练好的LLM对新的漏洞进行评估,输出漏洞的严重程度、影响范围等信息。6) 系统集成:将LLM系统集成到西门子医疗的CSMS中,方便专家使用。

关键创新:该论文的关键创新在于将LLM和网络安全本体知识相结合,用于自动漏洞评估。与传统的基于规则或机器学习的漏洞评估方法相比,LLM具有更强的学习能力和泛化能力,能够更好地处理复杂的漏洞场景。同时,本体知识的引入增强了LLM对漏洞语义信息的理解,提高了评估的准确性。此外,该论文还提出了将LLM集成到现有网络安全工具中的方法,具有一定的实践指导意义。

关键设计:论文中未明确给出关键参数设置、损失函数、网络结构等技术细节。但可以推测,LLM的选择(例如BERT、RoBERTa等)以及微调策略(例如使用对比学习或生成式学习)是重要的设计考虑因素。此外,本体知识的融合方式(例如知识图谱嵌入的维度、提示学习的模板设计)也会影响系统的性能。损失函数可能采用交叉熵损失或对比损失,以优化LLM的漏洞评估能力。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文重点展示了将LLM应用于医疗设备漏洞评估的有效性,并强调了使用网络安全本体增强LLM理解能力的重要性。虽然没有提供具体的性能数据,但强调了该系统能够帮助西门子医疗的网络安全专家更有效地评估产品中的漏洞,并为LLM集成到网络安全工具中提供了指导。

🎯 应用场景

该研究成果可应用于各种需要快速漏洞评估的场景,例如医疗设备制造商、软件开发商、安全咨询公司等。通过自动化漏洞评估流程,可以显著提高漏洞响应速度,降低安全风险,并节约人力成本。未来,该方法可以扩展到其他领域,例如工业控制系统、物联网设备等,为构建更安全的网络环境提供支持。

📄 摘要(原文)

The National Vulnerability Database (NVD) publishes over a thousand new vulnerabilities monthly, with a projected 25 percent increase in 2024, highlighting the crucial need for rapid vulnerability identification to mitigate cybersecurity attacks and save costs and resources. In this work, we propose using large language models (LLMs) to learn vulnerability evaluation from historical assessments of medical device vulnerabilities in a single manufacturer's portfolio. We highlight the effectiveness and challenges of using LLMs for automatic vulnerability evaluation and introduce a method to enrich historical data with cybersecurity ontologies, enabling the system to understand new vulnerabilities without retraining the LLM. Our LLM system integrates with the in-house application - Cybersecurity Management System (CSMS) - to help Siemens Healthineers (SHS) product cybersecurity experts efficiently assess the vulnerabilities in our products. Also, we present guidelines for efficient integration of LLMs into the cybersecurity tool.