In-context learning for the classification of manipulation techniques in phishing emails
作者: Antony Dalmiere, Guillaume Auriol, Vincent Nicomette, Pascal Marchand
分类: cs.CR, cs.AI
发布日期: 2025-06-26
💡 一句话要点
利用上下文学习分类网络钓鱼邮件中的操控技术
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 网络钓鱼 心理操控 上下文学习 大型语言模型 邮件分类 安全检测 机器学习
📋 核心要点
- 现有的网络钓鱼检测方法通常忽视了心理操控的因素,导致识别效果不佳。
- 本研究提出利用大型语言模型的上下文学习技术,对网络钓鱼邮件进行基于操控技术的细粒度分类。
- 实验结果显示,该方法在识别常见操控技术方面表现出色,准确率达到0.76,优于传统方法。
📝 摘要(中文)
传统的网络钓鱼检测往往忽视心理操控因素。本研究探讨了使用大型语言模型(LLM)中的上下文学习(ICL)对基于40种操控技术分类网络钓鱼邮件的细粒度分类。通过在真实的法国网络钓鱼邮件(SignalSpam)上使用少量示例与GPT-4o-mini进行评估,我们在一个人工标注的测试集(100封邮件)上进行了性能评估。该方法有效识别了常见的操控技术(如诱饵、好奇心吸引、请求小恩惠),并取得了0.76的良好准确率。本研究展示了ICL在细致的网络钓鱼分析中的潜力,并提供了对攻击者策略的深入见解。
🔬 方法详解
问题定义:本论文旨在解决传统网络钓鱼检测方法在识别心理操控技术方面的不足,现有方法往往无法有效捕捉到邮件中的操控策略。
核心思路:论文提出利用大型语言模型中的上下文学习(ICL)技术,通过少量示例进行学习,从而实现对网络钓鱼邮件中操控技术的细粒度分类。这样的设计旨在提高对复杂操控策略的识别能力。
技术框架:整体架构包括数据收集、示例选择、模型训练和性能评估四个主要模块。首先,从真实的网络钓鱼邮件中提取数据,然后选择具有代表性的少量示例进行模型训练,最后在人工标注的测试集上进行评估。
关键创新:本研究的主要创新在于将上下文学习应用于网络钓鱼邮件的操控技术分类,突破了传统方法的局限,能够更好地捕捉邮件中的心理操控策略。
关键设计:在模型训练中,采用了GPT-4o-mini作为基础模型,并通过少量示例进行微调,损失函数的选择和参数设置经过精心设计,以确保模型能够有效学习到操控技术的特征。
📊 实验亮点
实验结果表明,该方法在识别常见操控技术方面取得了0.76的准确率,明显优于传统的网络钓鱼检测方法。这一结果展示了上下文学习在细致分析中的有效性,为网络安全领域提供了新的思路。
🎯 应用场景
该研究的潜在应用领域包括网络安全、电子邮件过滤和反欺诈系统。通过提高对网络钓鱼邮件中操控技术的识别能力,可以有效增强用户的安全防护,减少网络诈骗的发生。未来,该技术还可能扩展到其他类型的欺诈检测和社交工程攻击分析中。
📄 摘要(原文)
Traditional phishing detection often overlooks psychological manipulation. This study investigates using Large Language Model (LLM) In-Context Learning (ICL) for fine-grained classification of phishing emails based on a taxonomy of 40 manipulation techniques. Using few-shot examples with GPT-4o-mini on real-world French phishing emails (SignalSpam), we evaluated performance against a human-annotated test set (100 emails). The approach effectively identifies prevalent techniques (e.g., Baiting, Curiosity Appeal, Request For Minor Favor) with a promising accuracy of 0.76. This work demonstrates ICL's potential for nuanced phishing analysis and provides insights into attacker strategies.