Do LLMsMakeNeural Distinguishers Wise?

📄 arXiv: 2606.10692v1 📥 PDF

作者: Tatsuya Sakagami, Masashi Hisai, Naoto Yanai

分类: cs.CR, cs.LG

发布日期: 2026-06-09

期刊: DeMeSSAI 2026 poster


💡 一句话要点

提出基于大语言模型的神经区分器以增强密码分析能力

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 神经区分器 大语言模型 密码分析 对称密钥 机器学习

📋 核心要点

  1. 现有的神经区分器方法未能有效利用大语言模型,导致性能提升有限。
  2. 本文提出了一种基于大语言模型的神经区分器,通过提示设计来增强其能力。
  3. 实验结果显示,LLM在神经区分器中的应用未能带来性能提升,但通过特定设计可改善效果。

📝 摘要(中文)

神经区分器是一种用于对称密钥密码学的密码分析方法,通过训练机器学习模型来恢复秘密密钥。本文首次探讨了大语言模型(LLMs)在神经区分器中的应用,提出了基于LLM的神经区分器,并在SPECK-32/64上进行了广泛实验。研究发现,LLM并未显著提升神经区分器的性能,且在高轮次时,差异选择对LLM和ResNet的效果均不再有效。通过仅使用XOR操作结果作为提示设计,可以显著改善LLM的性能。

🔬 方法详解

问题定义:本文旨在解决现有神经区分器在密码分析中的性能不足,尤其是未能有效利用大语言模型的挑战。

核心思路:通过设计基于大语言模型的神经区分器,探索其在密码分析中的潜力,尤其是如何通过提示设计来增强模型的表现。

技术框架:整体架构包括数据准备、模型训练和性能评估三个主要阶段。首先,准备明文和密文对,然后使用LLM进行训练,最后评估其在SPECK-32/64上的表现。

关键创新:最重要的创新在于首次将大语言模型应用于神经区分器,并通过对比实验验证其效果,发现LLM未能显著提升性能。

关键设计:在提示设计中,采用了XOR操作结果作为输入,实验表明这种设计能显著改善LLM的性能。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,基于LLM的神经区分器在与ResNet的对比中未能实现性能提升,且在高轮次情况下,差异选择的有效性降低。然而,通过仅使用XOR操作结果作为提示设计,LLM的性能得到了显著改善,展示了新的研究方向。

🎯 应用场景

该研究的潜在应用领域包括密码学和信息安全,尤其是在对称密钥密码算法的分析与优化中。通过改进神经区分器的性能,未来可能提升密码系统的安全性和抗攻击能力。

📄 摘要(原文)

Neural distinguishers are a cryptanalysis method for symmetric-key cryptography that trains machine learning models on pairs of plaintexts and ciphertexts with specific differences in order to recover a secret key. To the best of our knowledge, no existing work has explored the use of large language models (LLMs) for neural distinguishers. In this paper, we propose LLM-based neural distinguishers through a prompt design and conduct extensive experiments with them on SPECK-32/64 to investigate whether LLMs can strengthen neural distinguishers. We then found three key insights. First, by comparing the results of LLM-based neural distinguishers with ResNet in the existing work, we demonstrate that LLMs provide no observable improvement in the performance of neural distinguishers. Second, we confirm that, at high rounds, the choice of differences is no longer effective for LLM-based neural distinguishers as well as ResNet. Third, we show that the performance of LLM-based neural distinguishers can be significantly improved by incorporating only the XOR operation results as a prompt design.