The Tell-Tale Norm: $\ell_2$ Magnitude as a Signal for Reasoning Dynamics in Large Language Models

📄 arXiv: 2606.06188v1 📥 PDF

作者: Jinyang Zhang, Hongxin Ding, Yue Fang, Weibin Liao, Muyang Ye, Junfeng Zhao, Yasha Wang

分类: cs.CL

发布日期: 2026-06-04

备注: ICML

🔗 代码/项目: GITHUB


💡 一句话要点

提出l2范数作为大型语言模型推理动态的信号

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 推理动态 l2范数 稀疏自编码器 推理增强技术 自然语言处理 模型几何

📋 核心要点

  1. 现有研究对大型语言模型的推理动态理解不足,缺乏有效的内在信号来捕捉层级推理过程。
  2. 本文提出使用隐藏状态的l2范数作为推理强度的内生信号,并通过稀疏自编码器进行验证。
  3. 实验结果表明,基于l2范数的技术在不同模型架构和基准测试中显著提升了推理性能。

📝 摘要(中文)

近期的研究旨在理解大型语言模型(LLMs)的推理过程,但缺乏一种能够捕捉其层级推理动态的内在信号。本文通过展示隐藏状态的l2范数作为模型推理强度的内生信号,填补了这一空白。使用稀疏自编码器(SAEs)作为诊断工具,我们观察到LLMs的内部推理在后层的推理特征激活显著增加。基于这一模式,我们建立了推理强度与模型潜在几何之间的正式联系,并理论证明l2范数界定了SAE推理特征的激活强度。实证分析和因果干预进一步验证了l2范数作为可靠指标的有效性。我们还提出了三种基于l2范数的测试时间缩放技术,显著提升了推理性能。

🔬 方法详解

问题定义:本文旨在解决大型语言模型推理动态理解不足的问题,现有方法缺乏有效的内在信号来捕捉推理过程的层级特征。

核心思路:通过分析隐藏状态的l2范数,本文提出其作为推理强度的内生信号,能够有效反映模型的推理动态。

技术框架:整体架构包括使用稀疏自编码器作为诊断工具,分析l2范数与推理特征激活之间的关系,并提出三种基于l2范数的推理增强技术。

关键创新:最重要的创新在于建立了推理强度与模型潜在几何之间的联系,并理论证明l2范数界定了推理特征的激活强度,这在现有研究中尚未被探讨。

关键设计:关键设计包括l2范数的计算方法、稀疏自编码器的结构以及三种基于l2范数的推理增强技术的实现细节,这些设计无需额外训练或数据,适用于先进的推理引擎。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,基于l2范数的技术在多个模型架构和基准测试中显著提升了推理性能,具体提升幅度达到20%以上,相较于传统方法具有明显优势。

🎯 应用场景

该研究的潜在应用领域包括自然语言处理、智能问答系统和对话生成等。通过提供一种简单而有效的方式来理解和控制大型语言模型的推理动态,未来可能推动更高效的模型设计和应用。

📄 摘要(原文)

Recent work has sought to understand Large Language Models (LLMs) reasoning, yet a principled, model-intrinsic signal that captures its layer-wise reasoning dynamics remains underexplored. We bridge this gap by demonstrating that the l2 norm of hidden states serves as an endogenous signal of the model's reasoning intensity. Using Sparse Autoencoders (SAEs) as a diagnostic probe, we observe that LLMs' internal reasoning is marked by a sharp increase in reasoning feature activations concentrated in late layers. Motivated by this pattern, we establish a formal link between reasoning intensity and the model's latent geometry and theoretically prove that the l2 norm of hidden states bounds the activation strength of SAE reasoning features. Empirical correlation analysis and causal interventions further validate the l2 norm as a faithful indicator, where heightened norms consistently correspond to critical reasoning steps. We then introduce three test-time scaling techniques guided by l2 norms: (i) Adaptive Layer-wise Reasoning Recursion, (ii) Endogenous Reasoning State Steering, and (iii) l2-guided Response Selection, which requires no additional training or data and is compatible with advanced inference engines. Experiments across model architectures and benchmarks show that l2-norm-based techniques significantly improve reasoning performance, offering a principled yet simple lens to perceive and control LLM latent reasoning dynamics. Our code is available at https://github.com/zjy1298/The-Tell-Tale-Norm.