Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

作者: Zhipeng Yang, Junzhuo Li, Siyu Xia, Xuming Hu

分类: cs.CL, cs.LG

发布日期: 2025-05-20 (更新: 2025-09-28)

备注: EMNLP 2025 Main

💡 一句话要点

提出内部思维链以提升大语言模型的任务执行透明度

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 大语言模型 内部思维链 任务分解 层级执行 透明性提升

📋 核心要点

现有的大语言模型在处理复杂任务时缺乏透明性，难以理解其内部执行机制。
论文提出了一种内部思维链的概念，展示了模型如何按层次分解和执行任务，增强了对模型行为的理解。
通过实验验证，模型在不同层次上学习和执行子任务，提升了任务执行的效率和透明度。

📝 摘要（中文）

本研究表明，大语言模型（LLMs）展现出一种内部思维链的特性：它们按层逐步分解和执行复合任务。我们提出两个主要观点：第一，不同的子任务在网络的不同深度被学习；第二，这些子任务在各层之间顺序执行。通过对15个两步复合任务的基准测试，我们采用了层级上下文掩蔽和一种新颖的跨任务拼接方法，验证了第一个观点。为检验第二个观点，我们应用LogitLens解码隐藏状态，揭示了一种一致的层级执行模式。我们还在真实世界的TRACE基准上复制了我们的分析，观察到相同的逐步动态。我们的结果增强了LLMs的透明性，展示了它们内部规划和执行子任务的能力，为细粒度的指令级激活引导开辟了新途径。

🔬 方法详解

问题定义：本论文旨在解决大语言模型在执行复合任务时的透明性不足问题。现有方法无法清晰展示模型如何分解和执行任务，导致理解困难。

核心思路：论文提出了内部思维链的概念，认为模型在不同层次上学习和执行子任务，从而实现逐层的任务分解与执行。通过这种设计，能够更好地理解模型的内部工作机制。

技术框架：整体架构包括两个主要模块：层级上下文掩蔽和跨任务拼接方法。层级上下文掩蔽用于识别不同层次的子任务，而跨任务拼接则用于整合不同任务的执行信息。

关键创新：最重要的技术创新在于提出了内部思维链的概念，展示了模型在层级上执行子任务的能力。这一方法与现有的单层次任务执行方法有本质区别，提供了更深层次的理解。

关键设计：在实验中，采用了LogitLens技术解码隐藏状态，揭示了层级执行模式。此外，设计了特定的损失函数以优化模型在不同层次的表现，确保子任务的有效学习与执行。

📊 实验亮点

实验结果表明，模型在15个两步复合任务上表现出显著的层级执行模式，验证了内部思维链的有效性。通过LogitLens解码，发现模型在不同层次上学习和执行子任务，提升了任务执行的透明度和效率，具体性能提升幅度未知。

🎯 应用场景

该研究的潜在应用领域包括自然语言处理、智能助手和自动化系统等。通过提升大语言模型的透明度，开发者可以更好地理解和优化模型的行为，从而在实际应用中实现更高效的任务执行和用户交互。未来，这一研究可能推动更智能的系统设计，促进人机协作的进步。

📄 摘要（原文）

We show that large language models (LLMs) exhibit an $\textit{internal chain-of-thought}$: they sequentially decompose and execute composite tasks layer-by-layer. Two claims ground our study: (i) distinct subtasks are learned at different network depths, and (ii) these subtasks are executed sequentially across layers. On a benchmark of 15 two-step composite tasks, we employ layer-from context-masking and propose a novel cross-task patching method, confirming (i). To examine claim (ii), we apply LogitLens to decode hidden states, revealing a consistent layerwise execution pattern. We further replicate our analysis on the real-world $\text{TRACE}$ benchmark, observing the same stepwise dynamics. Together, our results enhance LLMs transparency by showing their capacity to internally plan and execute subtasks (or instructions), opening avenues for fine-grained, instruction-level activation steering.

Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册