Lost in State Space: Probing Frozen Mamba Representations

作者: Bhagyashree Wagh, Akash Singh

分类: cs.CL, cs.LG

发布日期: 2026-04-30

备注: 8 pages, 2 figures

💡 一句话要点

探究Frozen Mamba表征：状态空间中语义信息提取的局限性

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture)

关键词: Mamba模型 状态空间模型 句子表征 表征学习 各向异性 表征崩溃 自然语言处理

📋 核心要点

现有方法难以有效利用Mamba模型的状态空间进行句子表征提取，缺乏直接且无需额外训练的方案。
论文探索直接从Mamba模型的隐藏状态中提取句子表征，无需微调或额外的池化层。
实验表明，直接从patch边界读取隐藏状态的方法并未显著优于简单的平均池化，并发现了表征崩溃等问题。

📝 摘要（中文）

Mamba的循环状态h_t被设计为迄今为止每个token的压缩摘要。这引出了一个诱人的假设：如果在固定的patch边界提取token级别的输出y_t，我们可以免费获得语义句子摘要，无需池化层、微调和[CLS] token。我们仔细测试了这个假设。在五个基准测试（SST-2、CoLA、MRPC、STS-B、IMDb）中，我们比较了四种从预训练的Mamba-130M骨干网络中提取frozen句子表征的策略，采用严格的frozen-feature probing协议，并在计算可行的前提下使用三个随机种子。结果不支持该假设：patch边界读取并没有始终优于简单的平均池化。我们识别并量化了两种结构性病理：严重的各向异性（平均成对余弦相似度0.9999，标准差0.000044）和原始最终SSM状态中的表征崩溃（在CoLA上，所有三个种子上的MCC = 0.000，通过混淆矩阵确认）。我们进一步提出了正交注入，这是一种改进的递归，可以约束每次迭代的新信息。

🔬 方法详解

问题定义：论文旨在研究是否可以直接从预训练的Mamba模型的隐藏状态中提取高质量的句子表征，而无需进行微调或添加额外的池化层。现有方法通常需要额外的[CLS] token或池化操作，增加了计算成本和模型复杂度。论文关注的痛点是能否利用Mamba模型本身的状态空间来高效地获取句子级别的语义信息。

核心思路：论文的核心思路是假设Mamba模型的循环状态h_t已经包含了所有token的压缩信息，因此可以直接在固定的patch边界提取token级别的输出y_t，从而获得句子表征。这种方法避免了额外的训练或池化操作，旨在简化句子表征的提取过程。

技术框架：论文采用的整体框架是frozen-feature probing协议，即固定预训练的Mamba-130M模型的参数，然后评估不同策略提取的句子表征的质量。主要模块包括：1) Mamba-130M骨干网络；2) 四种句子表征提取策略（包括patch边界读取和平均池化）；3) 五个句子分类基准测试（SST-2, CoLA, MRPC, STS-B, IMDb）；4) 评估指标（如MCC, 准确率等）。

关键创新：论文的关键创新在于对Mamba模型的状态空间进行了深入的探究，并提出了直接从patch边界读取隐藏状态的句子表征提取方法。虽然实验结果表明该方法并未显著优于平均池化，但论文识别并量化了Mamba模型中存在的表征崩溃和各向异性问题，为后续研究提供了重要的参考。此外，论文还提出了正交注入方法，试图缓解这些问题。

关键设计：论文的关键设计包括：1) 使用预训练的Mamba-130M模型作为骨干网络；2) 比较四种不同的句子表征提取策略，包括在固定patch边界读取隐藏状态；3) 使用多个随机种子进行实验，以确保结果的可靠性；4) 使用MCC（Matthews correlation coefficient）等指标来评估句子表征的质量；5) 提出了正交注入方法，通过约束每次迭代的新信息来改进递归过程。

🖼️ 关键图片

📊 实验亮点

实验结果表明，直接从Mamba模型的patch边界读取隐藏状态的方法，在五个基准测试中并未始终优于简单的平均池化。论文还发现Mamba模型存在严重的各向异性（平均成对余弦相似度接近1）和表征崩溃问题（在CoLA数据集上MCC接近0）。这些发现揭示了Mamba模型在句子表征学习方面的局限性，为后续研究提供了重要的方向。

🎯 应用场景

该研究探索了Mamba模型在自然语言处理领域的应用潜力，尤其是在句子表征学习方面。虽然当前结果不尽如人意，但对理解Mamba模型的内部机制和优化其表征能力具有重要意义。未来的研究可以基于此，改进Mamba模型的结构或训练方法，使其能够更好地应用于文本分类、情感分析等任务。

📄 摘要（原文）

Mamba's recurrent state h_t is, by construction, a compressed summary of every token seen so far. This raises a tempting hypothesis: if we extract token-level outputs y_t at fixed patch boundaries, we obtain semantic sentence summaries for free, with no pooling head, no fine-tuning, and no [CLS] token. We test this hypothesis carefully. Across five benchmarks (SST-2, CoLA, MRPC, STS-B, IMDb), we compare four strategies for extracting frozen sentence representations from a pretrained Mamba-130M backbone under a strict frozen-feature probing protocol, using three random seeds where computationally feasible. The results do not support the hypothesis: patch boundary readouts do not consistently outperform simple mean pooling. We identify and quantify two structural pathologies: severe anisotropy (mean pairwise cosine similarity 0.9999, std 0.000044) and representational collapse in the raw final SSM state (MCC = 0.000 on CoLA across all three seeds, confirmed via confusion matrix). We further propose orthogonal injection, a modified recurrence that constrains new information per

Lost in State Space: Probing Frozen Mamba Representations

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理