cs.LG(2025-09-08)
📊 共 2 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Outcome-based Exploration for LLM Reasoning | 提出基于结果的探索方法,提升LLM推理能力并保持生成多样性 | reinforcement learning large language model |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 2 | Measuring Uncertainty in Transformer Circuits with Effective Information Consistency | 提出有效信息一致性评分,用于量化Transformer回路的不确定性 | large language model |