cs.LG(2025-07-16)
📊 共 2 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Online Training and Pruning of Deep Reinforcement Learning Networks | 提出XiNet,通过在线训练和剪枝深度强化学习网络,提升效率并保持性能。 | reinforcement learning deep reinforcement learning | ||
| 2 | Scaling Up RL: Unlocking Diverse Reasoning in LLMs via Prolonged Training | 通过长期强化学习,解锁LLM在多样推理任务中的能力。 | reinforcement learning chain-of-thought |