cs.LG(2025-07-16)

📊 共 2 篇论文

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (2)

🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)

#题目一句话要点标签🔗
1 Online Training and Pruning of Deep Reinforcement Learning Networks 提出XiNet,通过在线训练和剪枝深度强化学习网络,提升效率并保持性能。 reinforcement learning deep reinforcement learning
2 Scaling Up RL: Unlocking Diverse Reasoning in LLMs via Prolonged Training 通过长期强化学习,解锁LLM在多样推理任务中的能力。 reinforcement learning chain-of-thought

⬅️ 返回 cs.LG 首页 · 🏠 返回主页