cs.LG（2025-07-16）

📊 共 2 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Online Training and Pruning of Deep Reinforcement Learning Networks	提出XiNet，通过在线训练和剪枝深度强化学习网络，提升效率并保持性能。	reinforcement learning deep reinforcement learning
2	Scaling Up RL: Unlocking Diverse Reasoning in LLMs via Prolonged Training	通过长期强化学习，解锁LLM在多样推理任务中的能力。	reinforcement learning chain-of-thought