cs.LG（2025-05-24）

📊 共 1 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	GenPO: Generative Diffusion Models Meet On-Policy Reinforcement Learning	GenPO：首个将生成扩散模型成功集成到On-Policy强化学习的框架，提升机器人任务性能。	legged locomotion humanoid locomotion