cs.LG(2025-05-24)

📊 共 1 篇论文

🎯 兴趣领域导航

支柱一:机器人控制 (Robot Control) (1)

🔬 支柱一:机器人控制 (Robot Control) (1 篇)

#题目一句话要点标签🔗
1 GenPO: Generative Diffusion Models Meet On-Policy Reinforcement Learning GenPO:首个将生成扩散模型成功集成到On-Policy强化学习的框架,提升机器人任务性能。 legged locomotion humanoid locomotion

⬅️ 返回 cs.LG 首页 · 🏠 返回主页