cs.LG(2024-09-22)

📊 共 1 篇论文

🎯 兴趣领域导航

支柱一:机器人控制 (Robot Control) (1)

🔬 支柱一:机器人控制 (Robot Control) (1 篇)

#题目一句话要点标签🔗
1 COSBO: Conservative Offline Simulation-Based Policy Optimization 提出COSBO,结合离线数据与保守策略优化解决强化学习中的模拟-真实差距。 sim-to-real reinforcement learning policy learning

⬅️ 返回 cs.LG 首页 · 🏠 返回主页