cs.LG(2024-09-22)
📊 共 1 篇论文
🎯 兴趣领域导航
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | COSBO: Conservative Offline Simulation-Based Policy Optimization | 提出COSBO,结合离线数据与保守策略优化解决强化学习中的模拟-真实差距。 | sim-to-real reinforcement learning policy learning |
📊 共 1 篇论文
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | COSBO: Conservative Offline Simulation-Based Policy Optimization | 提出COSBO,结合离线数据与保守策略优化解决强化学习中的模拟-真实差距。 | sim-to-real reinforcement learning policy learning |