cs.LG（2024-09-22）

📊 共 1 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	COSBO: Conservative Offline Simulation-Based Policy Optimization	提出COSBO，结合离线数据与保守策略优化解决强化学习中的模拟-真实差距。	sim-to-real reinforcement learning policy learning