cs.LG（2025-02-08）

📊 共 1 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Design Considerations in Offline Preference-based RL	研究离线偏好强化学习中的设计选择对策略学习质量的影响	reinforcement learning RLHF DPO