cs.LG(2025-03-08)

📊 共 1 篇论文

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (1)

🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)

#题目一句话要点标签🔗
1 Towards Improving Reward Design in RL: A Reward Alignment Metric for RL Practitioners 提出轨迹对齐系数,提升强化学习中奖励函数设计的质量 reinforcement learning reward design reward shaping

⬅️ 返回 cs.LG 首页 · 🏠 返回主页