cs.LG(2025-03-08)
📊 共 1 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Towards Improving Reward Design in RL: A Reward Alignment Metric for RL Practitioners | 提出轨迹对齐系数,提升强化学习中奖励函数设计的质量 | reinforcement learning reward design reward shaping |