cs.LG(2025-11-27)

📊 共 1 篇论文

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (1)

🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)

#题目一句话要点标签🔗
1 BiCQL-ML: A Bi-Level Conservative Q-Learning Framework for Maximum Likelihood Inverse Reinforcement Learning 提出BiCQL-ML,通过双层保守Q学习解决离线逆强化学习中的奖励函数恢复问题 reinforcement learning policy learning inverse reinforcement learning

⬅️ 返回 cs.LG 首页 · 🏠 返回主页