cs.LG(2024-05-23)

📊 共 2 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (1 🔗1) 支柱九:具身大模型 (Embodied Foundation Models) (1)

🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)

#题目一句话要点标签🔗
1 Privileged Sensing Scaffolds Reinforcement Learning 提出Scaffolder,利用特权感知提升强化学习在机器人任务中的性能。 reinforcement learning world model

🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)

#题目一句话要点标签🔗
2 OAC: Output-adaptive Calibration for Accurate Post-training Quantization 提出OAC:一种输出自适应校准方法,用于提升后训练量化低精度下的模型精度。 large language model

⬅️ 返回 cs.LG 首页 · 🏠 返回主页