cs.LG（2024-05-23）

📊 共 2 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Privileged Sensing Scaffolds Reinforcement Learning	提出Scaffolder，利用特权感知提升强化学习在机器人任务中的性能。	reinforcement learning world model	✅

#	题目	一句话要点	标签	🔗	⭐
2	OAC: Output-adaptive Calibration for Accurate Post-training Quantization	提出OAC：一种输出自适应校准方法，用于提升后训练量化低精度下的模型精度。	large language model