cs.LG(2024-08-15)
📊 共 3 篇论文
🎯 兴趣领域导航
支柱一:机器人控制 (Robot Control) (1)
支柱二:RL算法与架构 (RL & Architecture) (1)
支柱九:具身大模型 (Embodied Foundation Models) (1)
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning | 提出D5RL基准以解决离线强化学习评估不足问题 | locomotion manipulation reinforcement learning |
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 2 | Meta SAC-Lag: Towards Deployable Safe Reinforcement Learning via MetaGradient-based Hyperparameter Tuning | 提出Meta SAC-Lag,通过元梯度优化超参数,提升安全强化学习的部署能力 | reinforcement learning SAC |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Can Large Language Models Understand Symbolic Graphics Programs? | 提出基于符号图形程序的基准测试,评估并提升LLM的空间语义推理能力 | large language model |