cs.AI(2025-01-28)
📊 共 12 篇论文 | 🔗 2 篇有代码
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (9 🔗2)
支柱二:RL算法与架构 (RL & Architecture) (2)
支柱一:机器人控制 (Robot Control) (1)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (9 篇)
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 10 | SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training | 比较SFT与RL在基础模型后训练中的作用 | reinforcement learning foundation model | ||
| 11 | Probing LLM World Models: Enhancing Guesstimation with Wisdom of Crowds Decoding | 提出基于群体智慧解码(WOC)的大语言模型(LLM)估算方法,提升世界知识利用率。 | world model large language model |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 12 | Integrating Reinforcement Learning and AI Agents for Adaptive Robotic Interaction and Assistance in Dementia Care | 提出结合强化学习与AI代理的自适应机器人交互系统,用于痴呆症护理。 | humanoid humanoid robot reinforcement learning |