cs.AI(2024-11-29)
📊 共 15 篇论文 | 🔗 3 篇有代码
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (10 🔗1)
支柱一:机器人控制 (Robot Control) (3 🔗1)
支柱二:RL算法与架构 (RL & Architecture) (2 🔗1)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (10 篇)
🔬 支柱一:机器人控制 (Robot Control) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 11 | PDDLFuse: A Tool for Generating Diverse Planning Domains | PDDLFuse:生成多样化规划领域的工具,提升规划算法的泛化能力 | domain randomization reinforcement learning large language model | ||
| 12 | FLARE: Toward Universal Dataset Purification against Backdoor Attacks | 提出FLARE以解决后门攻击下的数据集净化问题 | manipulation | ✅ | |
| 13 | Quantized Delta Weight Is Safety Keeper | 量化Delta权重在降低资源需求的同时,意外提升了微调语言模型的安全性。 | manipulation |
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 14 | A Local Information Aggregation based Multi-Agent Reinforcement Learning for Robot Swarm Dynamic Task Allocation | 提出基于局部信息聚合的多智能体强化学习方法,解决机器人集群动态任务分配问题。 | reinforcement learning | ||
| 15 | o1-Coder: an o1 Replication for Coding | O1-CODER:基于强化学习和蒙特卡洛树搜索的代码生成模型复现 | reinforcement learning world model | ✅ |