cs.CL(2024-10-26)
📊 共 12 篇论文 | 🔗 1 篇有代码
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (9 🔗1)
支柱二:RL算法与架构 (RL & Architecture) (2)
支柱一:机器人控制 (Robot Control) (1)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (9 篇)
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 10 | Fast Best-of-N Decoding via Speculative Rejection | 提出Speculative Rejection算法,加速Best-of-N解码,提升LLM推理时对齐效率。 | PPO DPO large language model | ||
| 11 | Pseudo-Label Enhanced Prototypical Contrastive Learning for Uniformed Intent Discovery | 提出伪标签增强的原型对比学习方法,用于统一意图发现。 | contrastive learning |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 12 | Vulnerability of LLMs to Vertically Aligned Text Manipulations | 揭示LLM在垂直对齐文本输入下的脆弱性,并分析其内在原因 | manipulation large language model chain-of-thought |