cs.AI(2025-04-08)
📊 共 3 篇论文 | 🔗 2 篇有代码
🎯 兴趣领域导航
支柱一:机器人控制 (Robot Control) (1 🔗1)
支柱二:RL算法与架构 (RL & Architecture) (1)
支柱九:具身大模型 (Embodied Foundation Models) (1 🔗1)
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | StealthRank: LLM Ranking Manipulation via Stealthy Prompt Optimization | StealthRank:通过隐蔽提示优化操纵LLM排序,提升目标项目排名。 | manipulation large language model | ✅ |
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 2 | Information-Theoretic Reward Decomposition for Generalizable RLHF | 提出基于信息论的奖励分解方法,提升RLHF中奖励模型的泛化能力 | reinforcement learning RLHF |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | FEABench: Evaluating Language Models on Multiphysics Reasoning Ability | 提出FEABench以评估语言模型在多物理场推理能力上的表现 | large language model | ✅ |