cs.LG(2025-03-04)
📊 共 12 篇论文 | 🔗 1 篇有代码
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (7 🔗1)
支柱一:机器人控制 (Robot Control) (3)
支柱二:RL算法与架构 (RL & Architecture) (2)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (7 篇)
🔬 支柱一:机器人控制 (Robot Control) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 8 | Teaching Metric Distance to Discrete Autoregressive Language Models | 提出DIST2Loss,利用token间距离关系训练离散自回归语言模型,提升多模态任务性能。 | manipulation large language model multimodal | ||
| 9 | LLM Misalignment via Adversarial RLHF Platforms | 提出对抗性RLHF平台攻击,揭示LLM对齐过程中的潜在风险 | manipulation reinforcement learning RLHF | ||
| 10 | A2Perf: Real-World Autonomous Agents Benchmark | A2Perf:面向真实世界自主Agent的综合性评测基准 | quadruped locomotion reinforcement learning |
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 11 | Target Return Optimizer for Multi-Game Decision Transformer | 提出MTRO算法,自动优化多游戏决策Transformer中的目标回报,提升泛化能力。 | reinforcement learning offline reinforcement learning decision transformer | ||
| 12 | Four Principles for Physically Interpretable World Models | 提出物理可解释世界模型的四大原则,提升自主系统在不确定环境下的可靠性。 | world model |