cs.CV(2025-03-15)
📊 共 4 篇论文 | 🔗 2 篇有代码
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (2 🔗1)
支柱三:空间感知与语义 (Perception & Semantics) (1)
支柱一:机器人控制 (Robot Control) (1 🔗1)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Tailor: An Integrated Text-Driven CG-Ready Human and Garment Generation System | Tailor:提出一个集成的文本驱动的、可生成CG就绪人体和服装的系统 | large language model | ||
| 2 | Hyperbolic Safety-Aware Vision-Language Models | 提出HySAC:利用双曲空间层级结构提升视觉-语言模型安全性 | multimodal | ✅ |
🔬 支柱三:空间感知与语义 (Perception & Semantics) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | LIAM: Multimodal Transformer for Language Instructions, Images, Actions and Semantic Maps | LIAM:用于语言指令、图像、动作和语义地图的多模态Transformer,提升家务机器人任务执行能力。 | semantic map open-vocabulary open vocabulary |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | ReBot: Scaling Robot Learning with Real-to-Sim-to-Real Robotic Video Synthesis | ReBot:利用真实-模拟-真实机器人视频合成扩展机器人学习规模 | manipulation sim-to-real vision-language-action | ✅ |