cs.CV（2025-03-15）

📊 共 4 篇论文 | 🔗 2 篇有代码

🎯 兴趣领域导航

支柱九：具身大模型 (Embodied Foundation Models) (2 🔗1) 支柱三：空间感知与语义 (Perception & Semantics) (1) 支柱一：机器人控制 (Robot Control) (1 🔗1)

🔬 支柱九：具身大模型 (Embodied Foundation Models) (2 篇)

#	题目	一句话要点	标签	🔗	⭐
1	Tailor: An Integrated Text-Driven CG-Ready Human and Garment Generation System	Tailor：提出一个集成的文本驱动的、可生成CG就绪人体和服装的系统	large language model
2	Hyperbolic Safety-Aware Vision-Language Models	提出HySAC：利用双曲空间层级结构提升视觉-语言模型安全性	multimodal	✅

🔬 支柱三：空间感知与语义 (Perception & Semantics) (1 篇)

#	题目	一句话要点	标签	🔗	⭐
3	LIAM: Multimodal Transformer for Language Instructions, Images, Actions and Semantic Maps	LIAM：用于语言指令、图像、动作和语义地图的多模态Transformer，提升家务机器人任务执行能力。	semantic map open-vocabulary open vocabulary

🔬 支柱一：机器人控制 (Robot Control) (1 篇)

#	题目	一句话要点	标签	🔗	⭐
4	ReBot: Scaling Robot Learning with Real-to-Sim-to-Real Robotic Video Synthesis	ReBot：利用真实-模拟-真实机器人视频合成扩展机器人学习规模	manipulation sim-to-real vision-language-action	✅

⬅️ 返回 cs.CV 首页 · 🏠 返回主页