cs.CV(2024-07-21)

📊 共 1 篇论文

🎯 兴趣领域导航

支柱九:具身大模型 (Embodied Foundation Models) (1)

🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)

#题目一句话要点标签🔗
1 Audio-visual training for improved grounding in video-text LLMs 提出音视频联合训练框架,提升视频文本大模型中的 grounding 性能。 multimodal

⬅️ 返回 cs.CV 首页 · 🏠 返回主页