cs.CV(2024-07-21)
📊 共 1 篇论文
🎯 兴趣领域导航
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Audio-visual training for improved grounding in video-text LLMs | 提出音视频联合训练框架,提升视频文本大模型中的 grounding 性能。 | multimodal |
📊 共 1 篇论文
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Audio-visual training for improved grounding in video-text LLMs | 提出音视频联合训练框架,提升视频文本大模型中的 grounding 性能。 | multimodal |