cs.CV（2024-07-21）

📊 共 1 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Audio-visual training for improved grounding in video-text LLMs	提出音视频联合训练框架，提升视频文本大模型中的 grounding 性能。	multimodal