cs.CV(2025-07-09)
📊 共 18 篇论文 | 🔗 4 篇有代码
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (8 🔗2)
支柱二:RL算法与架构 (RL & Architecture) (6 🔗1)
支柱三:空间感知与语义 (Perception & Semantics) (3)
支柱四:生成式动作 (Generative Motion) (1 🔗1)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (8 篇)
🔬 支柱二:RL算法与架构 (RL & Architecture) (6 篇)
🔬 支柱三:空间感知与语义 (Perception & Semantics) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 15 | A Neural Representation Framework with LLM-Driven Spatial Reasoning for Open-Vocabulary 3D Visual Grounding | 提出SpatialReasoner,利用LLM驱动的空间推理增强开放词汇3D视觉定位 | open-vocabulary open vocabulary embodied AI | ||
| 16 | LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS | LangSplatV2:实现450+ FPS高维3D语言高斯溅射,加速开放词汇文本查询。 | gaussian splatting splatting open-vocabulary | ||
| 17 | mmFlux: Crowd Flow Analytics with Commodity mmWave MIMO Radar | 提出mmFlux,利用毫米波雷达进行人群流量分析与语义推断 | optical flow |
🔬 支柱四:生成式动作 (Generative Motion) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 18 | Go to Zero: Towards Zero-shot Motion Generation with Million-scale Data | 提出MotionMillion数据集与评估基准,实现文本到动作生成零样本泛化 | text-to-motion motion generation | ✅ |