cs.CV(2024-08-18)
📊 共 7 篇论文 | 🔗 4 篇有代码
🎯 兴趣领域导航
支柱二:RL算法与架构 (RL & Architecture) (2 🔗1)
支柱八:物理动画 (Physics-based Animation) (2 🔗1)
支柱三:空间感知与语义 (Perception & Semantics) (1)
支柱四:生成式动作 (Generative Motion) (1 🔗1)
支柱一:机器人控制 (Robot Control) (1 🔗1)
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | OVOSE: Open-Vocabulary Semantic Segmentation in Event-Based Cameras | 提出OVOSE,首个用于事件相机的开放词汇语义分割算法 | distillation open-vocabulary open vocabulary | ✅ | |
| 2 | CLIP-CID: Efficient CLIP Distillation via Cluster-Instance Discrimination | CLIP-CID:通过聚类-实例判别实现高效的CLIP模型蒸馏 | distillation foundation model |
🔬 支柱八:物理动画 (Physics-based Animation) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | VrdONE: One-stage Video Visual Relation Detection | 提出VrdONE单阶段模型,解决视频视觉关系检测中时空关系建模难题。 | spatiotemporal | ✅ | |
| 4 | Joint Temporal Pooling for Improving Skeleton-based Action Recognition | 提出关节运动自适应时序池化(JMAP)方法,提升基于骨骼的动作识别性能。 | spatiotemporal |
🔬 支柱三:空间感知与语义 (Perception & Semantics) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 5 | S^3D-NeRF: Single-Shot Speech-Driven Neural Radiance Field for High Fidelity Talking Head Synthesis | 提出S^3D-NeRF,解决单张图像语音驱动高保真说话人头部合成问题 | NeRF neural radiance field |
🔬 支柱四:生成式动作 (Generative Motion) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 6 | Combo: Co-speech holistic 3D human motion generation and efficient customizable adaptation in harmony | Combo:和谐的语音驱动整体3D人体运动生成与高效可定制化适配框架 | motion generation | ✅ |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 7 | G2Face: High-Fidelity Reversible Face Anonymization via Generative and Geometric Priors | G2Face:利用生成和几何先验实现高保真可逆人脸匿名化 | manipulation | ✅ |