cs.CV(2023-12-16)
📊 共 7 篇论文 | 🔗 2 篇有代码
🎯 兴趣领域导航
支柱二:RL算法与架构 (RL & Architecture) (2 🔗1)
支柱三:空间感知与语义 (Perception & Semantics) (2)
支柱九:具身大模型 (Embodied Foundation Models) (2 🔗1)
支柱一:机器人控制 (Robot Control) (1)
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Simple Image-level Classification Improves Open-vocabulary Object Detection | 提出SIC-CADS,利用图像级分类提升开放词汇目标检测中小目标和遮挡目标的检测性能。 | distillation scene understanding open-vocabulary | ✅ | |
| 2 | Semantic-Aware Autoregressive Image Modeling for Visual Representation Learning | 提出语义感知自回归图像建模(SemAIM),用于视觉表征学习。 | representation learning MAE |
🔬 支柱三:空间感知与语义 (Perception & Semantics) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Learning Dense Correspondence for NeRF-Based Face Reenactment | 提出PlaneDict模块,无需3DMM先验实现基于NeRF的人脸重演 | NeRF neural radiance field implicit representation | ||
| 4 | Transformers in Unsupervised Structure-from-Motion | 提出基于变换器的单目结构光重建方法以提升3D场景理解 | scene understanding |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 5 | Learning Interpretable Queries for Explainable Image Classification with Information Pursuit | 提出基于信息寻踪的可解释查询学习方法,提升图像分类可解释性 | large language model | ||
| 6 | DeepArt: A Benchmark to Advance Fidelity Research in AI-Generated Content | DeepArt:构建基准测试,推进AI生成内容逼真度研究 | large language model | ✅ |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 7 | DETER: Detecting Edited Regions for Deterring Generative Manipulations | DETER:检测编辑区域以阻止生成式篡改,促进深度伪造检测技术发展。 | manipulation |