cs.CV(2025-03-03)
📊 共 5 篇论文 | 🔗 4 篇有代码
🎯 兴趣领域导航
支柱三:空间感知与语义 (Perception & Semantics) (3 🔗2)
支柱一:机器人控制 (Robot Control) (1 🔗1)
支柱九:具身大模型 (Embodied Foundation Models) (1 🔗1)
🔬 支柱三:空间感知与语义 (Perception & Semantics) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | FGS-SLAM: Fourier-based Gaussian Splatting for Real-time SLAM with Sparse and Dense Map Fusion | FGS-SLAM:基于傅里叶高斯溅射的实时SLAM,融合稀疏与稠密地图 | 3D gaussian splatting gaussian splatting splatting | ||
| 2 | Data Augmentation for NeRFs in the Low Data Limit | 提出基于不确定性采样的NeRF数据增强方法,解决低数据量下的场景重建问题。 | NeRF neural radiance field scene reconstruction | ✅ | |
| 3 | Category-level Meta-learned NeRF Priors for Efficient Object Mapping | 提出PRENOM,结合类别级先验与NeRF,高效实现物体三维重建与姿态估计 | NeRF | ✅ |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | One-Shot Affordance Grounding of Deformable Objects in Egocentric Organizing Scenes | 提出OS-AGDO方法,解决机器人操作柔性物体时单样本可供性定位问题。 | manipulation affordance egocentric | ✅ |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 5 | Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval | 提出ReT模型,增强视觉-语言Transformer,实现鲁棒的多模态文档检索。 | multimodal | ✅ |