cs.RO(2024-11-04)
📊 共 13 篇论文 | 🔗 1 篇有代码
🎯 兴趣领域导航
支柱一:机器人控制 (Robot Control) (8 🔗1)
支柱三:空间感知与语义 (Perception & Semantics) (2)
支柱九:具身大模型 (Embodied Foundation Models) (1)
支柱六:视频提取与匹配 (Video Extraction) (1)
支柱二:RL算法与架构 (RL & Architecture) (1)
🔬 支柱一:机器人控制 (Robot Control) (8 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | DiffSim2Real: Deploying Quadrupedal Locomotion Policies Purely Trained in Differentiable Simulation | DiffSim2Real:仅在可微仿真中训练的四足机器人运动策略成功部署于真实世界 | quadruped locomotion locomotion policy | ||
| 2 | DeeR-VLA: Dynamic Inference of Multimodal Large Language Models for Efficient Robot Execution | 提出DeeR-VLA,通过动态推理高效执行机器人任务,降低MLLM计算成本。 | manipulation vision-language-action VLA | ✅ | |
| 3 | Real-Time Polygonal Semantic Mapping for Humanoid Robot Stair Climbing | 提出一种基于GPU加速的实时多边形语义地图构建算法,用于人形机器人楼梯攀爬。 | humanoid humanoid robot semantic mapping | ||
| 4 | Eurekaverse: Environment Curriculum Generation via Large Language Models | Eurekaverse:利用大语言模型自动生成环境课程,提升机器人技能 | quadruped parkour Eureka | ||
| 5 | Benchmarking Vision, Language, & Action Models on Robotic Learning Tasks | 构建VLA模型机器人学习任务评测基准,揭示现有模型在复杂任务中的局限性。 | manipulation vision-language-action VLA | ||
| 6 | RoboCrowd: Scaling Robot Data Collection through Crowdsourcing | RoboCrowd:通过众包扩展机器人数据收集,提升策略学习效率。 | manipulation bi-manual imitation learning | ||
| 7 | DexHub and DART: Towards Internet Scale Robot Data Collection | 提出DexHub和DART平台,解决机器人数据收集规模化难题,促进通用机器人系统发展。 | teleoperation | ||
| 8 | Diffusion-based Virtual Fixtures | 提出基于扩散的虚拟夹具,用于触觉机器人表面约束任务 | teleoperation |
🔬 支柱三:空间感知与语义 (Perception & Semantics) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 9 | Modeling Uncertainty in 3D Gaussian Splatting through Continuous Semantic Splatting | 提出基于连续语义Splatting的3D高斯不确定性建模方法,提升机器人应用安全性。 | 3D gaussian splatting gaussian splatting splatting | ||
| 10 | NeRF-Aug: Data Augmentation for Robotics with Neural Radiance Fields | NeRF-Aug:利用神经辐射场进行数据增强,提升机器人泛化能力 | NeRF neural radiance field |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 11 | Digitizing Touch with an Artificial Multimodal Fingertip | 提出一种高分辨率多模态人工指尖,用于数字化触觉感知。 | multimodal |
🔬 支柱六:视频提取与匹配 (Video Extraction) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 12 | Semantic Masking and Visual Feature Matching for Robust Localization | 提出基于语义掩码的视觉特征匹配方法,提升动态环境中机器人定位的鲁棒性。 | feature matching |
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 13 | So You Think You Can Scale Up Autonomous Robot Data Collection? | 自主机器人数据收集规模化面临挑战:现实世界实验表明自主模仿学习提升有限 | reinforcement learning imitation learning |