cs.CV(2025-04-26)
📊 共 4 篇论文
🎯 兴趣领域导航
支柱九:具身大模型 (Embodied Foundation Models) (1)
支柱三:空间感知与语义 (Perception & Semantics) (1)
支柱一:机器人控制 (Robot Control) (1)
支柱二:RL算法与架构 (RL & Architecture) (1)
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | PyViT-FUSE: A Foundation Model for Multi-Sensor Earth Observation Data | 提出PyViT-FUSE,用于多传感器地球观测数据的多模态融合基础模型 | foundation model |
🔬 支柱三:空间感知与语义 (Perception & Semantics) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 2 | Depth as Points: Center Point-based Depth Estimation | 提出CenterDepth:一种基于中心点的单目深度估计轻量级架构,提升自动驾驶场景下的效率和精度。 | depth estimation monocular depth |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Sim-to-Real: An Unsupervised Noise Layer for Screen-Camera Watermarking Robustness | 提出一种无监督噪声层Sim-to-Real方法,提升屏幕-相机水印的鲁棒性。 | sim-to-real |
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | PiercingEye: Dual-Space Video Violence Detection with Hyperbolic Vision-Language Guidance | PiercingEye:利用双空间和超曲视觉-语言引导进行视频暴力检测 | representation learning large language model |