cs.CV(2025-04-26)

📊 共 4 篇论文

🎯 兴趣领域导航

支柱九:具身大模型 (Embodied Foundation Models) (1) 支柱三:空间感知与语义 (Perception & Semantics) (1) 支柱一:机器人控制 (Robot Control) (1) 支柱二:RL算法与架构 (RL & Architecture) (1)

🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)

#题目一句话要点标签🔗
1 PyViT-FUSE: A Foundation Model for Multi-Sensor Earth Observation Data 提出PyViT-FUSE,用于多传感器地球观测数据的多模态融合基础模型 foundation model

🔬 支柱三:空间感知与语义 (Perception & Semantics) (1 篇)

#题目一句话要点标签🔗
2 Depth as Points: Center Point-based Depth Estimation 提出CenterDepth:一种基于中心点的单目深度估计轻量级架构,提升自动驾驶场景下的效率和精度。 depth estimation monocular depth

🔬 支柱一:机器人控制 (Robot Control) (1 篇)

#题目一句话要点标签🔗
3 Sim-to-Real: An Unsupervised Noise Layer for Screen-Camera Watermarking Robustness 提出一种无监督噪声层Sim-to-Real方法,提升屏幕-相机水印的鲁棒性。 sim-to-real

🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)

#题目一句话要点标签🔗
4 PiercingEye: Dual-Space Video Violence Detection with Hyperbolic Vision-Language Guidance PiercingEye:利用双空间和超曲视觉-语言引导进行视频暴力检测 representation learning large language model

⬅️ 返回 cs.CV 首页 · 🏠 返回主页