cs.CV(2024-11-17)

📊 共 4 篇论文

🎯 兴趣领域导航

支柱三:空间感知与语义 (Perception & Semantics) (1) 支柱九:具身大模型 (Embodied Foundation Models) (1) 支柱八:物理动画 (Physics-based Animation) (1) 支柱一:机器人控制 (Robot Control) (1)

🔬 支柱三:空间感知与语义 (Perception & Semantics) (1 篇)

#题目一句话要点标签🔗
1 Memory-Augmented Multimodal LLMs for Surgical VQA via Self-Contained Inquiry 提出SCAN:一种基于记忆增强的多模态LLM框架,用于提升手术VQA的场景理解能力。 scene understanding multimodal

🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)

#题目一句话要点标签🔗
2 F$^3$OCUS -- Federated Finetuning of Vision-Language Foundation Models with Optimal Client Layer Updating Strategy via Multi-objective Meta-Heuristics 提出F$^3$OCUS,通过元启发式算法优化联邦学习中视觉-语言模型的参数高效微调。 foundation model

🔬 支柱八:物理动画 (Physics-based Animation) (1 篇)

#题目一句话要点标签🔗
3 STOP: Spatiotemporal Orthogonal Propagation for Weight-Threshold-Leakage Synergistic Training of Deep Spiking Neural Networks 提出时空正交传播(STOP)算法,用于权重-阈值-泄漏协同训练深度脉冲神经网络,提升边缘计算场景下的能效和精度。 spatiotemporal

🔬 支柱一:机器人控制 (Robot Control) (1 篇)

#题目一句话要点标签🔗
4 PickScan: Object discovery and reconstruction from handheld interactions PickScan:提出交互引导的物体发现与三维重建方法,无需预训练。 manipulation

⬅️ 返回 cs.CV 首页 · 🏠 返回主页