cs.CV(2025-02-10)
📊 共 6 篇论文 | 🔗 1 篇有代码
🎯 兴趣领域导航
支柱三:空间感知与语义 (Perception & Semantics) (3)
支柱二:RL算法与架构 (RL & Architecture) (1)
支柱九:具身大模型 (Embodied Foundation Models) (1 🔗1)
支柱八:物理动画 (Physics-based Animation) (1)
🔬 支柱三:空间感知与语义 (Perception & Semantics) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Grounding Creativity in Physics: A Brief Survey of Physical Priors in AIGC | 综述物理先验驱动的AIGC方法,提升3D/4D内容生成的真实感和物理合理性。 | gaussian splatting splatting NeRF | ||
| 2 | PrismAvatar: Real-time animated 3D neural head avatars on edge devices | PrismAvatar:面向边缘设备的实时动画3D神经头部头像模型 | NeRF | ||
| 3 | GAS: Generative Avatar Synthesis from a Single Image | 提出GAS框架,从单张图像生成视角一致且时序连贯的生成式Avatar | NeRF |
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | Preference Alignment on Diffusion Model: A Comprehensive Survey for Image Generation and Editing | 首个扩散模型偏好对齐综述,提升图像生成与编辑能力 | reinforcement learning RLHF DPO |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 5 | EVEv2: Improved Baselines for Encoder-Free Vision-Language Models | EVEv2:改进的无编码器视觉-语言模型基线 | multimodal | ✅ |
🔬 支柱八:物理动画 (Physics-based Animation) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 6 | Lumina-Video: Efficient and Flexible Video Generation with Multi-scale Next-DiT | Lumina-Video:基于多尺度Next-DiT的高效灵活视频生成框架 | spatiotemporal |