cs.CV（2025-02-10）

📊 共 6 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

支柱三：空间感知与语义 (Perception & Semantics) (3) 支柱二：RL算法与架构 (RL & Architecture) (1) 支柱九：具身大模型 (Embodied Foundation Models) (1 🔗1) 支柱八：物理动画 (Physics-based Animation) (1)

🔬 支柱三：空间感知与语义 (Perception & Semantics) (3 篇)

#	题目	一句话要点	标签	🔗	⭐
1	Grounding Creativity in Physics: A Brief Survey of Physical Priors in AIGC	综述物理先验驱动的AIGC方法，提升3D/4D内容生成的真实感和物理合理性。	gaussian splatting splatting NeRF
2	PrismAvatar: Real-time animated 3D neural head avatars on edge devices	PrismAvatar：面向边缘设备的实时动画3D神经头部头像模型	NeRF
3	GAS: Generative Avatar Synthesis from a Single Image	提出GAS框架，从单张图像生成视角一致且时序连贯的生成式Avatar	NeRF

🔬 支柱二：RL算法与架构 (RL & Architecture) (1 篇)

#	题目	一句话要点	标签	🔗	⭐
4	Preference Alignment on Diffusion Model: A Comprehensive Survey for Image Generation and Editing	首个扩散模型偏好对齐综述，提升图像生成与编辑能力	reinforcement learning RLHF DPO

🔬 支柱九：具身大模型 (Embodied Foundation Models) (1 篇)

#	题目	一句话要点	标签	🔗	⭐
5	EVEv2: Improved Baselines for Encoder-Free Vision-Language Models	EVEv2：改进的无编码器视觉-语言模型基线	multimodal	✅

🔬 支柱八：物理动画 (Physics-based Animation) (1 篇)

#	题目	一句话要点	标签	🔗	⭐
6	Lumina-Video: Efficient and Flexible Video Generation with Multi-scale Next-DiT	Lumina-Video：基于多尺度Next-DiT的高效灵活视频生成框架	spatiotemporal

⬅️ 返回 cs.CV 首页 · 🏠 返回主页