cs.CV（2024-11-08）

📊 共 4 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Hierarchical Visual Feature Aggregation for OCR-Free Document Understanding	提出基于层级视觉特征聚合的OCR-Free文档理解框架，提升多模态大语言模型处理文档图像的效率。	large language model multimodal
2	Autoregressive Models in Vision: A Survey	综述视觉自回归模型：探索像素、令牌和尺度等多层次表示的生成建模方法。	embodied AI multimodal	✅

#	题目	一句话要点	标签	🔗	⭐
3	PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering	PEP-GS：感知增强的精确结构化3D高斯，用于视角自适应渲染	3D gaussian splatting gaussian splatting splatting

#	题目	一句话要点	标签	🔗	⭐
4	WavShadow: Wavelet Based Shadow Segmentation and Removal	WavShadow：融合小波变换的阴影分割与去除方法，提升ShadowFormer性能。	masked autoencoder MAE