cs.LG(2025-10-22)
📊 共 4 篇论文 | 🔗 1 篇有代码
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | FrogDeepSDM: Improving Frog Counting and Occurrence Prediction Using Multimodal Data and Pseudo-Absence Imputation | FrogDeepSDM:利用多模态数据和伪缺失值插补提升青蛙计数和分布预测 | MAE multimodal | ||
| 2 | Semantic World Models | 提出基于视觉语言模型的语义世界模型,提升机器人控制泛化性 | world model | ✅ | |
| 3 | A Survey on Cache Methods in Diffusion Models: Toward Efficient Multi-Modal Generation | 综述扩散模型缓存方法,加速高效多模态生成。 | distillation multimodal |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | A Multimodal, Multitask System for Generating E Commerce Text Listings from Images | 提出一种多模态多任务系统,用于从图像生成电商文本列表,显著降低幻觉率。 | multimodal |