cs.LG(2024-08-16)
📊 共 3 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Improving VTE Identification through Language Models from Radiology Reports: A Comparative Study of Mamba, Phi-3 Mini, and BERT | 利用Mamba架构提升放射报告中静脉血栓栓塞识别的准确性和效率 | Mamba large language model | ||
| 2 | SEAL: Systematic Error Analysis for Value ALignment | 提出系统性误差分析方法以提升人类价值对齐 | reinforcement learning RLHF |
🔬 支柱四:生成式动作 (Generative Motion) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Classifier-Free Guidance is a Predictor-Corrector | 揭示Classifier-Free Guidance本质:一种新型预测-校正扩散模型采样方法 | classifier-free guidance |