cs.LG(2025-10-24)

📊 共 4 篇论文

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (3) 支柱四:生成式动作 (Generative Motion) (1)

🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)

#题目一句话要点标签🔗
1 Agentic Reinforcement Learning for Real-World Code Repair 提出Agentic强化学习方法,解决真实代码仓库中的代码修复问题 reinforcement learning
2 Transformer Based Linear Attention with Optimized GPU Kernel Implementation 优化GPU Kernel的Transformer线性注意力机制,加速推理与训练。 linear attention
3 Few-Shot Knowledge Distillation of LLMs With Counterfactual Explanations 提出基于反事实解释的蒸馏方法CoD,用于少样本场景下LLM的知识蒸馏。 distillation

🔬 支柱四:生成式动作 (Generative Motion) (1 篇)

#题目一句话要点标签🔗
4 Parallel Sampling from Masked Diffusion Models via Conditional Independence Testing 提出PUNT,通过条件独立性测试加速Masked Diffusion Models的并行采样。 MDM

⬅️ 返回 cs.LG 首页 · 🏠 返回主页