cs.LG（2025-10-24）

📊 共 4 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签
1	Agentic Reinforcement Learning for Real-World Code Repair	提出Agentic强化学习方法，解决真实代码仓库中的代码修复问题	reinforcement learning
2	Transformer Based Linear Attention with Optimized GPU Kernel Implementation	优化GPU Kernel的Transformer线性注意力机制，加速推理与训练。	linear attention
3	Few-Shot Knowledge Distillation of LLMs With Counterfactual Explanations	提出基于反事实解释的蒸馏方法CoD，用于少样本场景下LLM的知识蒸馏。	distillation

#	题目	一句话要点	标签	🔗	⭐
4	Parallel Sampling from Masked Diffusion Models via Conditional Independence Testing	提出PUNT，通过条件独立性测试加速Masked Diffusion Models的并行采样。	MDM