cs.LG（2024-04-05）

📊 共 9 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗
1	Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration	提出SHPPO框架以解决多角色动态协作问题	reinforcement learning PPO
2	Pixel-wise RL on Diffusion Models: Reinforcement Learning from Rich Feedback	提出像素级策略优化算法以解决稀疏奖励问题	reinforcement learning diffusion policy
3	Enhancing IoT Intelligence: A Transformer-based Reinforcement Learning Methodology	提出基于Transformer的强化学习方法以提升物联网智能决策能力	reinforcement learning PPO
4	Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation	提出Score Identity Distillation以实现快速生成预训练扩散模型	distillation	✅
5	Demonstration Guided Multi-Objective Reinforcement Learning	提出示范引导的多目标强化学习以解决训练困难问题	reinforcement learning

#	题目	一句话要点	标签
6	Prompt Public Large Language Models to Synthesize Data for Private On-device Applications	提出利用大型语言模型合成数据以改善私有设备应用的性能	large language model
7	Lossless and Near-Lossless Compression for Foundation Models	提出无损与近无损压缩方法以解决大模型存储与传输问题	foundation model
8	ROPO: Robust Preference Optimization for Large Language Models	提出ROPO框架以解决大语言模型偏好对噪声敏感的问题	large language model
9	Physics Event Classification Using Large Language Models	利用大型语言模型进行物理事件分类	large language model