cs.LG(2025-03-03)

📊 共 5 篇论文

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (3) 支柱一:机器人控制 (Robot Control) (2)

🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)

#题目一句话要点标签🔗
1 Using (Not-so) Large Language Models to Generate Simulation Models in a Formal DSL: A Study on Reaction Networks 利用小型语言模型生成形式化DSL中的仿真模型,以反应网络为例。 distillation large language model
2 Learning Actionable World Models for Industrial Process Control 提出基于可操作世界模型的工业过程控制方法,解决数据有限下的精确控制问题 world model representation learning contrastive learning
3 CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving 提出CAPS,利用上下文感知优先级采样提升自动驾驶模仿学习的数据效率。 imitation learning VQ-VAE

🔬 支柱一:机器人控制 (Robot Control) (2 篇)

#题目一句话要点标签🔗
4 Multi-Stage Manipulation with Demonstration-Augmented Reward, Policy, and World Model Learning DEMO3:结合演示增强奖励、策略和世界模型的机器人多阶段操作学习框架 humanoid manipulation reinforcement learning
5 Differentiable Information Enhanced Model-Based Reinforcement Learning 提出MB-MIX以解决模型基强化学习中的动态预测与策略稳定性问题 humanoid humanoid robot manipulation

⬅️ 返回 cs.LG 首页 · 🏠 返回主页