cs.LG(2025-11-24)

📊 共 4 篇论文

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (3) 支柱一:机器人控制 (Robot Control) (1)

🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)

#题目一句话要点标签🔗
1 First-order Sobolev Reinforcement Learning 提出一阶Sobolev强化学习,通过梯度一致性加速critic收敛并稳定策略梯度。 reinforcement learning SAC actor-critic
2 Learning Massively Multitask World Models for Continuous Control 提出Newt:一种大规模多任务世界模型,用于连续控制任务 reinforcement learning world model
3 Leveraging LLMs for reward function design in reinforcement learning control tasks 提出LEARN-Opt,利用LLM自主设计强化学习控制任务的奖励函数,无需人工干预。 reinforcement learning reward design

🔬 支柱一:机器人控制 (Robot Control) (1 篇)

#题目一句话要点标签🔗
4 AVA-VLA: Improving Vision-Language-Action models with Active Visual Attention AVA-VLA:通过主动视觉注意力提升视觉-语言-动作模型在具身智能任务中的性能。 dual-arm sim-to-real

⬅️ 返回 cs.LG 首页 · 🏠 返回主页