cs.LG(2025-10-20)

📊 共 4 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

支柱二:RL算法与架构 (RL & Architecture) (3 🔗1) 支柱九:具身大模型 (Embodied Foundation Models) (1)

🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)

#题目一句话要点标签🔗
1 Provably Optimal Reinforcement Learning under Safety Filtering 提出安全过滤下的可证明最优强化学习方法,解决安全约束下的性能损失问题 reinforcement learning
2 Demystifying Transition Matching: When and Why It Can Beat Flow Matching 揭示Transition Matching优势:在高斯分布及混合模型中超越Flow Matching flow matching
3 An Empirical Study of Lagrangian Methods in Safe Reinforcement Learning 研究安全强化学习中拉格朗日方法的λ敏感性与自动更新策略的鲁棒性。 reinforcement learning

🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)

#题目一句话要点标签🔗
4 MILES: Modality-Informed Learning Rate Scheduler for Balancing Multimodal Learning 提出MILES:一种模态感知学习率调度器,用于平衡多模态学习。 multimodal

⬅️ 返回 cs.LG 首页 · 🏠 返回主页