cs.LG(2025-12-21)
📊 共 6 篇论文 | 🔗 2 篇有代码
🎯 兴趣领域导航
支柱二:RL算法与架构 (RL & Architecture) (3 🔗1)
支柱八:物理动画 (Physics-based Animation) (2 🔗1)
支柱一:机器人控制 (Robot Control) (1)
🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | A Theoretical Lens for RL-Tuned Language Models via Energy-Based Models | 通过能量模型理论分析RL微调语言模型,揭示其内在机理 | reinforcement learning large language model instruction following | ||
| 2 | SD2AIL: Adversarial Imitation Learning from Synthetic Demonstrations via Diffusion Models | SD2AIL:利用扩散模型从合成演示中进行对抗模仿学习 | imitation learning | ✅ | |
| 3 | Gaussian-Mixture-Model Q-Functions for Policy Iteration in Reinforcement Learning | 提出基于高斯混合模型Q函数的策略迭代强化学习方法 | reinforcement learning |
🔬 支柱八:物理动画 (Physics-based Animation) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | Benchmarking neural surrogates on realistic spatiotemporal multiphysics flows | REALM:多物理场流动神经代理模型的现实基准测试框架 | spatiotemporal | ||
| 5 | Fusion of Multiscale Features Via Centralized Sparse-attention Network for EEG Decoding | 提出基于中心化稀疏注意力网络的脑电信号多尺度特征融合方法,提升脑机接口性能。 | spatiotemporal | ✅ |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 6 | Demonstration-Guided Continual Reinforcement Learning in Dynamic Environments | 提出DGCRL,利用自进化演示库指导动态环境下的持续强化学习,提升知识迁移和训练效率。 | locomotion reinforcement learning |