cs.LG(2026-01-01)
📊 共 4 篇论文
🎯 兴趣领域导航
支柱一:机器人控制 (Robot Control) (1)
支柱八:物理动画 (Physics-based Animation) (1)
支柱二:RL算法与架构 (RL & Architecture) (1)
支柱九:具身大模型 (Embodied Foundation Models) (1)
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Online Finetuning Decision Transformers with Pure RL Gradients | 提出基于纯强化学习梯度的在线微调决策Transformer方法,提升序列决策性能。 | trajectory optimization reinforcement learning offline reinforcement learning |
🔬 支柱八:物理动画 (Physics-based Animation) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 2 | Sequential Reservoir Computing for Efficient High-Dimensional Spatiotemporal Forecasting | 提出序列化储层计算,高效预测高维时空系统 | spatiotemporal |
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Reinforcement Learning with Function Approximation for Non-Markov Processes | 针对非马尔可夫过程,提出基于函数逼近的强化学习方法 | reinforcement learning |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | Combining datasets with different ground truths using Low-Rank Adaptation to generalize image-based CNN models for photometric redshift prediction | 提出低秩适应方法以结合不同真值数据集提升红移预测精度 | large language model |