cs.LG(2025-05-03)
📊 共 4 篇论文
🎯 兴趣领域导航
支柱二:RL算法与架构 (RL & Architecture) (2)
支柱五:交互与反应 (Interaction & Reaction) (1)
支柱八:物理动画 (Physics-based Animation) (1)
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning | 提出AEPO,通过解析能量引导的策略优化解决离线强化学习中的能量估计难题。 | reinforcement learning offline RL offline reinforcement learning | ||
| 2 | LookAlike: Consistent Distractor Generation in Math MCQs | LookAlike:通过偏好优化生成一致性数学多选题干扰项 | DPO direct preference optimization large language model |
🔬 支柱五:交互与反应 (Interaction & Reaction) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Privacy Preserving Machine Learning Model Personalization through Federated Personalized Learning | 提出基于联邦个性化学习的隐私保护机器学习模型个性化框架 | OMOMO |
🔬 支柱八:物理动画 (Physics-based Animation) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | Multi-Scale Graph Learning for Anti-Sparse Downscaling | 提出多尺度图学习MSGL方法,解决流域水温反稀疏降尺度问题。 | spatiotemporal |