arXiv 中文要点汇总
🤖 cs.RO
机器人📊 领域分布
机器人控制 6113
RL算法与架构 991
具身大模型 752
空间感知与语义 686
物理动画 84
动作重定向 74
空间感知 65
生成式动作 59
视频提取与匹配 48
其他 13
交互与反应 9
📆 最近更新
📝 最新论文
- Model-Based Reinforcement Learning Exploits Passive Body Dyn...
基于模型的强化学习利用被动身体动力学实现高性能双足机器人运动 - Switch: Learning Agile Skills Switching for Humanoid Robots
Switch:面向人形机器人的敏捷技能切换学习方法 - World-Value-Action Model: Implicit Planning for Vision-Langu...
提出World-Value-Action模型,用于提升视觉-语言-动作系统中长时... - DockAnywhere: Data-Efficient Visuomotor Policy Learning for ...
DockAnywhere:通过新颖的演示生成方法,实现移动操作中数据高效的视觉运... - A Hierarchical Spatiotemporal Action Tokenizer for In-Contex...
提出一种层级时空动作Tokenizer,用于机器人上下文模仿学习,实现SOTA性...
👁️ cs.CV
视觉📊 领域分布
具身大模型 4808
RL算法与架构 3406
空间感知与语义 3294
机器人控制 997
视频提取与匹配 441
生成式动作 434
物理动画 384
动作重定向 334
空间感知 328
交互与反应 152
视频提取与匹配 6
其他 5
📆 最近更新
📝 最新论文
- NG-GS: NeRF-Guided 3D Gaussian Splatting Segmentation 🔗
NG-GS:NeRF引导的3D高斯溅射分割,解决边界离散化问题 - RaTA-Tool: Retrieval-based Tool Selection with Multimodal La...
RaTA-Tool:基于检索的多模态大语言模型工具选择框架 - GlobalSplat: Efficient Feed-Forward 3D Gaussian Splatting vi... 🔗
GlobalSplat:通过全局场景令牌实现高效的前馈3D高斯溅射 - R3D: Revisiting 3D Policy Learning
R3D:通过引入3D数据增强和优化网络结构,提升3D策略学习的稳定性和泛化性 - HAMSA: Scanning-Free Vision State Space Models via SpectralP...
HAMSA:通过SpectralPulseNet实现无扫描的视觉状态空间模型
🎨 cs.GR
图形学📊 领域分布
空间感知与语义 255
机器人控制 92
具身大模型 64
生成式动作 56
RL算法与架构 46
物理动画 38
动作重定向 15
视频提取与匹配 12
空间感知 6
交互与反应 3
视频提取与匹配 1
📆 最近更新
📝 最新论文
- A Unified Conditional Flow for Motion Generation, Editing, a...
提出统一条件流模型,解决运动生成、编辑和结构内重定向问题 - VVGT: Visual Volume-Grounded Transformer
提出VVGT,一种直接将体数据映射到3D高斯溅射的Transformer框架,实... - Predicting User Satisfaction in Online Education Platforms: ...
提出基于LLM的多模态框架,用于预测在线教育平台的用户满意度 - Physics-Based Motion Tracking of Contact-Rich Interacting Ch...
提出基于渐进神经网络的运动跟踪方法,解决接触丰富的交互角色动画生成问题 - AniGen: Unified $S^3$ Fields for Animatable 3D Asset Generat... 🔗
AniGen:提出统一的S³场,用于生成可动画的3D资产
🧠 cs.LG
机器学习 (RL, Diffusion, World Model)📊 领域分布
RL算法与架构 4476
具身大模型 4084
机器人控制 533
物理动画 368
生成式动作 100
交互与反应 64
动作重定向 60
空间感知与语义 54
视频提取与匹配 26
空间感知 3
其他 1
📆 最近更新
📝 最新论文
- Assessing the Potential of Masked Autoencoder Foundation Mod...
评估掩码自编码器基础模型在利用地面钻井数据预测井下参数方面的潜力 - Learning Ad Hoc Network Dynamics via Graph-Structured World ...
提出G-RSSM,通过图结构世界模型学习Ad hoc网络动态,用于size无关的... - DLink: Distilling Layer-wise and Dominant Knowledge from EEG...
DLink:从脑电图基础模型中蒸馏分层和主导知识,实现轻量化部署。 - Assessing the Performance-Efficiency Trade-off of Foundation...
对比研究:电力价格概率预测中基础模型与专用模型的性能效率权衡 - Predicting Post-Traumatic Epilepsy from Clinical Records usi...
利用大语言模型嵌入,从临床记录预测创伤后癫痫风险
🤔 cs.AI
人工智能 (Agents, Planning)📊 领域分布
具身大模型 6319
RL算法与架构 2107
机器人控制 415
物理动画 123
空间感知与语义 86
生成式动作 71
交互与反应 52
动作重定向 33
视频提取与匹配 30
空间感知 3
📆 最近更新
📝 最新论文
- Learning to Think Like a Cartoon Captionist: Incongruity-Res...
提出IRS框架,通过不协调-解决监督提升多模态幽默理解能力 - CoTEvol: Self-Evolving Chain-of-Thoughts for Data Synthesis ...
提出CoTEvol,通过自进化思维链进行数学推理数据合成 - Disentangle-then-Refine: LLM-Guided Decoupling and Structure...
提出SDM-SCR框架以解决图对比学习中的信号与噪声纠缠问题 - Towards Faster Language Model Inference Using Mixture-of-Exp...
提出MoE-FM框架,加速非自回归语言模型推理,显著提升效率。 - Predicting Power-System Dynamic Trajectories with Foundation...
提出LASS-ODE-Power,利用大规模预训练预测电力系统动态轨迹。
💬 cs.CL
自然语言 (VLA, Text-to-Motion)📊 领域分布
具身大模型 11906
RL算法与架构 2311
机器人控制 207
视频提取与匹配 69
空间感知与语义 43
物理动画 31
生成式动作 28
动作重定向 24
交互与反应 16
空间感知 1
📆 最近更新
📝 最新论文
- Fact4ac at the Financial Misinformation Detection Challenge ... 🔗
提出基于微调和少样本提示的大语言模型金融虚假信息检测方法,无需外部参考。 - Knowing When Not to Answer: Evaluating Abstention in Multimo...
提出MM-AQA基准,评估多模态推理系统中有效拒绝回答的能力 - IUQ: Interrogative Uncertainty Quantification for Long-Form ... 🔗
提出IUQ框架,通过提问式不确定性量化提升长文本大语言模型生成结果的可信度。 - Compressing Sequences in the Latent Embedding Space: $K$-Tok...
提出K-Token Merging,通过潜在空间压缩减少LLM长文本处理的计算成... - QuantCode-Bench: A Benchmark for Evaluating the Ability of L...
提出QuantCode-Bench基准,评估大语言模型生成可执行量化交易策略的能...
⚙️ eess.SY
系统控制 (MPC, Dynamics)📊 领域分布
机器人控制 832
RL算法与架构 331
生成式动作 180
物理动画 147
具身大模型 130
交互与反应 19
空间感知与语义 8
动作重定向 5
其他 4
空间感知 3
视频提取与匹配 3
📆 最近更新
📝 最新论文
- Energy-based Regularization for Learning Residual Dynamics i... 🔗
提出基于能量正则化的神经MPC,用于全向飞行机器人的残差动力学学习 - Co-Design of Cryptographic Parameters and Delay-Aware Feedba...
针对加密控制系统,提出密码参数与时延感知反馈增益的协同设计框架 - Quantifying and Improving the Accuracy of Electromagnetic Tr...
提出一种量化和提高电磁暂态-暂态稳定混合仿真精度的方法 - Cascaded TD3-PID Hybrid Controller for Quadrotor Trajectory ...
提出级联TD3-PID混合控制框架,提升四旋翼飞行器在风扰环境下的轨迹跟踪性能 - Importance of Aggregated DER Installed Capacity in Distribut...
提出基于聚合信息的配电网分布式电源容量估计方法