AI Level of Detail: Distance-Aware ML Model Precision Selection for Real-Time Human Motion Prediction in Games

📄 arXiv: 2606.06565v1 📥 PDF

作者: Mathew Varghese

分类: cs.GR, cs.HC, cs.LG

发布日期: 2026-06-04

备注: Camera-ready for SIGGRAPH Technical Workshops 2026


💡 一句话要点

提出AI细节层次以解决实时人类动作预测问题

🎯 匹配领域: 支柱七:动作重定向 (Motion Retargeting) 支柱八:物理动画 (Physics-based Animation)

关键词: AI细节层次 实时动画 机器学习 量化模型 NPC动画 游戏引擎 动作捕捉

📋 核心要点

  1. 现有方法在动画NPC时计算资源消耗巨大,难以实时处理。
  2. 提出AI LOD框架,通过距离调整机器学习模型的推理精度,降低计算负担。
  3. 在CMU动作捕捉数据集上验证了不同精度层次在指定距离范围内的有效性,感知降级微小。

📝 摘要(中文)

现代游戏引擎在动画非玩家角色(NPC)时,需消耗大量计算资源。本文提出AI细节层次(AI LOD)框架,根据NPC与玩家摄像机之间的距离调整机器学习推理精度。该方法借鉴经典几何细节层次的思想:在差异不可察觉时,使用更便宜的近似值。这里的近似是低精度量化的机器学习模型,而非低多边形网格。本文的贡献在于提出AI LOD概念,即推理时量化可以作为AI驱动角色动画的细节层次轴,并适用于任何感知敏感度随上下文变化的AI运行时系统。通过在CMU动作捕捉数据集上的评估,初步证据表明,每个精度层次可以在其指定的距离范围内提供服务,且感知降级微乎其微,支持基于距离的机器学习模型精度选择作为AI角色动画的可行细节层次策略。

🔬 方法详解

问题定义:本文旨在解决现代游戏中NPC动画计算资源消耗过大的问题。现有方法在实时处理时面临精度与性能之间的权衡,导致无法高效运行。

核心思路:AI LOD框架的核心思想是根据NPC与玩家摄像机的距离动态调整机器学习模型的推理精度,使用低精度量化模型替代高精度模型,以降低计算负担。

技术框架:整体架构包括三个主要模块:1) 距离感知选择器,根据NPC与摄像机的距离选择合适的模型精度;2) 量化模型,提供不同精度(FP32、FP16、INT8)的ONNX运行时变体;3) 动画生成模块,使用选定的模型生成NPC动画。

关键创新:最重要的技术创新在于提出了AI LOD概念,首次将推理时的量化作为AI驱动角色动画的细节层次轴,突破了传统几何细节层次的限制。

关键设计:在模型设计中,采用了卷积序列到序列模型,并通过量化技术生成不同精度的模型变体,确保在不同距离下的推理精度与性能平衡。

📊 实验亮点

实验结果表明,AI LOD框架在CMU动作捕捉数据集上有效地实现了不同精度层次的动态选择,且在指定距离范围内,感知降级几乎不可察觉。这一方法在性能上较传统方法有显著提升,支持了基于距离的机器学习模型精度选择的有效性。

🎯 应用场景

该研究的潜在应用领域包括游戏开发、虚拟现实和增强现实等场景,能够显著提升NPC动画的实时性和流畅度,降低计算资源消耗,进而提高用户体验。未来,AI LOD框架还可扩展至其他AI驱动的实时系统,具有广泛的应用价值。

📄 摘要(原文)

Modern game engines spend significant compute animating NPCs with learned motion models. This paper proposes AI Level of Detail (AI LOD), a framework in which machine learning inference precision is adapted based on the distance between each NPC and the player camera. The core idea mirrors classical geometry LOD: substitute a cheaper approximation where the difference is imperceptible. Here, the approximation is a lower-precision quantized machine learning model rather than a lower-polygon mesh. The contribution of this work is the AI LOD concept itself: that inference-time quantization can serve as the LOD axis for AI-driven character animation - and more broadly, for any AI-based runtime system where perceptual sensitivity varies with context. The convolutional sequence-to-sequence model of Li et al. is used as a representative example to demonstrate the concept, with its trained checkpoint exported into three ONNX Runtime variants (FP32, FP16, and INT8 per-tensor), intended to be routed by a distance-based selector at runtime. Evaluation on the CMU Mocap dataset provides initial evidence that each precision tier can be served at its assigned distance range with negligible perceptible degradation, supporting the broader premise that distance-aware ML model precision selection is a viable LOD strategy for AI-based character animation.