LiftNav: Path Planning via Semantic Lifting in TSDF-Guided Gaussian Splatting
作者: Hannah Schieber, Dominik Frischmann, Victor Schaack, Angela P. Schoellig, Daniel Roth
分类: cs.RO, cs.CV, cs.GR
发布日期: 2026-05-29
💡 一句话要点
LiftNav:基于TSDF引导高斯溅射的语义提升路径规划
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 语义导航 高斯溅射 TSDF 路径规划 机器人 碰撞避免 B样条曲线
📋 核心要点
- 现有方法在未知环境中,TSDF虽然支持安全规划,但缺乏语义信息;高斯溅射虽然提供丰富的表观信息,但几何结构不精确,限制了精确避障。
- LiftNav的核心思想是结合TSDF和高斯溅射的优势,利用TSDF进行安全规划,并利用高斯溅射提供的表观信息进行语义理解,从而实现语义导航。
- 实验结果表明,LiftNav在可行率和轨迹长度方面优于最先进的辐射场基线,验证了该方法在语义导航方面的有效性。
📝 摘要(中文)
针对未知室内环境中的自主机器人,提出了一种混合导航框架LiftNav,它结合了可靠的避障和物体级别的理解。LiftNav基于GSFusion的TSDF+GS双重地图,并集成了实时YOLO检测、基于TSDF的3D提升和B样条轨迹优化流程。这种设计实现了灵活的语义导航,无需密集的3D嵌入。此外,引入了一种基于hinge loss的碰撞惩罚,以提高轨迹的平滑性和安全性。在Replica数据集的仿真环境中评估了该方法,与最先进的辐射场基线相比,可行率达到100%,并获得了更短的轨迹。
🔬 方法详解
问题定义:自主机器人在未知室内环境中导航,需要同时具备可靠的避障能力和对环境的语义理解。传统的TSDF方法虽然能够提供精确的几何信息,支持安全路径规划,但缺乏语义信息,无法进行物体级别的推理和交互。而基于高斯溅射(Gaussian Splatting, GS)的方法虽然能够提供高质量的渲染效果和丰富的表观信息,但其几何表示较为模糊,难以进行精确的碰撞检测和路径规划。因此,如何在保证安全性的前提下,赋予机器人语义理解能力,是本文要解决的核心问题。
核心思路:LiftNav的核心思路是将TSDF和高斯溅射两种表示方法结合起来,利用TSDF进行安全路径规划,并利用高斯溅射提供的表观信息进行语义理解。具体来说,首先利用GSFusion构建TSDF+GS双重地图,然后利用YOLO进行物体检测,并将检测到的2D物体提升到3D空间,最后利用B样条轨迹优化算法生成安全且语义相关的轨迹。
技术框架:LiftNav的整体框架包含以下几个主要模块:1) GSFusion:构建TSDF+GS双重地图,提供环境的几何和表观信息。2) YOLO检测:利用YOLO算法对高斯溅射图像进行物体检测,获取场景中的物体类别和位置信息。3) TSDF-based 3D Lifting:将2D物体检测结果提升到3D空间,得到物体在TSDF地图中的3D位置。4) B-spline Trajectory Optimization:利用B样条曲线对轨迹进行优化,同时考虑碰撞避免和语义信息,生成安全且语义相关的轨迹。
关键创新:LiftNav的关键创新在于将TSDF和高斯溅射两种表示方法结合起来,并提出了一种基于TSDF的3D提升方法,将2D物体检测结果映射到3D空间。此外,还引入了一种基于hinge loss的碰撞惩罚,以提高轨迹的平滑性和安全性。与现有方法相比,LiftNav能够在保证安全性的前提下,实现语义导航,无需密集的3D嵌入。
关键设计:在TSDF-based 3D Lifting模块中,利用TSDF地图提供的深度信息,将2D物体检测结果投影到3D空间。具体来说,首先利用相机内参将2D像素坐标转换为3D射线,然后利用TSDF地图查询射线上的深度值,从而得到3D点的坐标。在B-spline Trajectory Optimization模块中,使用B样条曲线表示轨迹,并利用优化算法最小化轨迹的长度、曲率和碰撞惩罚。碰撞惩罚采用hinge loss的形式,当轨迹与障碍物之间的距离小于一定阈值时,才会产生惩罚。
🖼️ 关键图片
📊 实验亮点
实验结果表明,LiftNav在Replica数据集上取得了显著的性能提升。与最先进的辐射场基线相比,LiftNav的可行率达到100%,这意味着LiftNav能够成功规划出安全可行的轨迹。此外,LiftNav生成的轨迹长度更短,表明LiftNav能够更高效地完成导航任务。这些结果验证了LiftNav在语义导航方面的有效性。
🎯 应用场景
LiftNav具有广泛的应用前景,例如在家庭服务机器人、仓储物流机器人、医疗机器人等领域,可以帮助机器人在复杂环境中安全、高效地完成任务。通过结合语义理解能力,机器人可以更好地理解人类指令,并与环境进行交互,从而提供更智能、更人性化的服务。未来,该技术还可以应用于自动驾驶、增强现实等领域。
📄 摘要(原文)
Autonomous robots in unknown indoor environments require both reliable collision avoidance and object-level understanding. Classical representations such as TSDF support safe planning but lack semantics, while photorealistic methods like Gaussian Splatting (GS) provide rich appearance yet suffer from soft geometry, limiting precise obstacle avoidance. We present LiftNav, a hybrid navigation framework built on GSFusion's TSDF+GS dual map, augmented with a real-time pipeline of YOLO-based detection, TSDF-based 3D lifting, and B-spline trajectory optimization. This design enables flexible semantic navigation without dense 3D embeddings. We further introduce a hinge-loss-based collision penalty that improves trajectory smoothness and safety. We evaluate our approach in a simulation using the Replica dataset. Compared against a state-of-the-art radiance field baseline we show a 100% feasibility rate and shorter trajectories.