Large Language Model-Assisted UAV Operations and Communications: A Multifaceted Survey and Tutorial

作者: Yousef Emami, Hao Zhou, Radha Reddy, Atefeh Hajijamali Arani, Biliang Wang, Kai Li, Luis Almeida, Zhu Han

分类: cs.RO, cs.AI

发布日期: 2026-02-23

备注: 40 pages, 10 figures, 13 tables

💡 一句话要点

提出基于大语言模型的无人机操作与通信框架，提升无人机智能化和自适应能力

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 无人机 大语言模型 多模态学习 集群控制 自主导航 任务规划 人机交互

📋 核心要点

传统无人机方法在环境理解、集群协调和高级任务推理方面存在局限性，难以适应复杂环境。
该研究提出将LLM集成到无人机系统中，利用LLM的强大能力实现更高级的环境理解和任务推理。
通过对现有架构、方法和应用的整合，构建了一个统一的LLM辅助无人机框架，为未来研究奠定基础。

📝 摘要（中文）

本文系统性地探讨了大语言模型（LLM）与无人机（UAV）技术的交叉领域，并提出了一个统一的框架，整合了现有的无人机架构、方法和应用。首先，对LLM在无人机上的应用技术进行了结构化分类，包括预训练、微调、检索增强生成（RAG）和提示工程，以及诸如思维链（CoT）和上下文学习（ICL）等关键推理能力。然后，研究了LLM辅助的无人机通信和操作，涵盖导航、任务规划、集群控制、安全、自主性和网络管理。进一步讨论了多模态LLM（MLLM）在人机群交互、感知驱动导航和协同控制中的应用。最后，讨论了伦理考量，包括偏见、透明度、问责制和人机回路（HITL）策略，并概述了未来的研究方向。总体而言，这项工作将LLM辅助的无人机定位为智能和自适应空中系统的基础。

🔬 方法详解

问题定义：现有无人机系统在复杂环境下的自主性和智能化程度不足，难以进行高级任务推理和环境理解。传统的基于优化和学习的方法难以满足日益增长的需求，尤其是在集群控制、安全保障和网络管理等方面存在瓶颈。

核心思路：利用大语言模型（LLM）强大的语言理解和生成能力，将其集成到无人机系统中，从而提升无人机的环境感知、任务规划、集群协调和自主决策能力。通过LLM，无人机可以更好地理解人类指令，进行更复杂的推理，并生成更合理的行动方案。

技术框架：该框架涵盖了LLM在无人机应用中的各个方面，包括：1) LLM适应技术（预训练、微调、RAG、提示工程）；2) LLM辅助的无人机通信和操作（导航、任务规划、集群控制、安全、自主性、网络管理）；3) 多模态LLM（MLLM）应用（人机群交互、感知驱动导航、协同控制）。整体流程是从环境感知到任务规划，再到行动执行，最后进行反馈和优化。

关键创新：该研究的关键创新在于系统性地将LLM应用于无人机领域，并提出了一个统一的框架，整合了现有的研究成果。此外，该研究还深入探讨了MLLM在无人机中的应用，以及伦理考量，为未来的研究方向提供了指导。

关键设计：LLM适应技术包括：1) 预训练：利用大规模文本数据训练LLM；2) 微调：利用无人机相关数据对LLM进行微调，使其更适应无人机任务；3) RAG：利用检索增强生成技术，从外部知识库中检索相关信息，辅助LLM进行推理；4) 提示工程：设计合适的提示语，引导LLM生成期望的输出。此外，还考虑了思维链（CoT）和上下文学习（ICL）等推理能力。

🖼️ 关键图片

📊 实验亮点

该论文是一篇综述性文章，主要贡献在于对LLM在无人机领域的应用进行了系统性的梳理和总结，并提出了一个统一的框架。虽然没有具体的实验数据，但该研究为未来的研究方向提供了指导，并强调了伦理考量的重要性。

🎯 应用场景

该研究成果可广泛应用于物流配送、环境监测、灾害救援、农业植保、安防巡检等领域。通过LLM的赋能，无人机可以更好地适应复杂环境，执行更高级的任务，提高工作效率和安全性。未来，随着LLM技术的不断发展，无人机将在更多领域发挥重要作用。

📄 摘要（原文）

Uncrewed Aerial Vehicles (UAVs) are widely deployed across diverse applications due to their mobility and agility. Recent advances in Large Language Models (LLMs) offer a transformative opportunity to enhance UAV intelligence beyond conventional optimization-based and learning-based approaches. By integrating LLMs into UAV systems, advanced environmental understanding, swarm coordination, mobility optimization, and high-level task reasoning can be achieved, thereby allowing more adaptive and context-aware aerial operations. This survey systematically explores the intersection of LLMs and UAV technologies and proposes a unified framework that consolidates existing architectures, methodologies, and applications for UAVs. We first present a structured taxonomy of LLM adaptation techniques for UAVs, including pretraining, fine-tuning, Retrieval-Augmented Generation (RAG), and prompt engineering, along with key reasoning capabilities such as Chain-of-Thought (CoT) and In-Context Learning (ICL). We then examine LLM-assisted UAV communications and operations, covering navigation, mission planning, swarm control, safety, autonomy, and network management. After that, the survey further discusses Multimodal LLMs (MLLMs) for human-swarm interaction, perception-driven navigation, and collaborative control. Finally, we address ethical considerations, including bias, transparency, accountability, and Human-in-the-Loop (HITL) strategies, and outline future research directions. Overall, this work positions LLM-assisted UAVs as a foundation for intelligent and adaptive aerial systems.

Large Language Model-Assisted UAV Operations and Communications: A Multifaceted Survey and Tutorial

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理