SafeDiver: Cooperative AUV-USV Assisted Diver Communication via Multi-agent Reinforcement Learning Approach

📄 arXiv: 2509.11508v2 📥 PDF

作者: Tinglong Deng, Hang Tao, Xinxiang Wang, Yinyan Wang, Hanjiang Luo

分类: cs.MA, cs.LG, cs.RO

发布日期: 2025-09-15 (更新: 2025-10-23)

备注: Withdrawn to reorganize and extend the current findings in a future version


💡 一句话要点

SafeDiver:基于多智能体强化学习的水下通信辅助系统

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 水下通信 多智能体强化学习 AUV USV 协同通信 水下机器人 多模态通信

📋 核心要点

  1. 现有水下通信方法在复杂水下环境中存在固有缺陷,难以满足日益增长的水下通信需求。
  2. 提出一种利用AUV和USV协同工作的水下通信辅助方案,通过多智能体强化学习控制AUV运动,实现可靠高速通信。
  3. 仿真结果表明,该方案能够有效提升潜水员通信的可靠性和速度,验证了方案的可行性。

📝 摘要(中文)

随着水下人类活动的增加,水下通信需求面临严峻挑战。现有的水下通信方法由于其固有的缺点和复杂的水下环境而面临障碍。为了解决这个问题,我们提出了一种利用水面无人系统辅助潜水员进行可靠和高速通信的方案。多个AUV配备光和声多模态通信设备作为中继节点,根据潜水员活动区域的变化提供自适应通信服务。通过使用多智能体强化学习(MARL)方法来控制AUV的协同运动,可以实现潜水员之间的高速和可靠的数据传输。同时,利用无人水面艇(USV)按需部署和广泛覆盖的优势,作为水面中继节点来协调和转发来自AUV的信息,并控制AUV自适应地选择中继USV节点进行数据传输,可以实现潜水员和水面平台之间的高质量通信。通过仿真验证,所提出的方案能够有效地实现潜水员的可靠和高速通信。

🔬 方法详解

问题定义:论文旨在解决水下潜水员通信中存在的可靠性和速度问题。现有的水下通信方法受限于水下环境的复杂性,例如水流、光照、噪声等因素,导致通信质量不稳定,传输速率较低。此外,潜水员的活动范围受限,传统的固定式通信基站难以覆盖整个区域。

核心思路:论文的核心思路是利用多个AUV作为水下中继节点,通过多智能体强化学习(MARL)控制AUV的协同运动,使其能够自适应地跟踪潜水员的活动区域,并提供可靠的通信服务。同时,利用USV作为水面中继节点,协调和转发AUV的信息,实现潜水员与水面平台之间的高质量通信。

技术框架:该方案的技术框架主要包括以下几个模块:1)AUV运动控制模块:使用MARL算法控制AUV的运动,使其能够跟踪潜水员并优化通信链路。2)多模态通信模块:AUV配备光和声多模态通信设备,根据水下环境自适应选择通信方式。3)USV协调模块:USV作为水面中继节点,负责协调和转发AUV的信息,并提供广域覆盖。4)数据传输模块:负责在潜水员、AUV和USV之间进行数据传输,保证数据的可靠性和速度。

关键创新:该论文的关键创新在于:1)提出了一种基于MARL的AUV协同运动控制方法,能够自适应地跟踪潜水员并优化通信链路。2)利用AUV和USV协同工作,构建了一个水下-水面混合通信网络,扩展了通信范围,提高了通信质量。3)采用多模态通信方式,根据水下环境自适应选择通信方式,提高了通信的鲁棒性。

关键设计:在MARL算法中,采用了集中式训练、分布式执行的框架。AUV的状态包括自身位置、速度、与潜水员的距离、与USV的距离等。动作空间包括AUV的运动方向和速度。奖励函数的设计考虑了通信质量、能量消耗和安全性等因素。具体参数设置未知。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过仿真验证了所提出方案的有效性。仿真结果表明,该方案能够显著提高潜水员通信的可靠性和速度。具体的性能数据和对比基线未知,但摘要强调了该方案能够有效地实现潜水员的可靠和高速通信。

🎯 应用场景

该研究成果可应用于水下搜救、水下工程、海洋科考等领域。通过提供可靠和高速的水下通信服务,可以提高水下作业的效率和安全性。未来,该技术还可以应用于水下机器人集群控制、水下环境监测等领域,具有广阔的应用前景。

📄 摘要(原文)

As underwater human activities are increasing, the demand for underwater communication service presents a significant challenge. Existing underwater diver communication methods face hurdles due to inherent disadvantages and complex underwater environments. To address this issue, we propose a scheme that utilizes maritime unmanned systems to assist divers with reliable and high-speed communication. Multiple AUVs are equipped with optical and acoustic multimodal communication devices as relay nodes, providing adaptive communication services based on changes in the diver's activity area. By using a multi-agent reinforcement learning (MARL) approach to control the cooperative movement of AUVs, high-speed and reliable data transmission between divers can be achieved. At the same time, utilizing the advantages of on-demand deployment and wide coverage of unmanned surface vehicles (USVs) as surface relay nodes to coordinate and forward information from AUVs, and controlling AUVs to adaptively select relay USV nodes for data transmission, high-quality communication between divers and surface platform can be achieved. Through simulation verification, the proposed scheme can effectively achieve reliable and high-speed communication for divers.