CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于强化学习的多无人机协同任务规划技术
作者张梦瑶
答辩日期2024-05
文献子类硕士
关键词多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习
英文摘要

随着现代战场环境的日益复杂化,多维度的战场空间和多样化的任务类型对传统作战模式提出了更高的挑战。无人机(Unmanned Aerial Vehicle, UAV)的作用日益凸显,特别是在执行复杂、危险和需多机协同的任务中。单一无人机因自身能力限制难以应对多元复杂的任务需求,因此多无人机协同作战成为提高任务完成率、扩展作战能力的重要途径,因此如何高效、智能地规划多无人机协同任务成为了迫切需要解决的问题。本文基于此背景,提出了一种基于强化学习的多无人机协同任务规划技术,旨在解决现有研究中模型单一化、算法效率低下、求解速度慢的问题,以期提高无人机协同作战的智能化水平和效率。本文的主要贡献总结为以下三点:

1)提出了一种面向机器学习的多无人机协同任务规划建模方法。本研究首先分析了多无人机协同任务规划的需求和挑战,包括任务的复杂性、动态变化的战场环境以及无人机之间的协同需求。所建立的模型进一步将多无人机协同任务规划问题转化为多旅行商问题(MTSP),并融入多机协同的多种约束条件、多个优化目标、任务优先级等信息,实现为每架无人机合理地分配对应的攻击任务,并且使得所有目标点都得到有效攻击,为后续的强化学习算法设计提供了坚实的理论基础。

2)提出了一种基于图神经网络与强化学习的多无人机协同任务规划算法。该框架提出了改进图同构网络(Graph Isomorphism Network, GIN)对任务规划问题的图表示进行特征嵌入编码,而后设计一种分布式策略网络来学习节点的分配方式,并采用改进 REINFORCE 算法来训练该模型。整体框架上,采用分而治之的思想,上层策略用于完成节点分配,下层策略则用于实现序贯决策。本研究结合图神经网络的表达能力与强化学习的决策能力,以适应实际战场环境的动态性,并通过智能算法提升任务规划的效率。

3)设计了典型场景下的实验测试及框架泛化性能检验。本文基于典型的无人机对地封控等任务场景,开展了一系列的实验测试。通过比较不同无人机数量、不同任务数量下的任务分配响应时间、可靠性等指标,全面评估了所设计算法的性能。同时,将所训练模型应用于大规模问题中,验证了所提方案强大的泛化能力。实验结果表明,相较于传统方法,基于强化学习的多无人机协同任务规划技术能够显著提高任务完成的质量和效率,验证了本文方法的有效性和实用性。该技术可实现多无人机有效任务分配,显著提高无人机集群的协同作战能力,减少任务执行时间成本,具有重要的军事和民用应用价值。

本论文的研究不仅为多无人机协同任务规划提供了一种新的解决方案,也为未来无人机智能控制和决策提供了理论基础和技术参考,对推动无人机技术和智能化作战具有重要意义。

语种中文
页码84
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/58502]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
张梦瑶. 基于强化学习的多无人机协同任务规划技术[D]. 2024.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace