基于场数据的无人机目标任务自主区域搜索与分配方法与流程

    专利查询2025-06-14  23


    本发明属于无人机和人工智能领域,具体涉及一种基于场数据的无人机目标任务自主区域搜索与分配方法。


    背景技术:

    1、无人机具有驻空时间长、任务载重大、可定点驻留等优点,是通信、遥感、气象探测等应用开展的理想飞行平台。近年来,随着无人机平台和任务载荷技术的逐步发展,无人机的相关应用需求越来越迫切,业界亟待无人飞行应用稳健落地。无人机应用需求对其能力提出了越来越高的要求,需要其在复杂的环境条件下稳定可靠的执行任务并提升自主飞行能力,任务飞行规划成为提升无人机应用能力的关键环节。

    2、在迫切的应用需求下,无人机技术不断发展,但无人机任务飞行规划方法仍需突破。无人机作为一种轻于空气依靠浮力飞行的无人机,其飞行受环境中深度场影响显著,虽然无人机通过螺旋桨提供动力而具备了一定的抗风能力,但因为体积庞大抗风能力终究有限。


    技术实现思路

    1、(一)要解决的技术问题

    2、本发明要解决的技术问题是如何提供一种基于场数据的无人机目标任务自主区域搜索与分配方法,以解决无人机任务飞行规划的问题。

    3、(二)技术方案

    4、为了解决上述技术问题,本发明提出一种基于场数据的无人机目标任务自主区域搜索与分配方法,该方法包括如下步骤:

    5、s1、根据任务飞行规划应用数据结构,设计深度神经网络模型用来融合无人机状态信息和深度场信息;将融合的深度场信息、无人机状态信息输入长短期记忆神经网络感受融合信息的变化趋势;

    6、s2、将任务决策过程看作马尔科夫决策过程,基于无人机状态变化模型和深度对抗循环q神经网络设计智能体,以长短期记忆神经网络的输出作为智能体的输入,输出无人机动作决策,并循环决策得到航迹规划点;

    7、s3、建立无人机飞行仿真环境,包括深度场生成模型,并设置相应的奖励机制使智能体在与环境交互中获得实时反馈;

    8、s4、根据步骤s3得到的仿真环境中,利用强化学习开展训练,通过最大化价值函数使无人机在与环境的交互中学习策略,最大化价值函数的计算公式如下:

    9、

    10、其中,γ为衰减因子,rt为当前时刻决策的奖励,st为智能体当前时刻的输入,at为当前时刻的无人机动作决策输出,st+1为智能体下一时刻的输入,at+1为下一时刻的无人机动作决策输出,表示对所有可能产生的st+1的期望;

    11、s5、用实际深度场数据对于是否完成避障决策飞行进行测试,对测试的结果进行智能决策的性能评估。

    12、(三)有益效果

    13、本发明提出一种基于场数据的无人机目标任务自主区域搜索与分配方法,本发明采用上述一种基于场数据的无人机目标任务自主区域搜索与分配方法,通过多种人工智能模型的使用,在节省无人机能源消耗的同时能够快速抵达任务目标区域并实现高效驻留,支撑任务开展。



    技术特征:

    1.一种基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,该方法包括如下步骤:

    2.如权利要求1所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s1中,设计深度神经网络模型用来融合无人机状态信息和深度场信息包括:利用卷积神经网络提取当前时刻的深度场信息特征,再利用全连接层神经网络融合深度场与无人机状态信息。

    3.如权利要求2所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s1具体包括:

    4.如权利要求3所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s1中,融合无人机状态信息和深度场信息时,还融合任务信息。

    5.如权利要求1-4任一项所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s2包括:任务决策过程为马尔科夫决策过程,以长短期记忆神经网络的输出作为智能体的输入,通过深度对抗循环q神经网络获得无人机动作决策,在无人机采取动作决策后根据无人机状态变化模型更新得到下一时刻的无人机状态信息,通过循环迭代,得到无人机的任务规划结果。

    6.如权利要求5所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,无人机状态变化模型仅考虑无人机的运动学模型,无人机拥有4个自由度:3个位置自由度,1个旋转自由度;

    7.如权利要求5所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s2具体包括:

    8.如权利要求5所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s3中的奖励机制为对当前无人机采用动作决策的评价机制,无人机在当前时刻的融合信息基础上采取动作决策后,会转移到下一个时刻的融合信息,奖励机制通过对比当前时刻的融合信息和下一个时刻的融合信息的变化做出评价;

    9.如权利要求8所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s5中,智能决策的性能评估包括:

    10.如权利要求9所述的基于场数据的无人机目标任务自主区域搜索与分配方法,其特征在于,所述步骤s52中,对无人机完成目标状态进行评估包括:通过无人机的最终位置与目标点的距离进行判定。


    技术总结
    本发明涉及一种基于场数据的无人机目标任务自主区域搜索与分配方法,属于无人机和人工智能领域。本发明根据任务飞行规划应用数据结构,设计深度神经网络模型感知深度场信息,通过将感知的信息通过长短期记忆人工网络层后结合深度对抗循环Q神经网络,建立智能体;设计智能体,建立无人机飞行仿真环境,设置奖励机制使智能体在与环境交互中获得实时反馈;利用强化学习思想开展模型训练,通过最大化价值函数使无人机与环境的交互中学习最优策略,对是否完成目标进行测试,对结果进行智能决策的性能评估。本发明节省无人机能源消耗,能快速抵达任务目标区域并高效驻留,支撑任务开展。

    技术研发人员:袁博,郭伟,宁京宣,王凯,杜松阳,王群,樊明,贾理理,姚俊楠,冯晓容,张立健,袁加鑫,张胜满,张迎,胥银华,岳凡,郑华利,张建军,高飞
    受保护的技术使用者:中国人民解放军32180部队
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-29408.html

    最新回复(0)