本技术涉及人工智能领域,特别涉及一种命令文本的处理方法、训练方法、装置、设备及存储介质。
背景技术:
1、在包括虚拟场景的应用程序中部署有大量的场景物体,为虚拟角色的虚拟活动提供虚拟空间。
2、在相关技术中,通常以映射方式确定自然语义和虚拟角色的行为,比如控制虚拟角色向前移动是通过固定口令“前进”触发的。
3、然而,上述固定口令种类单一,如何确定自然语义中对非玩家角色的控制方式,是亟待解决的问题。
技术实现思路
1、本技术提供了一种命令文本的处理方法、训练方法、装置、设备及存储介质,所述技术方案如下:
2、根据本技术的一方面,提供了一种命令文本的处理方法,所述方法包括:
3、获取自然语言形式的命令文本,所述命令文本用于在虚拟场景中指挥非玩家角色,所述非玩家角色在所述虚拟场景中具有多种行为能力,所述多种行为能力对应多种分类标签;
4、调用至少一个分层预测网络对所述命令文本执行意图识别,得到所述命令文本意图指挥所述非玩家角色的分类标签;
5、其中,所述分层预测网络包括至少两层子网络,所述至少两层子网络是基于所述多种分类标签的树状结构构建的。
6、根据本技术的另一方面,提供了一种分层预测网络的训练方法,所述方法包括:
7、获取样本命令和所述样本命令的样本标签,所述样本标签是所述样本命令的类型标签;
8、调用至少一个分层预测网络对所述样本命令执行意图识别,得到所述样本命令意图指挥所述非玩家角色的预测标签;
9、根据所述预测标签和所述样本标签之间的区别,对所述分层预测网络执行后向误差传播训练,得到训练后的分层预测网络;
10、其中,所述分层预测网络包括至少两层子网络,所述至少两层子网络是基于所述多种分类标签的树状结构构建的。
11、根据本技术的另一方面,提供了一种命令文本的处理装置,所述装置包括:
12、获取模块,用于获取自然语言形式的命令文本,所述命令文本用于在虚拟场景中指挥非玩家角色,所述非玩家角色在所述虚拟场景中具有多种行为能力,所述多种行为能力对应多种分类标签;
13、预测模块,用于调用至少一个分层预测网络对所述命令文本执行意图识别,得到所述命令文本意图指挥所述非玩家角色的分类标签;
14、其中,所述分层预测网络包括至少两层子网络,所述至少两层子网络是基于所述多种分类标签的树状结构构建的。
15、在本技术的一个可选设计中,所述至少一个分层预测网络中的每个分层预测网络用于预测所述命令文本在一个意图维度上针对所述非玩家角色的指挥意图;
16、所述每个分层预测网络中的第i层子网络用于预测所述命令文本在所述一个意图维度上的一级行为标签,所述分层预测网络中的第i+1层子网络用于预测所述命令文本在所述一级行为标签中对应的二级行为标签,i为正整数;
17、其中,所述意图维度包括:主语维度、语义维度、行为维度中的至少一种。
18、在本技术的一个可选设计中,所述意图维度包括所述主语维度,所述分层预测网络包括分层结构的主语预测网络,所述主语预测网络具有预测命令文本中的主语类型的能力;所述主语类型用于指示受到所述命令文本指挥的所述非玩家角色的身份;
19、和/或,所述意图维度包括所述语义维度,所述分层预测网络包括分层结构的语义预测网络,所述语义预测网络具有预测命令文本中的语义类型的能力;所述语义类型用于指示所述非玩家角色对于发起虚拟攻击的控制方式;
20、和/或,所述意图维度包括所述行为维度,所述分层预测网络包括分层结构的行为预测网络,所述行为预测网络具有预测命令文本中的行为意图类型的能力;所述行为意图类型用于指示所述非玩家角色对于执行虚拟活动的行为方式。
21、在本技术的一个可选设计中,所述分层预测网络包括所述主语预测网络,所述预测模块还用于:
22、调用所述主语预测网络中的第i层子网络对所述命令文本执行主语预测,预测得到所述命令文本对应于多个一级候选标签中的所述一级行为标签;所述多个一级候选标签用于指示所述命令文本中是否存在主语;
23、调用所述主语预测网络中与所述一级行为标签对应的第i+1层子网络,对所述命令文本执行主语预测,得到所述命令文本对应于多个二级候选标签中的所述二级行为标签;
24、其中,在所述一级行为标签用于指示所述命令文本中存在主语的情况下,所述多个二级候选标签用于指示所述命令文本的主语是所述命令文本的发送方控制的主控虚拟角色、和/或所述主控虚拟角色所在虚拟阵营中的一个或多个非玩家角色。
25、在本技术的一个可选设计中,所述装置还包括处理模块,用于如下至少之一:
26、在所述一级行为标签用于指示所述命令文本中不存在主语的情况下,确定所述命令文本的所述分类标签为第一标签,所述第一标签用于指示所述命令文本的主语是历史命令中的历史主语,所述历史命令是在所述命令文本之前输入的相邻命令;
27、在所述一级行为标签用于指示所述命令文本中不存在主语的情况下,确定所述命令文本的所述分类标签为第二标签,所述第二标签用于指示所述命令文本的主语是所述主控虚拟角色所在虚拟阵营中的全部非玩家角色。
28、在本技术的一个可选设计中,所述分层预测网络包括所述语义预测网络,所述预测模块还用于:
29、调用所述语义预测网络中的第i层子网络对所述命令文本执行语义预测,预测得到所述命令文本对应于多个一级候选标签中的一级行为标签;所述多个一级候选标签用于指示所述命令文本中是否存在发起虚拟攻击的语义;
30、调用所述语义预测网络中与所述一级行为标签对应的第i+1层子网络,对所述命令文本执行语义预测,得到所述命令文本对应于多个二级候选标签中的所述二级行为标签;
31、其中,在所述一级行为标签用于指示所述命令文本中不存在发起虚拟攻击的自然语义的情况下,所述多个二级候选标签用于指示所述命令文本中的自然语义是避免发起虚拟攻击、或与虚拟攻击无关的其他语义。
32、在本技术的一个可选设计中,所述分层预测网络包括所述行为预测网络,所述预测模块还用于:
33、调用所述行为预测网络中的第i层子网络对所述命令文本执行行为预测,预测得到所述命令文本对应于多个一级候选标签中的一级行为标签;所述多个一级候选标签用于指示虚拟活动类型;
34、调用所述行为预测网络中与所述一级行为标签对应的第i+1层子网络,对所述命令文本执行行为预测,得到所述命令文本对应于多个二级候选标签中的所述二级行为标签;
35、其中,所述多个二级候选标签用于指示所述一级行为标签对应的虚拟活动类型中的多个行为条目。
36、在本技术的一个可选设计中,在所述一级行为标签用于指示所述虚拟活动类型是投掷虚拟道具的情况下,所述多个二级候选标签用于描述需要投掷的虚拟道具的种类;
37、和/或,在所述一级行为标签用于指示所述虚拟活动类型是触发虚拟技能的情况下,所述多个二级候选标签用于描述需要触发的虚拟技能的类型;
38、在所述一级行为标签用于指示所述虚拟活动类型是调整运动特征的情况下,所述多个二级候选标签用于描述调整所述非玩家角色的身体姿态或移动速度;
39、和/或,在所述一级行为标签用于指示所述虚拟活动类型是与所述虚拟场景中的虚拟物品交互的情况下,所述多个二级候选标签用于描述开启或关闭所述虚拟物品;
40、和/或,在所述一级行为标签用于指示所述虚拟活动类型是在所述虚拟场景中移动的情况下,所述多个二级候选标签用于描述移动路径或移动过程中的伴随活动;
41、和/或,在所述一级行为标签用于指示所述虚拟活动类型是回答问询的情况下,所述多个二级候选标签用于描述回答语句中包括所述虚拟场景中的位置信息或针对所述虚拟场景的描述信息的自然语义。
42、在本技术的一个可选设计中,所述装置还包括:
43、处理模块,用于调用基于注意力机制的编码网络对所述命令文本执行特征编码,得到所述命令文本在隐层空间的隐层特征表示;
44、其中,调用所述分层预测网络执行的分类预测是针对所述命令文本的隐层特征表示执行的。
45、在本技术的一个可选设计中,所述处理模块还用于:
46、调用特征编码网络对所述命令文本执行维度编码,得到所述命令文本的维度特征表示,所述维度特征表示用于指示所述命令文本在主语维度、语义维度、行为维度、控制维度中的至少一种维度上的特征表示;
47、对所述命令文本的所述隐层特征表示和所述维度特征表示执行线性变换,得到所述命令文本的融合特征;
48、其中,调用所述分层预测网络执行的分类预测是针对所述命令文本的融合特征执行的。
49、在本技术的一个可选设计中,所述预测模块还用于:
50、调用信息结构预测网络对所述命令文本执行分类预测,预测得到所述命令文本对应于第一控制标签;所述信息结构预测网络具有预测命令文本中是否携带有指挥所述非玩家角色的自然语义的能力,所述第一控制标签用于指示所述命令文本携带有指挥所述非玩家角色的自然语义。
51、在本技术的一个可选设计中,所述预测模块还用于:
52、调用条件随机场对所述命令文本执行实体预测,得到所述命令文本携带的实体标签,所述实体标签对应于所述虚拟场景中的环境元素。
53、在本技术的一个可选设计中,所述获取模块,还用于获取命令文本组,所述命令文本组包括在所述虚拟场景中连续指挥所述非玩家角色的自然语义;
54、处理模块,用于调用编码器对所述命令文本组执行特征编码,得到所述命令文本在隐层空间的第一特征表示;
55、所述处理模块,还用于调用分割器对所述第一特征表示执行语义分割,得到至少两个子特征表示;
56、所述处理模块,还用于调用解码器对所述至少两个子特征表示分别执行特征解码,得到至少两个命令子句,所述至少两个命令子句与所述至少两个子特征表示一一对应;
57、所述获取模块,还用于将所述至少两个命令子句中的第一命令子句确定为所述命令文本。
58、根据本技术的另一方面,提供了一种分层预测网络的训练装置,所述装置包括:
59、获取模块,用于获取样本命令和所述样本命令的样本标签,所述样本标签是所述样本命令的类型标签;
60、预测模块,用于调用至少一个分层预测网络对所述样本命令执行意图识别,得到所述样本命令意图指挥所述非玩家角色的预测标签;
61、训练模块,用于根据所述预测标签和所述样本标签之间的区别,对所述分层预测网络执行后向误差传播训练,得到训练后的分层预测网络;
62、其中,所述分层预测网络包括至少两层子网络,所述至少两层子网络是基于所述多种分类标签的树状结构构建的。
63、在本技术的一个可选设计中,所述训练模块还用于:
64、获取所述预测标签和所述样本标签之间的区别损失;
65、获取第一数量,以及根据所述第一数量确定加权参数,所述第一数量和加权参数之间呈负相关关系,所述第一数量是训练命令的数量,所述训练命令和所述样本命令对应于相同的样本标签,所述训练命令用于训练所述分层预测网络;
66、根据所述区别损失和所述加权参数的乘积,以及基于所述乘积对所述分层预测网络执行后向误差传播训练,得到所述训练后的分层预测网络。
67、在本技术的一个可选设计中,所述训练模块还用于:
68、在所述第一预测标签不存在对应的所述第i+1层子网络的情况下,根据所述第一预测标签和所述样本标签之间的区别,对所述分层预测网络执行后向误差传播训练,得到所述训练后的分层预测网络。
69、根据本技术的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的命令文本的处理方法、和/或分层预测网络的训练方法。
70、根据本技术的另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的命令文本的处理方法、和/或分层预测网络的训练方法。
71、根据本技术的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机指令,以实现上述如上方面所述的命令文本的处理方法、和/或分层预测网络的训练方法。
72、本技术提供的技术方案带来的有益效果至少包括:
73、通过分层预测网络中的两层子网络,预测得到命令文本对应分类标签,实现了确定命令文本中携带的对非玩家角色的控制类型;分层预测网络中的至少两层子网络是基于多种分类标签的树状结构构建的,降低了每层子网络的分类预测复杂程度;在控制非玩家角色的场景中,根据控制非玩家角色的树状结构的分类标签,有针对性的构建分层预测网络,提高了对命令文本中的自然语义执行分类预测的准确性。
1.一种命令文本的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述至少一个分层预测网络中的每个分层预测网络用于预测所述命令文本在一个意图维度上针对所述非玩家角色的指挥意图;
3.根据权利要求2所述的方法,其特征在于,
4.根据权利要求3所述的方法,其特征在于,所述分层预测网络包括所述主语预测网络,所述调用至少一个分层预测网络对所述命令文本执行意图识别,得到所述命令文本意图指挥所述非玩家角色的分类标签,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括如下至少之一:
6.根据权利要求3所述的方法,其特征在于,所述分层预测网络包括所述语义预测网络,所述调用至少一个分层预测网络对所述命令文本执行意图识别,得到所述命令文本意图指挥所述非玩家角色的分类标签,包括:
7.根据权利要求3所述的方法,其特征在于,所述分层预测网络包括所述行为预测网络,所述调用至少一个分层预测网络对所述命令文本执行意图识别,得到所述命令文本意图指挥所述非玩家角色的分类标签,包括:
8.根据权利要求7所述的方法,其特征在于,
9.根据权利要求1至8任一所述的方法,其特征在于,所述方法还包括:
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
11.根据权利要求1至8任一所述的方法,其特征在于,所述方法还包括:
12.根据权利要求1至8任一所述的方法,其特征在于,所述方法还包括:
13.根据权利要求1至8任一所述的方法,其特征在于,所述方法还包括:
14.一种分层预测网络的训练方法,其特征在于,所述方法包括:
15.根据权利要求14所述的方法,其特征在于,所述根据所述预测标签和所述样本标签之间的区别,对所述分层预测网络执行后向误差传播训练,得到训练后的分层预测网络,包括:
16.根据权利要求14所述的方法,其特征在于,所述方法还包括:
17.一种命令文本的处理装置,其特征在于,所述装置包括:
18.一种分层预测网络的训练装置,其特征在于,所述装置包括:
19.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一段程序;所述处理器,用于执行所述存储器中的所述至少一段程序以实现上述如权利要求1至13任一所述的命令文本的处理方法,和/或上述如权利要求14至16任一所述的分层预测网络的训练方法。
20.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有可执行指令,所述可执行指令由处理器加载并执行以实现上述如权利要求1至13任一所述的命令文本的处理方法,和/或上述如权利要求14至16任一所述的分层预测网络的训练方法。
21.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机指令,以实现上述如权利要求1至13任一所述的命令文本的处理方法,和/或上述如权利要求14至16任一所述的分层预测网络的训练方法。
