非玩家角色的指挥方法、装置、设备及介质与流程

专利查询2025-04-08 48

本技术实施例涉及人机交互领域，特别涉及一种非玩家角色的指挥方法、装置、设备及介质。

背景技术：

1、ai(artificial intelligence，人工智能)对npc(non-player character，非玩家角色)的操控已成为显著增强游戏体验沉浸度与互动层次的核心技术。在这一技术框架下，玩家能够发出诸如“攻击”或“跟随”等基础指令，以直接影响npc的行为模式。ai系统则负责解读这些简易指令，并据此调控npc的相应活动。

2、然而，面对需要复杂策略或精确执行的任务时，单纯依赖这类基础指令难以实现。例如，当玩家想要控制npc拾取虚拟道具时，玩家只能通过多次下达“向前”、“向后”、“向左”、“向右”这种简单指令来指挥npc向虚拟道具所在位置挪动，以接近虚拟道具，并不能准确控制非玩家角色到达虚拟道具所在位置。

技术实现思路

1、本技术实施例提供了一种非玩家角色的指挥方法、装置、设备及介质。所述技术方案如下：

2、一方面，提供了一种非玩家角色的指挥方法，所述方法包括：

3、显示主控虚拟角色和非玩家角色中的至少之一；

4、接收自然语言命令，所述自然语言命令用于指挥所述非玩家角色；

5、确定目标实体，所述目标实体是虚拟环境中与所述自然语言命令中的描述相匹配，且被所述非玩家角色或所述主控虚拟角色感知到的实体；

6、响应于所述自然语言命令的行为意图，控制所述非玩家角色执行与所述目标实体相关的虚拟活动。

7、另一方面，提供了一种非玩家角色的指挥方法，所述方法包括：

8、接收自然语言命令，所述自然语言命令用于指挥非玩家角色；

9、确定目标实体，所述目标实体是虚拟环境中与所述自然语言命令中的描述相匹配，且被所述非玩家角色或主控虚拟角色感知到的实体；

10、响应于所述自然语言命令的行为意图，控制所述非玩家角色执行与所述目标实体相关的虚拟活动。

11、另一方面，提供了一种非玩家角色的指挥装置，所述装置包括：

12、显示模块，用于显示主控虚拟角色和非玩家角色中的至少之一；

13、交互模块，用于接收自然语言命令，所述自然语言命令用于指挥所述非玩家角色；

14、第一确定模块，用于确定目标实体，所述目标实体是虚拟环境中与所述自然语言命令中的描述相匹配，且被所述非玩家角色或所述主控虚拟角色感知到的实体；

15、第一控制模块，用于响应于所述自然语言命令的行为意图，控制所述非玩家角色执行与所述目标实体相关的虚拟活动。

16、在一种可选的实施例中，所述第一确定模块，用于获取所述虚拟环境的实体集合，所述实体集合包括所述虚拟环境中的实体和实体信息；对所述自然语言命令进行语义理解，得到所述自然语言命令的所述行为意图和目标实体信息；根据所述目标实体信息和环境感知信息，从所述实体集合中查询得到所述目标实体。

17、在一种可选的实施例中，所述第一确定模块，用于计算所述目标实体信息与所述实体集合中每个实体信息的相似度；根据所述相似度和所述环境感知信息，从所述实体集合中确定所述目标实体。

18、在一种可选的实施例中，所述第一确定模块，用于根据所述环境感知信息确定查找范围；根据所述相似度从位于所述查找范围内的实体中筛选得到所述目标实体。

19、在一种可选的实施例中，所述第一确定模块，用于根据所述主控虚拟角色的位置和所述主控虚拟角色的朝向，将所述主控虚拟角色的视野范围确定为所述查找范围；

20、所述第一确定模块，用于根据所述主控虚拟角色的位置，将所述主控虚拟角色的听觉范围确定为所述查找范围；

21、所述第一确定模块，用于将所述主控虚拟角色使用的感知虚拟道具的检测范围确定为所述查找范围；

22、所述第一确定模块，用于根据所述非玩家角色的位置和所述非玩家角色的朝向，将所述非玩家角色的视野范围确定为所述查找范围；

23、所述第一确定模块，用于根据所述非玩家角色的位置，将所述非玩家角色的听觉范围确定为所述查找范围；

24、所述第一确定模块，用于将所述非玩家角色使用的感知虚拟道具的检测范围确定为所述查找范围；

25、所述第一确定模块，用于根据所述主控虚拟角色的位置、所述主控虚拟角色的朝向、所述非玩家角色的位置和所述非玩家角色的朝向，将所述主控虚拟角色与所述非玩家角色的视野范围的重合部分，确定为所述查找范围；

26、所述第一确定模块，用于根据所述主控虚拟角色的位置和所述非玩家角色的位置，将所述主控虚拟角色与所述非玩家角色的听觉范围的重合部分，确定为所述查找范围。

27、在一种可选的实施例中，所述目标实体信息包括所述目标实体的位置信息；

28、所述第一确定模块，用于根据所述环境感知信息确定感知范围，所述感知范围包括以下至少之一：所述主控虚拟角色的视野范围、所述主控虚拟角色的听觉范围、所述非玩家角色的视野范围、所述非玩家角色的听觉范围、感知虚拟道具的检测范围；

29、所述第一确定模块，用于将所述感知范围内与所述位置信息相匹配的区域范围确定为所述查找范围。

30、在一种可选的实施例中，所述第一确定模块，用于将位于所述查找范围内所述相似度最高的实体确定为所述目标实体；

31、所述第一确定模块，用于在所述查找范围内所述相似度最高的实体数量为至少两个的情况下，将位于所述查找范围内所述相似度最高，且与所述主控虚拟角色距离最近的实体确定为所述目标实体。

32、在一种可选的实施例中，所述相似度包括文本相似度；所述实体集合包括第一实体的实体信息；

33、所述第一确定模块，用于对所述目标实体信息分词，得到至少一个目标实体标签；将所述至少一个目标实体标签转换为至少一个目标嵌入向量；获取所述第一实体的实体信息，所述实体信息包括文本嵌入向量，所述文本嵌入向量是基于所述第一实体的文本标签转换得到的嵌入向量；分别计算所述至少一个目标嵌入向量与所述文本嵌入向量的文本父相似度，得到所述至少一个目标嵌入向量分别对应的至少一个文本父相似度；将所述至少一个文本父相似度之和，确定为所述目标实体信息与所述第一实体的实体信息的文本相似度。

34、在一种可选的实施例中，所述第一实体的实体信息包括至少一个文本嵌入向量；所述至少一个目标嵌入向量包括第一目标嵌入向量；

35、所述第一确定模块，用于分别计算所述第一目标嵌入向量与所述至少一个文本嵌入向量的文本子相似度，得到至少一个文本子相似度；将所述至少一个文本子相似度中的最高值，确定为所述第一目标嵌入向量对应的所述文本父相似度。

36、在一种可选的实施例中，所述相似度包括图像相似度；所述实体集合包括第一实体的实体信息；

37、所述第一确定模块，用于对所述目标实体信息分词，得到至少一个目标实体标签；将所述至少一个目标实体标签转换为至少一个目标嵌入向量；获取所述第一实体的实体信息，所述实体信息包括图像嵌入向量，所述图像嵌入向量是基于所述第一实体的图像提取得到的嵌入向量；分别计算所述至少一个目标嵌入向量与所述文本嵌入向量的图像父相似度，得到所述至少一个目标嵌入向量分别对应的至少一个图像父相似度；将所述至少一个图像父相似度之和，确定为所述目标实体信息与所述第一实体的实体信息的图像相似度。

38、在一种可选的实施例中，所述第一实体的实体信息包括至少一个图像嵌入向量；所述至少一个目标嵌入向量包括第一目标嵌入向量；

39、所述第一确定模块，用于分别计算所述第一目标嵌入向量与所述至少一个图像嵌入向量的图像子相似度，得到至少一个图像子相似度；将所述至少一个图像子相似度中的最高值，确定为所述第一目标嵌入向量对应的所述图像父相似度。

40、在一种可选的实施例中，所述实体集合包括第一实体；

41、所述第一确定模块，用于在所述第一实体与所述目标实体对应有文本相似度和图像相似度的情况下，将所述文本相似度和图像相似度的平均值确定为所述第一实体的实体信息与所述目标实体信息的相似度。

42、在一种可选的实施例中，所述实体集合中包括第一实体；所述装置还包括：

43、第一预处理模块，用于获取所述第一实体的至少一个视角图像；以及获取所述第一实体的至少一个文本标签；所述至少一个视角图像用于描述所述第一实体的样式；所述文本标签用于介绍所述第一实体在所述虚拟环境中的固有属性；调用多模态模型，基于所述第一实体的所述至少一个视角图像和所述至少一个文本标签提取所述第一实体的视觉特征，得到所述第一实体的视觉标签，所述视觉标签用于在至少一个维度上描述所述第一实体的视觉特征；将所述视觉标签转换为所述第一实体的图像嵌入向量。

44、在一种可选的实施例中，所述多模态模型包括视觉问答模型；

45、所述第一预处理模块，用于构建针对所述视角图像的提问语句，所述提问语句中携带有所述第一实体的所述文本标签；将所述第一实体的所述视角图像和所述提问语句输入所述视觉问答模型，得到回答语句，将所述回答语句作为所述第一实体的所述视觉标签。

46、在一种可选的实施例中，所述提问语句包括至少两个子语句；

47、所述第一预处理模块，用于将所述第一实体的所述视角图像和所述至少两个子语句中的第一语句输入所述视觉问答模型，得到第一回答子语句；

48、重复上述步骤，直至得到与所述至少两个子语句一一对应的至少两个回答子语句，所述至少两个子语句用于从多个维度问询所述视角图像的视觉特征；

49、对所述至少两个回答子语句执行语句聚合，提取得到所述第一实体的所述回答语句。

50、在一种可选的实施例中，所述第一预处理模块，用于获取所述第一实体的期望信息，所述期望信息用于指示在所述回答语句中期望的所述第一实体的描述维度，和/或所述回答语句的期望格式；根据所述期望信息和所述文本标签构建所述视角图像的所述提问语句；

51、其中，所述提问语句中的第一子部分是所述第一实体的补充介绍信息，携带有所述第一实体的所述文本标签；所述提问语句中的第二子部分是针对所述视觉问答模型的回答引导语句，携带有所述期望信息。

52、在一种可选的实施例中，所述多模态模型包括图片描述模型；

53、所述第一预处理模块，用于将所述第一实体的所述视角图像输入所述图片描述模型，预测得到所述第一实体的描述文本；对所述描述文本和所述文本标签执行语句聚合，提取得到所述第一实体的所述视觉标签。

54、在一种可选的实施例中，所述第一实体的所述文本标签包括所述第一实体在所述虚拟环境中的名称、在所述虚拟环境中的尺寸中的至少之一；

55、和/或，所述第一实体的所述视角图像包括从至少两个视角下观察所述第一实体得到的图像。

56、在一种可选的实施例中，所述第一预处理模块，用于对所述第一实体的所述视觉标签执行拟口语化改写，得到符合自然语言的口语表达的匹配标签。

57、在一种可选的实施例中，所述第一预处理模块，用于将所述第一实体的所述视觉标签输入大语言模型，预测得到符合自然语言的口语表达的所述匹配标签，所述大语言模型携带有自然语言的口语表达的先验知识。

58、在一种可选的实施例中，所述第一预处理模块，用于获取第一样本标签对，所述第一样本标签对包括经过拟口语化改写前的第一标签和经过拟口语化改写得到的第二标签；

59、所述第一预处理模块，用于根据所述第一样本标签对和所述视觉标签，构建改写引导语句，所述改写引导语句具有以所述第一样本标签对为参考，改写所述视觉标签的自然语义；

60、所述第一预处理模块，用于将所述改写引导语句输入大语言模型，预测得到符合自然语言的口语表达的所述匹配标签。

61、在一种可选的实施例中，所述第一预处理模块，用于获取所述第一实体在所述虚拟环境中的空间位置，以及将所述第一实体的所述空间位置确定为所述第一实体的视觉标签的辅助信息。

62、在一种可选的实施例中，所述第一预处理模块，用于获取所述第一实体在所述虚拟环境中的坐标位置、朝向信息、包围盒信息、掩体点信息中的至少之一；

63、其中，所述坐标位置用于指示所述第一实体在所述虚拟环境中的位置，所述朝向信息用于指示所述第一实体在所述虚拟环境中面对的方向，所述包围盒信息用于指示所述第一实体在所述虚拟环境中的尺寸，所述掩体点信息指示虚拟角色靠近所述第一实体时推荐的虚拟角色站位点。

64、在一种可选的实施例中，所述目标实体信息包括参考实体的参考实体信息，所述参考实体用于参考确定所述目标实体；

65、所述第一确定模块，用于根据所述参考实体信息和所述环境感知信息，从所述实体集合中查询得到所述参考实体；

66、所述第一确定模块，用于根据所述参考实体、所述目标实体信息和所述环境感知信息，从所述实体集合中查询得到所述目标实体。

67、在一种可选的实施例中，所述目标实体信息包括：参考实体信息、所述参考实体与所述目标实体的位置关系、所述目标实体的特征文本；

68、所述第一确定模块，用于计算所述特征文本与所述实体集合中每个实体信息的相似度；

69、所述第一确定模块，用于根据所述环境感知信息确定查找范围；

70、所述第一确定模块，用于根据所述相似度和所述位置关系，从所述实体集合内位于所述查找范围内的实体中筛选得到所述目标实体。

71、在一种可选的实施例中，所述实体集合中包括空间实体，所述空间实体用于识别所述虚拟环境中的三维空间区域；所述装置还包括：

72、第一预处理模块，用于在虚拟环境中创建所述空间实体，所述空间实体用于包围待标识的三维空间区域；

73、所述第一预处理模块，用于获取所述空间实体的文本标签，所述文本标签包括所述三维空间区域的空间关系的描述文本；

74、其中，所述空间关系的描述文本包括以下至少之一：所述三维空间区域的所属场景、所述三维空间区域的所属建筑、所述三维空间区域在所属建筑中的所处楼层、所述三维空间区域在所处楼层的空间方位、所述三维空间区域的空间名称。

75、另一方面，提供了一种非玩家角色的指挥装置，所述装置包括：

76、接收模块，用于接收自然语言命令，所述自然语言命令用于指挥非玩家角色；

77、第二确定模块，用于确定目标实体，所述目标实体是虚拟环境中与所述自然语言命令中的描述相匹配，且被所述非玩家角色或主控虚拟角色感知到的实体；

78、第二控制模块，用于响应于所述自然语言命令的行为意图，控制所述非玩家角色执行与所述目标实体相关的虚拟活动。

79、在一种可选的实施例中，所述第二确定模块，用于获取所述虚拟环境的实体集合，所述实体集合包括所述虚拟环境中的实体和实体信息；对所述自然语言命令进行语义理解，得到所述自然语言命令的所述行为意图和目标实体信息；根据所述目标实体信息和环境感知信息，从所述实体集合中查询得到所述目标实体。

80、在一种可选的实施例中，所述第二确定模块，用于计算所述目标实体信息与所述实体集合中每个实体信息的相似度；根据所述相似度和所述环境感知信息，从所述实体集合中确定所述目标实体。

81、在一种可选的实施例中，所述第二确定模块，用于根据所述环境感知信息确定查找范围；根据所述相似度从位于所述查找范围内的实体中筛选得到所述目标实体。

82、在一种可选的实施例中，所述第二确定模块，用于根据所述主控虚拟角色的位置和所述主控虚拟角色的朝向，将所述主控虚拟角色的视野范围确定为所述查找范围；

83、所述第二确定模块，用于根据所述主控虚拟角色的位置，将所述主控虚拟角色的听觉范围确定为所述查找范围；

84、所述第二确定模块，用于将所述主控虚拟角色使用的感知虚拟道具的检测范围确定为所述查找范围；

85、所述第二确定模块，用于根据所述非玩家角色的位置和所述非玩家角色的朝向，将所述非玩家角色的视野范围确定为所述查找范围；

86、所述第二确定模块，用于根据所述非玩家角色的位置，将所述非玩家角色的听觉范围确定为所述查找范围；

87、所述第二确定模块，用于将所述非玩家角色使用的感知虚拟道具的检测范围确定为所述查找范围；

88、所述第二确定模块，用于根据所述主控虚拟角色的位置、所述主控虚拟角色的朝向、所述非玩家角色的位置和所述非玩家角色的朝向，将所述主控虚拟角色与所述非玩家角色的视野范围的重合部分，确定为所述查找范围；

89、所述第二确定模块，用于根据所述主控虚拟角色的位置和所述非玩家角色的位置，将所述主控虚拟角色与所述非玩家角色的听觉范围的重合部分，确定为所述查找范围。

90、在一种可选的实施例中，所述目标实体信息包括所述目标实体的位置信息；

91、所述第二确定模块，用于根据所述环境感知信息确定感知范围，所述感知范围包括以下至少之一：所述主控虚拟角色的视野范围、所述主控虚拟角色的听觉范围、所述非玩家角色的视野范围、所述非玩家角色的听觉范围、感知虚拟道具的检测范围；

92、所述第二确定模块，用于将所述感知范围内与所述位置信息相匹配的区域范围确定为所述查找范围。

93、在一种可选的实施例中，所述第二确定模块，用于将位于所述查找范围内所述相似度最高的实体确定为所述目标实体；

94、所述第二确定模块，用于在所述查找范围内所述相似度最高的实体数量为至少两个的情况下，将位于所述查找范围内所述相似度最高，且与所述主控虚拟角色距离最近的实体确定为所述目标实体。

95、在一种可选的实施例中，所述第二确定模块，用于所述计算所述目标实体信息与所述实体集合中每个实体信息的相似度，包括：对所述目标实体信息分词，得到至少一个目标实体标签；将所述至少一个目标实体标签转换为至少一个目标嵌入向量；获取所述第一实体的实体信息，所述实体信息包括文本嵌入向量，所述文本嵌入向量是基于所述第一实体的文本标签转换得到的嵌入向量；分别计算所述至少一个目标嵌入向量与所述文本嵌入向量的文本父相似度，得到所述至少一个目标嵌入向量分别对应的至少一个文本父相似度；将所述至少一个文本父相似度之和，确定为所述目标实体信息与所述第一实体的实体信息的文本相似度。

96、在一种可选的实施例中，所述第一实体的实体信息包括至少一个文本嵌入向量；所述至少一个目标嵌入向量包括第一目标嵌入向量；

97、所述第二确定模块，用于分别计算所述第一目标嵌入向量与所述至少一个文本嵌入向量的文本子相似度，得到至少一个文本子相似度；将所述至少一个文本子相似度中的最高值，确定为所述第一目标嵌入向量对应的所述文本父相似度。

98、在一种可选的实施例中，所述相似度包括图像相似度；所述实体集合包括第一实体的实体信息；

99、所述第二确定模块，用于对所述目标实体信息分词，得到至少一个目标实体标签；将所述至少一个目标实体标签转换为至少一个目标嵌入向量；获取所述第一实体的实体信息，所述实体信息包括图像嵌入向量，所述图像嵌入向量是基于所述第一实体的图像提取得到的嵌入向量；分别计算所述至少一个目标嵌入向量与所述文本嵌入向量的图像父相似度，得到所述至少一个目标嵌入向量分别对应的至少一个图像父相似度；将所述至少一个图像父相似度之和，确定为所述目标实体信息与所述第一实体的实体信息的图像相似度。

100、在一种可选的实施例中，所述第一实体的实体信息包括至少一个图像嵌入向量；所述至少一个目标嵌入向量包括第一目标嵌入向量；

101、所述第二确定模块，用于分别计算所述第一目标嵌入向量与所述至少一个图像嵌入向量的图像子相似度，得到至少一个图像子相似度；将所述至少一个图像子相似度中的最高值，确定为所述第一目标嵌入向量对应的所述图像父相似度。

102、在一种可选的实施例中，所述实体集合包括第一实体；

103、所述第二确定模块，用于在所述第一实体与所述目标实体对应有文本相似度和图像相似度的情况下，将所述文本相似度和图像相似度的平均值确定为所述第一实体的实体信息与所述目标实体信息的相似度。

104、在一种可选的实施例中，所述实体集合中包括第一实体；所述装置还包括：

105、所述第二预处理模块，用于获取所述第一实体的至少一个视角图像；以及获取所述第一实体的至少一个文本标签；所述至少一个视角图像用于描述所述第一实体的样式；所述文本标签用于介绍所述第一实体在所述虚拟环境中的固有属性；调用多模态模型，基于所述第一实体的所述至少一个视角图像和所述至少一个文本标签提取所述第一实体的视觉特征，得到所述第一实体的视觉标签，所述视觉标签用于在至少一个维度上描述所述第一实体的视觉特征；将所述视觉标签转换为所述第一实体的图像嵌入向量。

106、在一种可选的实施例中，所述第二预处理模块，用于构建针对所述视角图像的提问语句，所述提问语句中携带有所述第一实体的所述文本标签；将所述第一实体的所述视角图像和所述提问语句输入所述视觉问答模型，得到回答语句，将所述回答语句作为所述第一实体的所述视觉标签。

107、在一种可选的实施例中，所述提问语句包括至少两个子语句；

108、所述第二预处理模块，用于将所述第一实体的所述视角图像和所述至少两个子语句中的第一语句输入所述视觉问答模型，得到第一回答子语句；

109、重复上述步骤，直至得到与所述至少两个子语句一一对应的至少两个回答子语句，所述至少两个子语句用于从多个维度问询所述视角图像的视觉特征；

110、对所述至少两个回答子语句执行语句聚合，提取得到所述第一实体的所述回答语句。

111、在一种可选的实施例中，所述第二预处理模块，用于获取所述第一实体的期望信息，所述期望信息用于指示在所述回答语句中期望的所述第一实体的描述维度，和/或所述回答语句的期望格式；根据所述期望信息和所述文本标签构建所述视角图像的所述提问语句；

112、其中，所述提问语句中的第一子部分是所述第一实体的补充介绍信息，携带有所述第一实体的所述文本标签；所述提问语句中的第二子部分是针对所述视觉问答模型的回答引导语句，携带有所述期望信息。

113、在一种可选的实施例中，所述多模态模型包括图片描述模型；

114、所述第二预处理模块，用于将所述第一实体的所述视角图像输入所述图片描述模型，预测得到所述第一实体的描述文本；对所述描述文本和所述文本标签执行语句聚合，提取得到所述第一实体的所述视觉标签。

115、在一种可选的实施例中，所述第一实体的所述文本标签包括所述第一实体在所述虚拟环境中的名称、在所述虚拟环境中的尺寸中的至少之一；

116、和/或，所述第一实体的所述视角图像包括从至少两个视角下观察所述第一实体得到的图像。

117、在一种可选的实施例中，所述第二预处理模块，用于对所述第一实体的所述视觉标签执行拟口语化改写，得到符合自然语言的口语表达的匹配标签。

118、在一种可选的实施例中，所述第二预处理模块，用于将所述第一实体的所述视觉标签输入大语言模型，预测得到符合自然语言的口语表达的所述匹配标签，所述大语言模型携带有自然语言的口语表达的先验知识。

119、在一种可选的实施例中，所述第二预处理模块，用于获取第一样本标签对，所述第一样本标签对包括经过拟口语化改写前的第一标签和经过拟口语化改写得到的第二标签；根据所述第一样本标签对和所述视觉标签，构建改写引导语句，所述改写引导语句具有以所述第一样本标签对为参考，改写所述视觉标签的自然语义；将所述改写引导语句输入大语言模型，预测得到符合自然语言的口语表达的所述匹配标签。

120、在一种可选的实施例中，所述第二预处理模块，用于获取所述第一实体在所述虚拟环境中的空间位置，以及将所述第一实体的所述空间位置确定为所述第一实体的视觉标签的辅助信息。

121、在一种可选的实施例中，所述第二预处理模块，用于获取所述第一实体在所述虚拟环境中的坐标位置、朝向信息、包围盒信息、掩体点信息中的至少之一；

122、其中，所述坐标位置用于指示所述第一实体在所述虚拟环境中的位置，所述朝向信息用于指示所述第一实体在所述虚拟环境中面对的方向，所述包围盒信息用于指示所述第一实体在所述虚拟环境中的尺寸，所述掩体点信息指示虚拟角色靠近所述第一实体时推荐的虚拟角色站位点。

123、在一种可选的实施例中，所述目标实体信息包括参考实体的参考实体信息，所述参考实体用于参考确定所述目标实体；

124、所述第二确定模块，用于根据所述参考实体信息和所述环境感知信息，从所述实体集合中查询得到所述参考实体；

125、所述第二确定模块，用于根据所述参考实体、所述目标实体信息和所述环境感知信息，从所述实体集合中查询得到所述目标实体。

126、在一种可选的实施例中，所述目标实体信息包括：参考实体信息、所述参考实体与所述目标实体的位置关系、所述目标实体的特征文本；

127、所述第二确定模块，用于计算所述特征文本与所述实体集合中每个实体信息的相似度；

128、所述第二确定模块，用于根据所述环境感知信息确定查找范围；

129、所述第二确定模块，用于根据所述相似度和所述位置关系，从所述实体集合内位于所述查找范围内的实体中筛选得到所述目标实体。

130、在一种可选的实施例中，所述实体集合中包括空间实体，所述空间实体用于识别所述虚拟环境中的三维空间区域；所述装置还包括：

131、第二预处理模块，用于在虚拟环境中创建所述空间实体，所述空间实体用于包围待标识的三维空间区域；

132、所述第二预处理模块，用于获取所述空间实体的文本标签，所述文本标签包括所述三维空间区域的空间关系的描述文本；

133、其中，所述空间关系的描述文本包括以下至少之一：所述三维空间区域的所属场景、所述三维空间区域的所属建筑、所述三维空间区域在所属建筑中的所处楼层、所述三维空间区域在所处楼层的空间方位、所述三维空间区域的空间名称。

134、另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的非玩家角色的指挥方法。

135、另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的非玩家角色的指挥方法。

136、另一方面，本技术实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述可选实现方式中提供的非玩家角色的指挥方法。

137、本技术实施例提供的技术方案带来的有益效果至少包括：

138、基于主控虚拟角色和/或非玩家角色从虚拟环境中感知得到的信息，来识别自然语言命令中所指示的目标实体。例如，自然语言命令是“移动到卡车后方”，则根据主控虚拟角色在下达自然语言命令时的视野范围，将视野范围内主控虚拟角色能够看到的卡车，确定为自然语言命令中所指的“卡车”，进而控制非玩家角色精准移动到该卡车的后方。或者，自然语言命令是“附近有小溪吗”，则根据非玩家角色从虚拟环境中听到的溪水音效，控制非玩家角色向溪水音效的来源方向探索，并基于非玩家角色的视觉画面，识别非玩家角色是否发现小溪，基于探索结果生成自然语言命令的反馈。采用该方法，可以根据环境感知信息准确地从虚拟环境中的诸多实体中，精准确定自然语言命令中所指示的目标实体，对于接收到的描述较为模糊的自然语言命令，可以结合命令下达时主控虚拟角色从虚拟环境中感知到的信息，推理得到自然语言命令所指示的目标实体，控制非玩家虚拟角色执行自然语言命令中所指示的与目标实体相关的行为活动，实现使用自然语言对非玩家角色的灵活控制。

技术特征：

1.一种非玩家角色的指挥方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定目标实体，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标实体信息和环境感知信息，从所述实体集合中查询得到所述目标实体，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述相似度和所述环境感知信息，从所述实体集合中确定所述目标实体，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述环境感知信息确定查找范围，包括以下至少之一：

6.根据权利要求4所述的方法，其特征在于，所述根据所述相似度从位于所述查找范围内的实体中筛选得到所述目标实体，包括以下之一：

7.根据权利要求3至6任一所述的方法，其特征在于，所述相似度包括文本相似度；所述实体集合包括第一实体的实体信息；

8.根据权利要求3所述的方法，其特征在于，所述相似度包括图像相似度；所述实体集合包括第一实体的实体信息；

9.根据权利要求2至6任一所述的方法，其特征在于，所述实体集合中包括第一实体；所述方法还包括：

10.根据权利要求9所述的方法，其特征在于，所述多模态模型包括视觉问答模型；

11.根据权利要求10所述的方法，其特征在于，所述提问语句包括至少两个子语句；

12.根据权利要求9所述的方法，其特征在于，所述多模态模型包括图片描述模型；

13.根据权利要求9所述的方法，其特征在于，所述方法还包括：

14.根据权利要求2所述的方法，其特征在于，所述目标实体信息包括参考实体的参考实体信息，所述参考实体用于参考确定所述目标实体；

15.根据权利要求2所述的方法，其特征在于，所述实体集合中包括空间实体，所述空间实体用于识别所述虚拟环境中的三维空间区域；所述方法还包括：

16.一种非玩家角色的指挥方法，其特征在于，所述方法包括：

17.根据权利要求16所述的方法，其特征在于，所述确定目标实体，包括：

18.根据权利要求17所述的方法，其特征在于，所述根据所述目标实体信息和环境感知信息，从所述实体集合中查询得到所述目标实体，包括：

19.根据权利要求18所述的方法，其特征在于，所述根据所述相似度和所述环境感知信息，从所述实体集合中确定所述目标实体，包括：

20.根据权利要求19所述的方法，其特征在于，所述根据所述环境感知信息确定查找范围，包括以下至少之一：

21.根据权利要求19所述的方法，其特征在于，所述根据所述相似度从位于所述查找范围内的实体中筛选得到所述目标实体，包括以下之一：

22.根据权利要求18至21任一所述的方法，其特征在于，所述相似度包括文本相似度；所述实体集合包括第一实体的实体信息；

23.根据权利要求21所述的方法，其特征在于，所述相似度包括图像相似度；所述实体集合包括第一实体的实体信息；

24.根据权利要求17至21任一所述的方法，其特征在于，所述实体集合中包括第一实体；所述方法还包括：

25.根据权利要求24所述的方法，其特征在于，所述多模态模型包括视觉问答模型，所述调用多模态模型，基于所述第一实体的所述至少一个视角图像和所述至少一个文本标签提取所述第一实体的视觉特征，得到所述第一实体的视觉标签，包括：

26.根据权利要求25所述的方法，其特征在于，所述提问语句包括至少两个子语句；

27.根据权利要求24所述的方法，其特征在于，所述多模态模型包括图片描述模型；

28.根据权利要求24所述的方法，其特征在于，所述方法还包括：

29.根据权利要求17所述的方法，其特征在于，所述目标实体信息包括参考实体的参考实体信息，所述参考实体用于参考确定所述目标实体；

30.根据权利要求17所述的方法，其特征在于，所述实体集合中包括空间实体，所述空间实体用于识别所述虚拟环境中的三维空间区域；所述方法还包括：

31.一种非玩家角色的指挥装置，其特征在于，所述装置包括：

32.一种非玩家角色的指挥装置，其特征在于，所述装置包括：

33.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至30任一所述的非玩家角色的指挥方法。

34.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至30任一所述的非玩家角色的指挥方法。

35.一种计算机程序产品或计算机程序，其特征在于，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中；计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令，所述处理器执行所述计算机指令，使得所述计算机设备执行以实现如权利要求1至30任一所述的非玩家角色的指挥方法。

技术总结
本申请公开了一种非玩家角色的指挥方法、装置、设备及介质，涉及人机交互领域。该方法包括：显示主控虚拟角色和非玩家角色中的至少之一；接收自然语言命令，自然语言命令用于指挥非玩家角色；确定目标实体，目标实体是虚拟环境中与自然语言命令中的描述相匹配，且被非玩家角色或主控虚拟角色感知到的实体；响应于自然语言命令的行为意图，控制非玩家角色执行与目标实体相关的虚拟活动。该方法可以实现非玩家角色的智能化控制。

技术研发人员：刘若尘,魏温雅,廖詩颺,王海龙,王天舟,金沛沛,周启贤,张学磊
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-27325.html

专利

最新回复(0)