本发明涉及仿真场景生成,尤其涉及一种基于用户偏好的多样仿真场景生成方法。
背景技术:
1、仿真场景的在线生成是一种通过计算机程序,自动生成多媒体交互应用中的内容的技术,可以降低手工搭建多媒体交互应用中的内容的人工成本,从而提高生产效率。偏好仿真场景生成是指在用户设定特定的偏好条件后,生成程序会根据该偏好条件生成符合用户需求的内容。这里的用户既可以是搭建多媒体交互应用中的内容的设计者,也可以是体验多媒体交互应用的体验者。
2、在这一领域中,要求生成的场景有较高的多样性以降低重复度,从而增加多媒体交互应用的丰富程度和吸引力。然而,多样化的场景需要多种指标(例如,用户设定的偏好条件)来进行评估,而这些指标往往是多维度且互相冲突的。
3、随着人工智能技术的发展,目前是通过基于生成对抗网络(gans)的方法实现面向定制化目标的仿真场景生成。然而,在面对多种指标的前提下,该方法所生成的场景之间的相似度较高,从而难以保证所生成的新场景的多样性。
4、因此,现有技术还有待改进。
技术实现思路
1、针对现有技术缺陷,本发明提供一种基于用户偏好的多样仿真场景生成方法,旨在解决现有的基于gans的方法在面对多种指标的前提下,所生成的场景之间的相似度较高,从而难以保证所生成的新场景的多样性的技术问题。
2、本发明解决上述技术问题所采用的技术方案如下。
3、第一方面,本发明提供一种基于用户偏好的多样仿真场景生成方法,包括步骤:
4、获取已生成场景的场景参数;
5、将所述已生成场景的场景参数和预设的用户偏好向量输入到由所述用户偏好向量和预设的神经网络算法训练得到的生成器模型中,得到决策参数;
6、将所述决策参数输入到训练后的解码器中,输出场景表征;
7、将所述场景表征加载到多媒体交互应用中,生成仿真场景。
8、在一些实施例中,本方法还包括步骤:
9、将所述仿真场景作为所述已生成场景,重复所述生成仿真场景的步骤;
10、其中,所述生成器模型包括生成器,所述生成器包括依次连接的第一组合块、第一条件自注意力机制块、第二组合块、第二条件自注意力机制块、一个卷积核为3×3的卷积层、一个spectralnorm层、以及一个softmax激活函数层,所述第一组合块和所述第二组合块相同,所述第一条件自注意力机制块和所述第二条件自注意力机制块相同;
11、所述已生成场景的场景参数输入至所述第一组合块,并依次通过所述第一组合块、所述第一条件自注意力机制块、所述第二组合块、所述第二条件自注意力机制块、所述卷积层、所述spectralnorm层、以及所述softmax激活函数层;同时,所述用户偏好向量输入至所述第一条件自注意力机制块、依次通过所述第一条件自注意力机制块、所述第二组合块、所述第二条件自注意力机制块、所述卷积层、所述spectralnorm层、以及所述softmax激活函数层;同时,用户偏好向量输入至所述第二条件自注意力机制块、依次通过所述第二条件自注意力机制块、所述卷积层、所述spectralnorm层、以及所述softmax激活函数层;所述softmax激活函数层输出所述决策参数。
12、在一些实施例中,所述生成器模型还包括判别器,所述判别器包括依次连接的第三组合块、第三条件自注意力机制块、第四组合块、第四条件自注意力机制块、一个卷积核为4×4的第一卷积层、一个spectralnorm层、一个卷积核为4×4的第二卷积层、以及一个flatten层,所述第三组合块、所述第四组合块、以及所述第一组合块相同,所述第三条件自注意力机制块、所述第四条件自注意力机制块、以及所述第一条件自注意力机制块相同;
13、所述决策参数和预设的决策参数样本输入至所述第三组合块,并依次通过所述第三组合块、所述第三条件自注意力机制块、所述第四组合块、所述第四条件自注意力机制块、所述第一卷积层、所述spectralnorm层、所述第二卷积层、以及所述flatten层;同时,所述用户偏好向量输入至所述第三条件自注意力机制块、依次通过所述第三条件自注意力机制块、所述第四组合块、所述第四条件自注意力机制块、所述第一卷积层、所述spectralnorm层、所述第二卷积层、以及所述flatten层;同时,所述用户偏好向量输入至所述第四条件自注意力机制块、依次通过所述第四条件自注意力机制块、所述第一卷积层、所述spectralnorm层、所述第二卷积层、以及所述flatten层;所述flatten层输出判别结果。
14、在一些实施例中,所述生成器和所述判别器均为神经网络模型。
15、在一些实施例中,所述生成器模型的训练方法包括步骤:
16、步骤a:
17、初始化预设的模型参数;
18、步骤b:
19、利用所述用户偏好向量和所述模型参数,基于所述神经网络算法,构建得到训练前的生成器模型;
20、将预设的场景参数集输入到所述训练前的生成器模型中,得到采样决策参数集;
21、利用预设的生成器模型评估指标对所述采样决策参数集进行评估,得到评估指标值;
22、利用所述评估指标值和与所述生成器模型评估指标对应的所述用户偏好向量,构建得到所述训练前的生成器模型的损失函数;
23、利用梯度下降算法更新所述模型参数,得到更新后的模型参数;
24、以及步骤c:
25、将所述更新后的模型参数作为新的所述模型参数,重复所述步骤b,直至达到预设的迭代次数或预设的评估次数,得到训练后的生成器模型和所述训练后的生成器模型的损失函数。
26、在一些实施例中,在所述获取已生成场景的场景参数的步骤之前,本方法还包括步骤:
27、获取基准场景的场景参数;
28、将所述基准场景的场景参数输入到所述解码器中,输出初始场景表征;
29、将所述初始场景表征加载到所述多媒体交互应用中,得到所述已生成场景。
30、在一些实施例中,所述多媒体交互应用为电子游戏。
31、第二方面,本发明提供一种基于用户偏好的多样仿真场景生成装置,包括:
32、场景参数获取单元,用于获取已生成场景的场景参数;
33、决策参数获取单元,用于将所述已生成场景的场景参数和预设的用户偏好向量输入到由所述用户偏好向量和预设的神经网络算法训练得到的生成器模型中,得到决策参数;
34、场景表征获取单元,用于将所述决策参数输入到训练后的解码器中,输出场景表征;以及
35、仿真场景生成单元,用于将所述场景表征加载到多媒体交互应用中,生成仿真场景。
36、第三方面,本发明提供一种计算机设备,所述计算机设备包括存储器、处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于用户偏好的多样仿真场景生成方法的步骤。
37、第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于用户偏好的多样仿真场景生成方法的步骤。
38、有益效果:本发明提出的基于用户偏好的多样仿真场景生成方法,通过利用由用户偏好向量和神经网络算法训练得到的生成器模型得到决策参数,然后利用该决策参数生成仿真场景,从而提高了所生成场景的多样性。因此,相比于现有技术,本方法解决了现有的基于gans的方法在面对多种指标的前提下,所生成的场景之间的相似度较高,从而难以保证所生成的新场景的多样性的技术问题。
1.一种基于用户偏好的多样仿真场景生成方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于用户偏好的多样仿真场景生成方法,其特征在于,还包括步骤:
3.根据权利要求2所述的基于用户偏好的多样仿真场景生成方法,其特征在于,所述生成器模型还包括判别器,所述判别器包括依次连接的第三组合块、第三条件自注意力机制块、第四组合块、第四条件自注意力机制块、一个卷积核为4×4的第一卷积层、一个spectralnorm层、一个卷积核为4×4的第二卷积层、以及一个flatten层,所述第三组合块、所述第四组合块、以及所述第一组合块相同,所述第三条件自注意力机制块、所述第四条件自注意力机制块、以及所述第一条件自注意力机制块相同;
4.根据权利要求3所述的基于用户偏好的多样仿真场景生成方法,其特征在于,所述生成器和所述判别器均为神经网络模型。
5.根据权利要求2所述的基于用户偏好的多样仿真场景生成方法,其特征在于,所述生成器模型的训练方法包括步骤:
6.根据权利要求1所述的基于用户偏好的多样仿真场景生成方法,其特征在于,在所述获取已生成场景的场景参数的步骤之前,还包括步骤:
7.根据权利要求1-6任一项所述的基于用户偏好的多样仿真场景生成方法,其特征在于,所述多媒体交互应用为电子游戏。
8.一种基于用户偏好的多样仿真场景生成装置,其特征在于,包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7任一项所述的基于用户偏好的多样仿真场景生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的基于用户偏好的多样仿真场景生成方法的步骤。
