本发明涉及游戏模型,特别涉及一种用于推理游戏的大模型构建方法。
背景技术:
1、现有的大模型技术一般是通用领域的大模型,主要常见的场景有例如问答,翻译,写文章等。但对于剧本杀游戏场景则效果不够理想,该场景需要较好的角色扮演能力、逻辑能力及对剧本的理解与遵循能力。
2、因此,有必要提供一种用于推理游戏的大模型构建方法,以增强模型的角色扮演能力、逻辑能力及对剧本的理解与遵循能力。
技术实现思路
1、本发明的目的在于提供一种用于推理游戏的大模型构建方法,以增强模型的角色扮演能力、逻辑能力及对剧本的理解与遵循能力。
2、为了解决现有技术中存在的问题,本发明提供了一种用于推理游戏的大模型构建方法,包括以下步骤:
3、s1:构建训练数据,方式如下:
4、s11:收集与整理剧本;
5、s12:处理角色设定数据;
6、s13:角色对话的生成与后处理;
7、s14:问答对的生成与后处理,所述问答对根据问题与回答训练生成;
8、s2:根据所述训练数据进行大模型训练。
9、可选的,在所述用于推理游戏的大模型构建方法中,s11中收集与整理剧本的方式如下:
10、收集互联网上的剧本杀剧本以及公司游戏剧本;
11、对收集到的剧本进行人工筛选和人工标注,得到多个剧本杀的剧本。
12、可选的,在所述用于推理游戏的大模型构建方法中,s12中处理角色设定数据的方式如下:
13、利用通用大模型,从整理得到的多个剧本中按着约定的格式提取出剧本中的角色,并经过人工矫正,获得标准化的剧本杀角色设定。
14、可选的,在所述用于推理游戏的大模型构建方法中,s13中角色对话的生成与后处理的方式如下:
15、搭建一个基于大模型的剧本杀游戏,并选择合适的大模型;
16、利用处理后的剧本及角色设定,进行游戏;
17、将游戏过程中生成的对话数据进行保存;
18、将生成的所述对话数据经过人工筛选和标注,得到能用于训练的剧本杀游戏对话数据。
19、可选的,在所述用于推理游戏的大模型构建方法中,s14中问答对的生成与后处理的方式如下:
20、利用大模型生成多个不同的问题及答案,以得到问答对;其中,生成的问题包括身份认知和风险问题;
21、利用人工标注对问答对进行校正,从而得到用于增强大模型身份认知和拒答能力的训练数据。
22、可选的,在所述用于推理游戏的大模型构建方法中,s2中根据所述训练数据进行大模型训练的方式如下:使用s1中得到的剧本杀剧本、角色设定、对话数据、身份认知数据以及拒答数据选择合适参数量的大模型进行全参数调整,得到用于推理游戏的大模型。
23、可选的,在所述用于推理游戏的大模型构建方法中,本方法还包括以下步骤:s3:对大模型的效果进行评估。
24、可选的,在所述用于推理游戏的大模型构建方法中,评估的方式如下:
25、大模型评估:利用提示词,在大模型中输入评估标准,对训练后的大模型进行效果打分;
26、和/或,
27、人工评估:利用人工,按照评估标准进行人工评估。
28、在本发明所提供的用于推理游戏的大模型构建方法中,通过利用高质量剧本杀角色扮演与对话数据,显著增强了模型的角色扮演能力、逻辑能力及对剧本的理解与遵循能力。按照本方法训练得到的大模型,在剧本杀游戏方面具有较好效果,特别是在对剧本的理解、角色设定的遵循、对话风格、身份认知、对风险问题的拒答等方面都要强于通用领域的大模型。
1.一种用于推理游戏的大模型构建方法,其特征在于,包括以下步骤:
2.如权利要求1所述的用于推理游戏的大模型构建方法,其特征在于,s11中收集与整理剧本的方式如下:
3.如权利要求1所述的用于推理游戏的大模型构建方法,其特征在于,s12中处理角色设定数据的方式如下:
4.如权利要求1所述的用于推理游戏的大模型构建方法,其特征在于,s13中角色对话的生成与后处理的方式如下:
5.如权利要求1所述的用于推理游戏的大模型构建方法,其特征在于,s14中问答对的生成与后处理的方式如下:
6.如权利要求5所述的用于推理游戏的大模型构建方法,其特征在于,s2中根据所述训练数据进行大模型训练的方式如下:使用s1中得到的剧本杀剧本、角色设定、对话数据、身份认知数据以及拒答数据选择合适参数量的大模型进行全参数调整,得到用于推理游戏的大模型。
7.如权利要求1所述的用于推理游戏的大模型构建方法,其特征在于,本方法还包括以下步骤:s3:对大模型的效果进行评估。
8.如权利要求7所述的用于推理游戏的大模型构建方法,其特征在于,评估的方式如下:
