本技术属于学习教育,具体地说,涉及基于大数据和大模型的抽题组卷方法及系统。
背景技术:
1、传统练习题和考试试卷往往采用人工选题、出卷来进行,耗费时间长,对试题结构控制不够准确,随着软件工程技术和网络技术的发展,解决了部分传统考试的弊端,在线作业、在线考试、随堂测评已经广泛进入了日常学习生活中,在考试改革方面做出了探索性尝试并起到了积极作用。
2、在线考试实施的前提之一是题库建设与出题工作,但是现有题库标准化不高、组卷算法不科学,容易出现重复试题或者知识点相似度比较高的试题在同一张试卷中,试卷质量往往就不会太高,而且现有题库也是从已经公开的题目中进行数据获取,而应试者也能对这些公开的题目进行搜索获取,比如试卷所考的知识考点比较偏门,题库中对应的题目量较少,应试者只需大量刷对应题目,就很有可能遇到题库中的题目,只需死记硬背,而不需要对知识考点进行理解消化,就能得到高分成绩,这反而与考试原有的目的背道而驰,无法对应试者原有的知识水平进行掌握了解。
技术实现思路
1、为解决上述问题和技术缺陷,本技术实施例采用如下的技术方案,基于大数据和大模型的抽题组卷方法,包括以下步骤:
2、步骤1、建立总题库,获取历史真题和历史真题的参数属性,对历史真题按照参数属性进行知识考点分类,根据分类结果在总题库内建立分类题库,将历史真题按照分类结果存储至分类题库内;
3、步骤2、建立试卷库,获取历史试卷,对历史试卷进行特征提取,获取试卷类型,试卷中的题型种类,每种题型的题目数量占比和分数占比,根据历史试卷提取的特征建立试卷初始模版;
4、步骤3、使用者调用试卷初始模版,根据需求对试卷初始模版进行调整,得到试卷模版,使用者输入考试大纲和组卷要求,根据试卷模版和组卷要求得到约束条件;
5、步骤4、根据考试大纲在总题库搜索知识考点对应的分类题库,根据约束条件在分类题库中搜索选择对应历史真题;
6、步骤5、建立多个修改调整模型,根据需求调用一个或多个修改调整模型对历史真题进行修改调整生成新题目;
7、步骤6、根据约束条件将选择的历史真题和生成的新题目填充进试卷模版中,生成考试试卷。
8、优选地,所述历史真题的参数属性包括:知识考点、题型、难度系数、历史使用次数和经典优异度;
9、题型包括:单项选择题、多项选择题、判断题、填空题、计算解答题、阅读理解题、论述题和听力题;
10、难度系数是根据每个历史真题的平均得分率得到每个历史真题的难度系数;
11、历史使用次数是目标历史真题存储至总题库时,初始历史使用次数为一次,每当目标历史真题被调用一次时,历史使用次数增加一次;
12、经典优异度是目标历史真题的考查设计的协调性、题目的新颖性、知识考点的考查覆盖率和与知识考点的偏离程度,由使用者在使用后进行评级,评级包括:优秀、良好和平庸,当评级包括多个时,取评级中的众数作为目标历史真题的经典优异度。
13、进一步地,所述对历史真题按照参数属性进行知识考点分类的步骤如下:
14、获取历史真题的题目文本、解答流程和题干解析,对历史真题的题目文本、解答流程和题干解析进行第一次分类和分词处理;
15、根据第一次分类结果构建特征词模型,根据分词处理结果计算特征词权重;
16、根据特征词模型和特征词权重计算每个历史真题之间的相似度;
17、根据相似度计算结果,对历史真题进行第二次分类处理,得到知识考点分类结果。
18、优选地,所述考试大纲为整个试卷的所有知识考点;约束条件包括:试卷难度系数、考试大纲、每种题型的数量、每个知识考点在每种题型中的占比、试卷总分、每种题型的分数占比。
19、更进一步地,所述根据约束条件在分类题库中搜索选择对应历史真题是根据难度系数搜索对应的历史真题,使用者在组卷要求中输入试卷中每个知识考点的难度系数和每个知识考点在每种题型中的占比,得到需要在当前分类题库中得到题目数量和题目的难度系数,难度系数计算公式如下:
20、p=(∑mi×ki)/∑ki;
21、其中i=1,2,…n,n是题型范围内的题目数,p为输入题型的难度系数,mi是第i题的难度系数,ki是第i题的分数。
22、再进一步地,当有多个历史真题符合约束条件时,根据经典优异度的评级进行比较,评级为优秀的历史真题的优先级高于评级为良好和平庸的历史真题,评级为良好的历史真题的优先级高于评级为平庸的历史真题;
23、当经典优异度的评级相等时,根据历史使用次数进行比较,选择历史真题中历史使用次数最小的历史真题。
24、还进一步地,所述修改调整模型包括包括:选择顺序更换模型、条件答案调换模型、数值重置模型和多题重组模型;
25、选择顺序更换模型用于对选择题中的选项顺序进行调换,生成选择顺序调换后的新题和新答案;
26、条件答案调换模型用于将题目中的给出条件数值与答案数值进行调换,在题目中给出答案数值,将原有的答案数值作为新的条件数值,将原有的条件数值作为新的答案数值,将求解原有的条件数值,根据新的条件竖直生成新题目和新答案;
27、数值重置模型用于获取原历史真题中的计算公式,在符合题目要求的情况下将原有的条件数值进行随机重置,将重置生成的条件数值输入至计算公式,得到新的答案结果,根据新的条件数值生成新题目和新答案;
28、多题重组模型用于将同一知识考点内的多个历史真题进行组合,先获取原历史真题中的计算公式,得到调用同一计算公式的多个历史真题,确定每个历史真题中条件数值和答案数值与其它历史真题中条件数值和答案数值的因果关系,将多个历史真题中具有同一含义的条件数值和答案数值进行修改统一,再将修改后的条件数值和答案数值输入至计算公式中进行计算验证,根据验证后的条件数值和答案数值生成新题目和新答案。
29、基于大数据和大模型的抽题组卷系统,包括:
30、题库模块,用于获取历史真题和历史真题的参数属性,对历史真题按照参数属性进行知识考点分类,根据分类结果在总题库内建立分类题库,将历史真题按照分类结果存储至分类题库内;
31、卷库模块,用于建立试卷库,获取历史试卷,对历史试卷进行特征提取,获取试卷类型,试卷中的题型种类,每种题型的题目数量占比和分数占比,根据历史试卷提取的特征建立试卷初始模版;
32、模版条件模块,用于使用者调用试卷初始模版,根据需求对试卷初始模版进行调整,得到试卷模版,使用者输入考试大纲和组卷要求,根据试卷模版和组卷要求得到约束条件;
33、题目获取模块,用于根据考试大纲在总题库搜索知识考点对应的分类题库,根据约束条件在分类题库中搜索选择对应历史真题,建立多个修改调整模型,根据需求调用一个或多个修改调整模型对历史真题进行修改调整生成新题目;
34、试卷生成模块,用于根据约束条件将选择的历史真题和生成的新题目填充进试卷模版中,生成考试试卷。
35、一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的基于大数据和大模型的抽题组卷方法的步骤。
36、一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述的基于大数据和大模型的抽题组卷方法的步骤。
37、相比于现有技术,本技术实施例的有益效果为:
38、本技术通过在总题库内进行知识考点分类,建立分类题库,将历史真题按照分类结果存储至分类题库内,后续在进行题目筛选、提取时方便、快捷和准确,同时设立多个修改调整模型,在进行题目提取时对现有分类题库内的题目进行调整修改,在不改变原有题目考点的情况下,使修改后的题目与原历史真题大不相同,但却具有相同知识考点,应试者只有在理解吃透知识考点的情况下,才能对修改后的题目进行应答,在进行抽题组卷的同时,也避免应试者通过死记硬背取巧答题的情况发生,使试卷能够准确考查出应试者的知识水平。
1.基于大数据和大模型的抽题组卷方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大数据和大模型的抽题组卷方法,其特征在于,所述历史真题的参数属性包括:知识考点、题型、难度系数、历史使用次数和经典优异度;
3.根据权利要求2所述的基于大数据和大模型的抽题组卷方法,其特征在于,所述对历史真题按照参数属性进行知识考点分类的步骤如下:
4.根据权利要求3所述的基于大数据和大模型的抽题组卷方法,其特征在于,所述考试大纲为整个试卷的所有知识考点;约束条件包括:试卷难度系数、考试大纲、每种题型的数量、每个知识考点在每种题型中的占比、试卷总分、每种题型的分数占比。
5.根据权利要求4所述的基于大数据和大模型的抽题组卷方法,其特征在于,所述根据约束条件在分类题库中搜索选择对应历史真题是根据难度系数搜索对应的历史真题,使用者在组卷要求中输入试卷中每个知识考点的难度系数和每个知识考点在每种题型中的占比,得到需要在当前分类题库中得到题目数量和题目的难度系数,难度系数计算公式如下:
6.根据权利要求5所述的基于大数据和大模型的抽题组卷方法,其特征在于,当有多个历史真题符合约束条件时,根据经典优异度的评级进行比较,评级为优秀的历史真题的优先级高于评级为良好和平庸的历史真题,评级为良好的历史真题的优先级高于评级为平庸的历史真题;
7.根据权利要求6所述的基于大数据和大模型的抽题组卷方法,其特征在于,所述修改调整模型包括包括:选择顺序更换模型、条件答案调换模型、数值重置模型和多题重组模型;
8.基于大数据和大模型的抽题组卷系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述的基于大数据和大模型的抽题组卷方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的基于大数据和大模型的抽题组卷方法的步骤。
