本发明涉及知识追踪方法,尤其涉及一种基于数据增强卷积记忆网络的知识追踪方法。
背景技术:
1、知识追踪的目的是观察、表征和量化学生的知识状态,例如对教材所蕴含的技能的掌握程度,传统知识追踪研究最初采用贝叶斯定理进行模型设计,代表模型为标准贝叶斯知识追踪,bkt使用概率图形模型如隐马尔可夫模型和贝叶斯网络,跟踪学生在练习技能时知识状态的变化,但是在使用知识追踪方法时,大多数模型仅在干净的学习数据上进行训练和测试,不能真实地反映学生的实际学习情况,且往往相对独立地处理每个知识点,而忽视了知识点之间的潜在联系。
技术实现思路
1、为了克服在使用知识追踪方法时,大多数模型仅在干净的学习数据上进行训练和测试,不能真实地反映学生的实际学习情况,且往往相对独立地处理每个知识点,而忽视了知识点之间的潜在联系的问题。
2、本发明的技术方案为:一种基于数据增强卷积记忆网络的知识追踪方法,包括有以下方法:
3、s11:生成与原始问题相对应的对抗性问题序列;
4、s12:整合存储问题序列并动态更新学生的知识状态;
5、s13:使用对抗数据增强卷积记忆网络模型预测学生答题结果。
6、优选的,卷积键值存储方法使用基于注意力机制的方法来映射已回答问题与潜在概念之间的关联,以在学习任务中存储其知识状态;并通过使用一维卷积来捕捉知识点向量中的局部模式,从而识别相邻知识点之间的连接,有助于预测学生的答案。
7、作为优选,在生成对抗性问题序列时,包括有以下步骤:
8、s21:将问题文本转化为嵌入向量;
9、s22:计算问题间的相似度分数;
10、s23:生成对抗性问题序列。
11、作为优选,在动态更新学生的知识状态时,包括有以下步骤:
12、s31:计算问题和每个潜在概念之间的嵌入向量;
13、s32:存储问题序列的相关信息;
14、s33:更新并存储学生的知识状态;
15、s34:提取潜在问题概念间的局部特征。
16、作为优选,在对问题概念间的局部特征进行提取时,包括以下步骤:
17、s41:提取题目所包含的概念信息;
18、s42:添加残差连接并生成分层卷积层h;
19、s43:引入非线性因素。
20、作为优选,在将问题文本转换成嵌入向量时,包括以下步骤:
21、s51:将问题的文本描述为包含m个单词的句子li={w1,w2,w3……,wm},其中wi表示一个单词,1<i≤m;
22、s52:使用word2vec方法将每个单词转换成维度为d0的向量,即每个问题文本li对应一个维度为d0×m的矩阵;
23、s53:依次对每个问题文本中所包含的词向量进行平均值计算,得到问题文本的嵌入向量,其中表示一个问题文本所转换成的嵌入向量,1<i≤n,n是问题的序列号。
24、作为优选,在计算问题间的相似度分数时,包括以下步骤:
25、s61:将问题文本的嵌入向量逐个存储在qemb中,qemb代表存放问题嵌入向量的问题矩阵;
26、s62:通过#计算每个问题与所有其他问题之间的余弦相似度分数ω,其中对于qe1和的余弦相似度分数ω的取值范围在[-1,1]之间。
27、作为优选,在生成对抗性问题序列时,包括以下步骤:
28、s71:在得到每个问题文本向量与与其他所有问题的ω后,将所有ω按照从大到小的顺序进行排序;
29、s72:将问题序列中的每个问题替换为与之最相似的未被使用的问题,从而生成对抗性的问题序列;
30、s73:将对抗性的问题序列与原始数据集合并,得到输入数据qt,用于模型的训练。
31、作为优选,在计算问题和每个潜在概念之间嵌入向量时,包括以下步骤:
32、s81:首先将输入的问题qt与嵌入矩阵相乘,得到连续嵌入向量
33、s82:通过计算公式将kt与每个键槽mk(i)的内积提供给softmax层,得到向量wt用于表示问题和每个潜在概念之间的联系,其中mk(i)为第i个潜在概念的嵌入向量。
34、作为优选,存储问题序列的相关信息时,有以下这些步骤:
35、s91:矩阵用于保存学生在当前t时刻的知识状态,其中n是潜在概念的数量,dk是状态维度。在生成记忆向量前,模型需要用wt对中所有内存槽的加权求和,得到代表学生对该知识点掌握程度的阅读向量rt:
36、
37、这里,rt表示来自中与输入问题相关的知识状态信息,但它不包括关于问题本身所蕴含的信息。
38、s92:将rt与问题嵌入向量线性组合,并将rt与kt馈送到tanh层,以计算对概念的总结向量ft∈rn:
39、
40、其中w1是一个权重矩阵,d1是一个偏置向量,使得模型在输入为零时,也能产生非零的激活值,从而更好地学习和表示数据中的复杂关系。kt是一个维度为dk的向量,用来表示问题qt在模型中的嵌入表达。ft反映了输入问题qt及其在中的相关概念状态的信息。
41、s93:最后,ft通过一个全连接层和sigmod型激活函数来预测学生的表现,得到组合记忆向量
42、
43、是模型根据问题信息和学生的知识状态预测出的学生表现,w2是一个权重矩阵,b2是一个偏置向量,使得模型在输入为零时,也能产生非零的激活值,从而更好地学习和表示数据中的复杂关系。与局部概念特征信息(它表示潜在概念间的相关性)一起使用,以预测正确回答qt的概率。
44、作为优选,在引入非线性因素时,包括有以下步骤:
45、s101:将分层卷积层h的输出传递给relu函数,引入非线性因素;
46、s102:通过计算调控信息在学习过程中的传递和变换,控制学习过程中的信息流,其中为分层卷积层的输出矩阵,它表示潜在概念间的相关性。yt代表与t时刻的问题qt相关的特征向量。
47、作为优选,在使用对抗数据增强卷积记忆网络模型预测学生答题结果时,包括以下步骤:
48、s201:将对抗数据增强方法生成组合记忆向量和step3生成的卷积汇总向量拼接起来,形成一个新的综合特征向量,使其能够综合考虑问题的扰动信息以及相关知识点的局部特征,提供更全面的表示;
49、s202:利用公式将拼接后的综合特征向量输入到一个带有sigmoid激活函数的全连接层,其中w∈r|q|×2n为可学习的权重矩阵,b为偏置向量,pt为预测qt正确答案概率的标量,表示模型对学生在当前时刻t正确回答输入问题qt的概率预测。
50、优选的,结合了对抗数据增强和卷积记忆网络的优势,能够更准确地捕捉学生的知识状态和潜在概念间的复杂关系,从而提升知识追踪的性能,同时利用对抗数据增强卷积记忆网络模型,可以更好地预测学生答题结果,提高知识追踪系统的准确性和鲁棒性。
51、本发明的有益效果:
52、1、相较于传统知识追踪方法,大多数模型仅在干净的学习数据上进行训练和测试,不能真实地反映学生的实际学习情况,且往往相对独立地处理每个知识点,而忽视了知识点之间的潜在联系,该知识追踪方法使用计算原始问题与未回答问题之间的相似度方法生成对抗性样本,利用对抗性扰动来生成具有挑战性的问题序列,通过设计键值存储网络动态表示学生的知识状态,捕捉学生回答问题之间的关联;
53、2、卷积键值存储方法使用基于注意力机制的方法来映射已回答问题与潜在概念之间的关联,以在学习任务中存储其知识状态;并通过使用一维卷积来捕捉知识点向量中的局部模式,从而识别相邻知识点之间的连接,有助于预测学生的答案;
54、3、结合了对抗数据增强和卷积记忆网络的优势,能够更准确地捕捉学生的知识状态和潜在概念间的复杂关系,从而提升知识追踪的性能,同时利用对抗数据增强卷积记忆网络模型,可以更好地预测学生答题结果,提高知识追踪系统的准确性和鲁棒性。
1.一种基于数据增强卷积记忆网络的知识追踪方法,包括有以下方法:
2.根据权利要求1所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在生成对抗性问题序列时,包括有以下步骤:
3.根据权利要求2所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在动态更新学生的知识状态时,包括有以下步骤:
4.根据权利要求3所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在对问题概念间的局部特征进行提取时,包括以下步骤:
5.根据权利要求4所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在将问题文本转换成嵌入向量时,包括以下步骤:
6.根据权利要求5所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在计算问题的相似度分数时,包括以下步骤:
7.根据权利要求6所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在生成对抗性问题序列时,包括以下步骤:
8.根据权利要求7所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在计算问题和每个潜在概念之间嵌入向量时,包括以下步骤:
9.根据权利要求8所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:存储问题序列的相关信息时,包括有以下这些步骤:
10.根据权利要求9所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在引入非线性因素时,包括有以下步骤:
11.根据权利要求10所述的一种基于数据增强卷积记忆网络的知识追踪方法,其特征在于:在使用对抗数据增强卷积记忆网络模型预测学生答题结果时,包括以下步骤:
