本技术涉及文字识别,特别是涉及一种目标文字的识别方法、装置和电子设备。
背景技术:
1、甲骨文是迄今为止中国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉。利用人工智能方法对甲骨文图片上的文字进行自动识别,是甲骨文保护和传承的一个重要手段和方式,极大地提高了甲骨文识读的准确性和效率。
2、然而,基于svm的甲骨文字识别需要采用分块直方图的方式,即手工提取的方式,来提取文字特征;而基于分形几何的甲骨文字识别方法利用分形几何的原理,通过计算字形以及各个象限的分形维数,将甲骨文字形式化为一组分形描述码,再通过与甲骨文字的分形特征库进行配准,得到识别结果,其同样需要人工干预过程。也即,现有的基于svm的甲骨文字识别和基于分形几何的甲骨文字识别方法均需要人工参与,识别效率较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种目标文字的识别方法、装置和电子设备。
2、一种目标文字的识别方法,该方法包括:
3、获取甲骨文图片集,对甲骨文图片集中所有甲骨文图片进行预处理,得到每张甲骨文图片的预处理结果。
4、对每张甲骨文图片的预处理结果分别采用三个不同半径和邻域采样点数的圆形lbp算子进行局部二值模式特征提取,得到三个旋转不变局部二值模式特征。
5、将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵,对所述非负矩阵进行非负矩阵分解,将每张甲骨文图片对应的列向量向非负矩阵分解得到的左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征。
6、将每张甲骨文图片的第四特征和3个旋转不变局部二值模式特征进行融合,得到每张甲骨文图片的第五特征。
7、将所有甲骨文图片的第五特征作为模型输入,对用于目标文字识别的aasca-mann神经网络模型进行训练,得到训练好的aasca-mann神经网络模型;aasca-mann神经网络模型是利用自适应振幅正余弦优化算法优化的滑动平均神经网络。
8、对待识别的甲骨文图片进行预处理和特征提取后采用训练好的aasca-mann神经网络模型进行处理,得到甲骨文图片中的目标文字识别结果。
9、在其中一个实施例中,获取甲骨文图片集,对甲骨文图片集中所有甲骨文图片进行预处理,得到每张甲骨文图片的预处理结果,包括:
10、获取甲骨文图片集,对甲骨文图片集中所有甲骨文图片采用开运算方法进行预处理,得到每张甲骨文图片的预处理结果。
11、在其中一个实施例中,三个不同半径和邻域采样点数的圆形lbp算子分别为:半径为1邻域采样点数为8的圆形lbp算子、半径为2邻域采样点数为8的圆形lbp算子以及半径为2邻域采样点数为16的圆形lbp算子。
12、在其中一个实施例中,将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵,对所述非负矩阵进行非负矩阵分解,将每张甲骨文图片对应的列向量向非负矩阵分解得到的左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征,包括:
13、将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵。
14、将对非负矩阵进行非负矩阵分解等价于求函数f(w,h)在预设约束条件下的最小值,其表达形式如下:
15、
16、其中,w表示左矩阵;h表示右矩阵,v表示非负矩阵,i、p、q、j为大于0的整数;m和n分别表示矩阵v的行数和列数。
17、该约束最优问题通过交替非负最小二乘算法求解,其中交替非负最小二乘算法的表达式如下:
18、
19、其中,k表示迭代的次数。
20、将甲骨文图片对应的列向量向左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征。
21、在其中一个实施例中,滑动平均神经网络包括输入层、隐含层和输出层。
22、将所有甲骨文图片的第五特征作为模型输入,对用于目标文字识别的aasca-mann神经网络模型进行训练,得到训练好的aasca-mann神经网络模型,包括:
23、将所有甲骨文图片的第五特征作为模型输入。
24、构建滑动平均神经网络的拓扑结构,初始化滑动平均神经网络。
25、将预测准确率作为适应度函数,对自适应振幅正余弦优化算法的初始化种群,计算个体适应度。
26、选择适应度值最小的个体作为当前的最优个体位置。
27、产生一个[0,1]之间的随机数r4。
28、根据随机数r4的值和当前的最优个体位置,对个体进行迭代更新。
29、如果不满足迭代结束条件,则继续计算个体适应度,进行下一轮迭代更新;如果满足迭代结束的条件,则获取滑动平均神经网络的最优权值、平移因子以及伸缩因子。
30、计算滑动平均神经网络的误差。
31、根据误差对权值、平移因子以及伸缩因子进行迭代更新;如果不满足预设网络参数更新结束条件,则继续计算误差,对权值、平移因子以及伸缩因子进行迭代更新。
32、如果满足预设网络参数更新结束条件,则得到训练好的aasca-mann神经网络模型。
33、在其中一个实施例中,个体迭代更新的表达式为:
34、
35、其中,xi,j(t)为个体i在第t次迭代时的位置在第j维的分量,pi,j(t)为第t次迭代时种群当前最优个体在第j维的分量,r1为控制正余弦函数的振幅,r2为正余弦波动的范围,r3是[0,2]范围内取值的参数,r4在[0,1]之间的随机参数。
36、在其中一个实施例中,如果r1小于1,则局部开发,如果r1大于1,则全局探索;r1的表达式为:
37、r1=2(1-sin(πt/t))
38、其中,t为当前迭代次数,t为预设的最大迭代次数。
39、一种目标文字的识别装置,该装置包括:
40、预处理模块,用于获取甲骨文图片集,对甲骨文图片集中所有甲骨文图片进行预处理,得到每张甲骨文图片的预处理结果。
41、局部二值模式特征提取模块,用于对每张甲骨文图片的预处理结果分别采用三个不同半径和邻域采样点数的圆形lbp算子进行局部二值模式特征提取,得到三个旋转不变局部二值模式特征。
42、非负矩阵分解模块,用于将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵,对所述非负矩阵进行非负矩阵分解,将每张甲骨文图片对应的列向量向非负矩阵分解得到的左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征。
43、特征融合模块,用于将每张甲骨文图片的第四特征和3个旋转不变局部二值模式特征进行融合,得到每张甲骨文图片的第五特征。
44、aasca-mann神经网络训练模块,用于将所有甲骨文图片的第五特征作为模型输入,对用于目标文字识别的aasca-mann神经网络模型进行训练,得到训练好的aasca-mann神经网络模型;aasca-mann神经网络模型是利用自适应振幅正余弦优化算法优化的滑动平均神经网络。
45、目标文字识别模块,用于对待识别的甲骨文图片进行预处理和特征提取后采用训练好的aasca-mann神经网络模型进行处理,得到甲骨文图片中的目标文字识别结果。
46、一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
47、获取甲骨文图片集,对甲骨文图片集中所有甲骨文图片进行预处理,得到每张甲骨文图片的预处理结果。
48、对每张甲骨文图片的预处理结果分别采用三个不同半径和邻域采样点数的圆形lbp算子进行局部二值模式特征提取,得到三个旋转不变局部二值模式特征。
49、将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵,对所述非负矩阵进行非负矩阵分解,将每张甲骨文图片对应的列向量向非负矩阵分解得到的左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征。
50、将每张甲骨文图片的第四特征和3个旋转不变局部二值模式特征进行融合,得到每张甲骨文图片的第五特征。
51、将所有甲骨文图片的第五特征作为模型输入,对用于目标文字识别的aasca-mann神经网络模型进行训练,得到训练好的aasca-mann神经网络模型;aasca-mann神经网络模型是利用自适应振幅正余弦优化算法优化的滑动平均神经网络。
52、对待识别的甲骨文图片进行预处理和特征提取后采用训练好的aasca-mann神经网络模型进行处理,得到甲骨文图片中的目标文字识别结果。
53、上述目标文字的识别方法、装置和电子设备,所述方法包括:获取甲骨文图片集,对甲骨文图片集中所有甲骨文图片进行预处理,对每个预处理结果分别采用三个不同半径和邻域采样点数的圆形lbp算子进行局部二值模式特征提取;将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵,对非负矩阵进行非负矩阵分解,将每张甲骨文图片对应的列向非负矩阵分解得到的左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征;将每张甲骨文图片的第四特征和3个旋转不变局部二值模式特征进行融合,得到第五特征。将所有甲骨文图片的第五特征作为模型输入,对aasca-mann神经网络模型进行训练;对待识别的甲骨文图片进行预处理和特征提取后采用训练好的aasca-mann神经网络模型进行处理,得到甲骨文图片中的目标文字识别结果。采用本方法不需要人工参与,提高了目标文字识别的效率和准确率。
1.一种目标文字的识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,获取甲骨文图片集,对所述甲骨文图片集中所有甲骨文图片进行预处理,得到每张甲骨文图片的预处理结果,包括:
3.根据权利要求1所述的方法,其特征在于,三个不同半径和邻域采样点数的圆形lbp算子分别为:半径为1邻域采样点数为8的圆形lbp算子、半径为2邻域采样点数为8的圆形lbp算子以及半径为2邻域采样点数为16的圆形lbp算子。
4.根据权利要求1所述的方法,其特征在于,将每张甲骨文图片的灰度图像的所有列首尾相接构成一个列向量,将所有列向量构成一个非负矩阵,对所述非负矩阵进行非负矩阵分解,将每张甲骨文图片对应的列向量向非负矩阵分解得到的左矩阵的列向量所构成的子空间做投影,将投影所得坐标值作为该甲骨文图片的第四特征,包括:
5.根据权利要求1所述的方法,其特征在于,滑动平均神经网络包括输入层、隐含层和输出层;
6.根据权利要求1所述的方法,其特征在于,个体迭代更新的表达式为:
7.根据权利要求6所述的方法,其特征在于,如果r1小于1,则局部开发,如果r1大于1,则全局探索;r1的表达式为:
8.一种目标文字的识别装置,其特征在于,所述装置包括:
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。