图像文字识别信息处理方法及装置与流程

    专利查询2022-08-18  103



    1.本技术涉及人工智能领域,也可用于金融领域,具体涉及一种图像文字识别信息处理方法及装置。


    背景技术:

    2.人工智能技术发展需要训练很多的网络模型,而网络模型的训练是需要大量人工标注的训练数据。
    3.在图像文字识别领域,现有技术中标注训练数据大多是人工用标注工具在图像上进行人工手动标注的,其人力成本巨大,训练数据的准备工作效率低下,不利于更快、更好地进行模型训练。


    技术实现要素:

    4.针对现有技术中的问题,本技术提供一种图像文字识别信息处理方法及装置,能够有效提高用于模型训练的图像训练数据的标注效率。
    5.为了解决上述问题中的至少一个,本技术提供以下技术方案:
    6.第一方面,本技术提供一种图像文字识别信息处理方法,包括:
    7.根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息;
    8.根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比;
    9.根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。
    10.进一步地,所述根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,包括:
    11.监测识别标注修正操作,得到经过识别标注修正后的图像并确定修正字符在所述文字识别标注中的字符占比;
    12.若所述修正字符的字符占比高于字符阈值,则对所述图像的文字定位信息中的文字定位标注进行定位标注修正,得到经过文字定位标注修正后的图像。
    13.进一步地,还包括:
    14.若所述置信度处于一预设置信度数值范围内,则对所述经过文字识别标注修正后的图像进行标注复核操作,若所述字符占比处于一预设字符占比数值范围内,则对所述经过文字定位标注修正后的图像进行标注复核操作。
    15.进一步地,在所述对所述经过文字识别标注修正和/或所述经过文字定位标注修正后的图像进行标注复核操作之后,还包括:
    16.根据标注复核操作的修正内容更新所述图像的文字识别标注和/或文字定位标
    注。
    17.进一步地,还包括:
    18.若所述置信度高于所述置信阈值且所述字符占低于字符阈值,则将所述经过文字识别标注修正和所述经过文字定位标注修正后的图像作为神经网络模型的图像训练数据。
    19.进一步地,所述将该图像作为神经网络模型的图像训练数据,还包括:
    20.将标注有修正后的文字识别信息和文字定位信息的图像作为神经网络模型的图像训练数据对所述神经网络模型进行图像文字识别训练,得到经过训练后的神经网络模型,所述神经网络模型用于对金融交易凭证图像或身份凭证图像进行图像识别,得到图像识别信息以进行交易处理。
    21.第二方面,本技术提供一种图像文字识别信息处理装置,包括:
    22.初始识别模块,用于根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息;
    23.识别标注修正模块,用于根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比;
    24.定位标注修正模块,用于根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。
    25.进一步地,所述定位标注修正模块包括:
    26.修正字符占比确定单元,用于监测识别标注修正操作,得到经过识别标注修正后的图像并确定修正字符在所述文字识别标注中的字符占比;
    27.高修正率定位修正单元,用于若所述修正字符的字符占比高于字符阈值,则对所述图像的文字定位信息中的文字定位标注进行定位标注修正,得到经过文字定位标注修正后的图像。
    28.进一步地,还包括:
    29.文字复核单元,用于若所述置信度处于一预设置信度数值范围内,则对所述经过文字识别标注修正后的图像进行标注复核操作;
    30.定位复核单元,用于若所述字符占比处于一预设字符占比数值范围内,则对所述经过文字定位标注修正后的图像进行标注复核操作。
    31.第三方面,本技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的图像文字识别信息处理方法的步骤。
    32.第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的图像文字识别信息处理方法的步骤。
    33.第五方面,本技术提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的图像文字识别信息处理方法的步骤。
    34.由上述技术方案可知,本技术提供一种图像文字识别信息处理方法及装置,通过图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确
    筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    附图说明
    35.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
    36.图1为本技术实施例中的图像文字识别信息处理方法的流程示意图之一;
    37.图2为本技术实施例中的图像文字识别信息处理方法的流程示意图之二;
    38.图3为本技术实施例中的图像文字识别信息处理方法的流程示意图之三;
    39.图4为本技术实施例中的图像文字识别信息处理装置的结构图之一;
    40.图5为本技术实施例中的图像文字识别信息处理装置的结构图之二;
    41.图6为本技术实施例中的图像文字识别信息处理装置的结构图之三;
    42.图7为本技术一具体实施例中的图像文字识别信息处理方法的整体流程图;
    43.图8为本技术实施例中的电子设备的结构示意图。
    具体实施方式
    44.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
    45.考虑到现有技术中标注训练数据大多是人工用标注工具在图像上进行人工手动标注的,其人力成本巨大,训练数据的准备工作效率低下,不利于更快、更好地进行模型训练的问题,本技术提供一种图像文字识别信息处理方法及装置,通过对图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    46.为了能够有效提高用于模型训练的图像训练数据的标注效率,本技术提供一种图像文字识别信息处理方法的实施例,参见图1,所述图像文字识别信息处理方法具体包含有如下内容:
    47.步骤s101:根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息。
    48.可选的,本技术可以先用预设的(可以是现有的)图像文字识别模型对待标注图像识别一遍,输出文字定位信息loc、文字识别信息rec和文字识别信息的置信度con,然后根据置信度与置信阈值的数值比较结果,对低置信度的图像的文字识别标注进行修正。
    49.步骤s102:根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比。
    50.可选的,本技术可以采用现有的标注修正方法实现文字识别标注的修正,也可以采用人工修正方式实现,由此得到经过文字识别标注修正后的图像。
    51.可选的,在进行文字识别标注修正时,本技术可以监测该修正过程以确定修正了几个字符,进而确定修正占比。
    52.举例来说,图像文字识别模型输出的文字识别标注为“张某三”,其置信度较低,因此经核实后可以通过人工方式将其修正为“张某二”,此时系统监测该修正过程以确定三个字符中修正了一个字符,则其修正占比为33%。
    53.步骤s103:根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。
    54.可选的,若所述修正字符的字符占比高于字符阈值,则表明图像文字识别模型对该图像的文字识别很不准确,文字识别信息的不准确与文字定位信息的识别不准确具有强关联关系,即修正字符的字符占比高,表明其文字定位也不准。
    55.因此,本技术对经过文字识别标注修正后的图像的文字定位信息进行文字定位标注修正,得到经过文字定位标注修正后的图像。
    56.可选的,本技术可以采用现有的标注修正方法实现文字定位标注的修正,也可以采用人工修正方式实现,由此得到经过文字定位标注修正后的图像。
    57.此时,本技术从初始的海量图像中先后筛选出了需要进行文字识别修正和文字定位修正的图像,并完成了修正,最后得到的就是符合模型训练要求的、能用于模型训练的图像训练数据。
    58.从上述描述可知,本技术实施例提供的图像文字识别信息处理方法,能够通过对图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    59.为了能够提高文字识别标注的修正效率,在本技术的图像文字识别信息处理方法的一实施例中,上述步骤s101还可以具体包含如下内容:
    60.根据预设图像文字识别模型对待标注图像进行图像文字识别,得到文字定位信息、文字识别信息以及文字识别信息的置信度,对所述置信度低于置信阈值的图像的文字识别信息进行文字识别标注修正,得到经过文字识别标注修正后的图像。
    61.可选的,本技术可以先用预设的(可以是现有的)图像文字识别模型对待标注图像识别一遍,输出文字定位信息loc、文字识别信息rec和文字识别信息的置信度con,然后根据置信度与置信阈值的数值比较结果,对低置信度的图像的文字识别标注进行修正。
    62.可选的,本技术可以采用现有的标注修正方法实现文字识别标注的修正,也可以采用人工修正方式实现,由此得到经过文字识别标注修正后的图像。
    63.为了能够提高文字定位标注的修正效率,在本技术的图像文字识别信息处理方法的一实施例中,参见图2,上述步骤s102还可以具体包含如下内容:
    64.步骤s201:监测识别标注修正操作,得到经过识别标注修正后的图像并确定修正字符在所述文字识别标注中的字符占比。
    65.步骤s202:若所述修正字符的字符占比高于字符阈值,则对所述图像的文字定位信息中的文字定位标注进行定位标注修正,得到经过文字定位标注修正后的图像。
    66.可选的,在进行文字识别标注修正时,本技术可以监测该修正过程以确定修正了几个字符,进而确定修正占比。
    67.可选的,若所述修正字符的字符占比高于字符阈值,则表明图像文字识别模型对该图像的文字识别很不准确,文字识别信息的不准确与文字定位信息的识别不准确具有强关联关系,即修正字符的字符占比高,表明其文字定位也不准。
    68.因此,本技术对经过文字识别标注修正后的图像的文字定位信息进行文字定位标注修正,得到经过文字定位标注修正后的图像。
    69.为了能够有针对性得进行修正,在本技术的图像文字识别信息处理方法的一实施例中,参见图3,还可以具体包含如下内容:
    70.步骤s301:若所述置信度处于一预设置信度数值范围内,则对所述经过文字识别标注修正后的图像进行标注复核操作。
    71.步骤s302:若所述字符占比处于一预设字符占比数值范围内,则对所述经过文字定位标注修正后的图像进行标注复核操作。
    72.可选的,对于置信度或字符占比虽未达到阈值,但也表征不太准确的图像,本技术可以对其进行标注复核操作。
    73.可选的,所述标注复核操作可以采用现有的标注复核方法实现标注的复核,也可以采用人工复核方式实现,由此得到经过复核后的图像。
    74.可选的,在标注复核完成后,本技术可以根据标注复核操作的修正内容更新所述图像的文字识别标注和/或文字定位标注。
    75.可选的,在上述计算得到置信度和字符占比后,若所述置信度高于所述置信阈值且所述字符占低于字符阈值,则表明该图像识别准确,可以将所述经过文字识别标注修正和所述经过文字定位标注修正后的图像作为神经网络模型的图像训练数据。
    76.为了能够有效应用神经网络模型,在本技术的一实施例中,本技术在将标注有修正后的文字识别信息和文字定位信息的图像作为神经网络模型的图像训练数据后,还可以进一步的对所述神经网络模型进行图像文字识别训练,得到经过训练后的神经网络模型。
    77.在一金融场景的具体实例中,所述神经网络模型可以用于对金融交易凭证(例如票据)图像或身份凭证(例如银行卡、身份证)图像进行图像识别,得到图像识别信息以进行交易处理。
    78.为了能够有效提高用于模型训练的图像训练数据的标注效率,本技术提供一种用于实现所述图像文字识别信息处理方法的全部或部分内容的图像文字识别信息处理装置的实施例,参见图4,所述图像文字识别信息处理装置具体包含有如下内容:
    79.初始识别模块10,用于根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息。
    80.识别标注修正模块20,用于根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比。
    81.定位标注修正模块30,用于根据所述字符占比对所述文字定位信息中的文字定位
    标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。
    82.从上述描述可知,本技术实施例提供的图像文字识别信息处理装置,能够通过对图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    83.为了能够提高文字识别标注的修正效率,在本技术的图像文字识别信息处理装置的一实施例中,参见图5,所述定位标注修正模块30包括:
    84.修正字符占比确定单元31,用于监测识别标注修正操作,得到经过识别标注修正后的图像并确定修正字符在所述文字识别标注中的字符占比。
    85.高修正率定位修正单元32,用于若所述修正字符的字符占比高于字符阈值,则对所述图像的文字定位信息中的文字定位标注进行定位标注修正,得到经过文字定位标注修正后的图像。
    86.为了能够有针对性得进行修正,在本技术的图像文字识别信息处理装置的一实施例中,参见图6,还包括:
    87.文字复核单元41,用于若所述置信度处于一预设置信度数值范围内,则对所述经过文字识别标注修正后的图像进行标注复核操作。
    88.定位复核单元42,用于若所述字符占比处于一预设字符占比数值范围内,则对所述经过文字定位标注修正后的图像进行标注复核操作。
    89.为了更进一步说明本方案,本技术还提供一种应用上述图像文字识别信息处理装置实现图像文字识别信息处理方法的具体应用实例,参见图7,具体包含有如下内容:
    90.(1)先用原始图像文字识别模型对待标注图像识别一遍,输出文字定位信息loc、文字识别信息rec和文字识别信息的置信度con。
    91.(2)判断文字识别信息的置信度con是否大于99%。
    92.(3)若上述判断结果为true,则将图像以及文字识别信息判定为不需要关注类;若上述判断为false,则继续后续处理。
    93.(4)判断文字识别信息的置信度con是否大于95%。
    94.(5)若上述判断结果为true,则将图像以及文字识别信息判定为需要复核类;若上述判断为false,则图像以及文字识别信息判定为需要修正。
    95.(6)采用人工修正方式对文字识别标注进行标注修正,系统监测该修正过程以确定修正了几个字符,进而确定修正占比。
    96.(7)判断文字识别标注的修正占比是否小于1%。
    97.(8)若上述判断结果为true,则将图像以及文字定位信息判定为不需要关注类;若上述判断为false,则继续后续处理。
    98.(9)判断修正占比是否小于20%。
    99.(10)若上述判断结果为true,则将图像以及文字定位信息判定为需要复核类;若上述判断为false,则图像以及文字定位信息判定为需要修正。
    100.(11)采用人工修正方式对文字定位标注进行标注修正。
    101.(12)完成标注内容,得到包含有标注好的文字定位信息和文字识别信息的图像。
    102.有上述内容可知,本技术不用人工对所有的图像进行逐张标注,极大减少标注数量,也不用人工对模型识别过的图像进行一一校验复核标注,通过分级方式可以使人工对重点图像重点标注/复核,使人工精力的得到更有效的利用。
    103.从硬件层面来说,为了能够有效提高用于模型训练的图像训练数据的标注效率,本技术提供一种用于实现所述图像文字识别信息处理方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
    104.处理器(processor)、存储器(memory)、通信接口(communications interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现图像文字识别信息处理装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的图像文字识别信息处理方法的实施例,以及图像文字识别信息处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
    105.可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(pda)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
    106.在实际应用中,图像文字识别信息处理方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本技术对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
    107.上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
    108.图8为本技术实施例的电子设备9600的系统构成的示意框图。如图8所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图8是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
    109.一实施例中,图像文字识别信息处理方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
    110.步骤s101:根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息。
    111.步骤s102:根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比。
    112.步骤s103:根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经
    网络模型的图像训练数据。
    113.从上述描述可知,本技术实施例提供的电子设备,通过对图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    114.在另一个实施方式中,图像文字识别信息处理装置可以与中央处理器9100分开配置,例如可以将图像文字识别信息处理装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现图像文字识别信息处理方法功能。
    115.如图8所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图8中所示的所有部件;此外,电子设备9600还可以包括图8中没有示出的部件,可以参考现有技术。
    116.如图8所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
    117.其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
    118.输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
    119.该存储器9140可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
    120.存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
    121.通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
    122.基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可
    以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
    123.本技术的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的图像文字识别信息处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的图像文字识别信息处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
    124.步骤s101:根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息。
    125.步骤s102:根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比。
    126.步骤s103:根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。
    127.从上述描述可知,本技术实施例提供的计算机可读存储介质,通过对图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    128.本技术的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的图像文字识别信息处理方法中全部步骤的一种计算机程序产品,该计算机程序/指令被处理器执行时实现所述的图像文字识别信息处理方法的步骤,例如,所述计算机程序/指令实现下述步骤:
    129.步骤s101:根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息。
    130.步骤s102:根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比。
    131.步骤s103:根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。
    132.从上述描述可知,本技术实施例提供的计算机程序产品,通过对图像文字识别模型的文字标注结果的置信度,进行针对性的文字识别标注的修正,然后根据文字识别标注修正时需修正的字符占比有针对性的进行文字定位标注的修正,进而准确筛选出真正需要的修正的标注进行修正操作,由此能够有效提高用于模型训练的图像训练数据的标注效率。
    133.本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
    施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
    134.本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
    135.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
    136.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
    137.本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

    技术特征:
    1.一种图像文字识别信息处理方法,其特征在于,所述方法包括:根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息;根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比;根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。2.根据权利要求1所述的图像文字识别信息处理方法,其特征在于,所述根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,包括:监测识别标注修正操作,得到经过识别标注修正后的图像并确定修正字符在所述文字识别标注中的字符占比;若所述修正字符的字符占比高于字符阈值,则对所述图像的文字定位信息中的文字定位标注进行定位标注修正,得到经过文字定位标注修正后的图像。3.根据权利要求2所述的图像文字识别信息处理方法,其特征在于,还包括:若所述置信度处于一预设置信度数值范围内,则对所述经过文字识别标注修正后的图像进行标注复核操作;若所述字符占比处于一预设字符占比数值范围内,则对所述经过文字定位标注修正后的图像进行标注复核操作。4.根据权利要求3所述的图像文字识别信息处理方法,其特征在于,在所述对所述经过文字识别标注修正和/或所述经过文字定位标注修正后的图像进行标注复核操作之后,还包括:根据标注复核操作的修正内容更新所述图像的文字识别标注和/或文字定位标注。5.根据权利要求2所述的图像文字识别信息处理方法,其特征在于,还包括:若所述置信度高于所述置信阈值且所述字符占低于字符阈值,则将所述经过文字识别标注修正和所述经过文字定位标注修正后的图像作为神经网络模型的图像训练数据。6.根据权利要求1所述的图像文字识别信息处理方法,其特征在于,所述将该图像作为神经网络模型的图像训练数据,还包括:将标注有修正后的文字识别信息和文字定位信息的图像作为神经网络模型的图像训练数据对所述神经网络模型进行图像文字识别训练,得到经过训练后的神经网络模型,所述神经网络模型用于对金融交易凭证图像或身份凭证图像进行图像识别,得到图像识别信息以进行交易处理。7.一种图像文字识别信息处理装置,其特征在于,包括:初始识别模块,用于根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息;识别标注修正模块,用于根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比;
    定位标注修正模块,用于根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据。8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述的图像文字识别信息处理方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的图像文字识别信息处理方法的步骤。10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至6任一项所述的图像文字识别信息处理方法的步骤。

    技术总结
    本申请实施例提供一种图像文字识别信息处理方法及装置,可用于金融领域,方法包括:根据预设图像文字识别模型对待标注图像进行图像识别,得到文字识别信息和文字定位信息;根据所述文字识别信息的置信度对所述文字识别信息中的文字识别标注进行识别标注修正,并确定所述识别标注修正时的修正字符在所述文字识别标注中的字符占比;根据所述字符占比对所述文字定位信息中的文字定位标注进行定位标注修正,得到标注有修正后的文字识别信息和文字定位信息的图像,并将该图像作为神经网络模型的图像训练数据;本申请能够有效提高用于模型训练的图像训练数据的标注效率。型训练的图像训练数据的标注效率。型训练的图像训练数据的标注效率。


    技术研发人员:杨家安 张亚 李兆佳 杨亚民
    受保护的技术使用者:中国工商银行股份有限公司
    技术研发日:2022.02.18
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-9259.html

    最新回复(0)