图像增强模型的训练和图像增强方法、装置、设备及介质与流程

    专利查询2022-08-16  107



    1.本发明涉及图像处理技术领域,尤其涉及一种图像增强模型的训练和 图像增强方法、装置、设备及介质。


    背景技术:

    2.在实际生活中,经常会需要对文档进行扫描。现在市场有许多可以实 现扫描的应用程序,文档扫描的核心步骤在于经过图像增强处理得到一张 高对比度的灰度图像。经过图像增强过程,除掉了噪声但是也会丢失图片 中的某些信息。
    3.目前常见的图像增强方法主要分为传统方法和机器学习方法。传统方 法的缺点主要在于难以全面覆盖各种情况,实际效果显著取决于参数的变 动。现有的机器学习方法包括:有监督机器学习方法和无监督学习方法。 有监督学习方法需要人工标注大量的成对的训练数据才有可能取得不错 的结果,而图像清晰化的数据手工标注的难度较高,需要很高的成本。无 监督学习方法通常使用对抗生成网络,图像增强效果有待提高。


    技术实现要素:

    4.本发明提供了一种图像增强模型的训练和图像增强方法、装置、设备 及介质,以解决传统的图像增强模型的图像增强效果有待提高的问题,对 传统的对抗生成网络进行改进,以提高图像增强精度和增强效果。
    5.根据本发明的一方面,提供了一种图像增强模型的训练方法,包括:
    6.获取目标图像样本集;所述目标图像样本集包括:多个第一目标图像和 多个第二目标图像;所述第一目标图像的对比度低于所述第二目标图像的对 比度;
    7.将所述目标图像样本集中的目标图像输入循环生成对抗网络模型得到预 测图像;其中,所述循环生成对抗网络模型的生成网络包括:多个u型网络;
    8.根据所述预测图像和所述目标图像形成的损失函数训练所述循环生成对 抗网络模型的参数;
    9.返回执行将所述目标图像样本集中的目标图像输入所述循环生成对抗网 络模型得到预测图像的操作,直至得到目标图像增强模型。
    10.根据本发明的另一方面,提供了一种图像增强方法,包括:
    11.获取待处理图像;
    12.通过目标图像增强模型对所述待处理图像进行图像增强处理得到增强图 像。
    13.根据本发明的另一方面,提供了一种图像增强模型的训练装置,包括:
    14.获取模块,用于获取目标图像样本集;所述目标图像样本集包括:多个 第一目标图像和多个第二目标图像;所述第一目标图像的对比度低于所述第 二目标图像的对比度;
    15.预测模块,用于将所述目标图像样本集中的目标图像输入循环生成对抗 网络模型得到预测图像;其中,所述循环生成对抗网络模型的生成网络包括: 多个u型网络;
    16.训练模块,用于根据所述预测图像和所述目标图像形成的损失函数训练 所述循
    环生成对抗网络模型的参数;
    17.迭代模块,用于返回执行将所述目标图像样本集中的目标图像输入所述 循环生成对抗网络模型得到预测图像的操作,直至得到目标图像增强模型。
    18.根据本发明的另一方面,提供了一种图像增强装置,包括:
    19.获取模块,用于获取待处理图像;
    20.处理模块,用于通过目标图像增强模型对所述待处理图像进行图像增强 处理得到增强图像。
    21.根据本发明的另一方面,提供了一种计算机设备,所述计算机设备包 括:
    22.至少一个处理器;以及
    23.与所述至少一个处理器通信连接的存储器;其中,
    24.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述 计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执 行本发明任一实施例所述的图像增强模型的训练方法或者图像增强方法。
    25.根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算 机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时 实现本发明任一实施例所述的图像增强模型的训练方法或者图像增强方 法。
    26.本发明实施例的技术方案,通过获取目标图像样本集;目标图像样本 集包括:多个第一目标图像和多个第二目标图像;第一目标图像的对比度 低于第二目标图像的对比度;将目标图像样本集中的目标图像输入循环生 成对抗网络模型得到预测图像;循环生成对抗网络模型的生成网络包括: 多个u型网络;根据预测图像和目标图像形成的损失函数训练循环生成对 抗网络模型的参数;返回执行将目标图像样本集中的目标图像输入循环生 成对抗网络模型得到预测图像的操作,直至得到目标图像增强模型,解决 传统的图像增强模型的图像增强效果有待提高的问题,对传统的对抗生成 网络进行改进,达到了提高图像增强精度和增强效果的技术效果。
    27.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键 或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下 的说明书而变得容易理解。
    附图说明
    28.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述 中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅 是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动的前提下,还可以根据这些附图获得其他的附图。
    29.图1是根据本发明实施例一提供的一种图像增强模型的训练方法的流 程图;
    30.图2是循环生成对抗网络的结构示意图;
    31.图3是根据本发明实施例一所提供的一种循环生成对抗网络模型的生 成网络;
    32.图4是传统u型网络u-net的网络结构示意图;
    33.图5是根据本发明实施例一所提供的一种u型网络的网络结构示意图;
    34.图6是根据本发明实施例一所提供的一种空洞卷积块的结构示意图;
    35.图7是根据本发明实施例一所提供的一种生成网络中上采样块的结构 示意图;
    36.图8是根据本发明实施例一所提供的一种生成网络中下采样块的结构 示意图;
    37.图9是根据本发明实施例二提供的一种图像增强方法的流程图;
    38.图10是根据本发明实施例三提供的一种图像增强模型的训练装置的 结构示意图;
    39.图11是根据本发明实施例四提供的一种图像增强装置的结构示意图;
    40.图12是实现本发明实施例的图像增强模型的训练方法的计算机设备 的结构示意图。
    具体实施方式
    41.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动 前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
    42.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语
    ꢀ“
    第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺 序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这 里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺 序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于 覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、 产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚 地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
    43.实施例一
    44.图1为本发明实施例一提供了一种图像增强模型的训练方法的流程图, 本实施例可适用于训练图像增强模型的情况,该方法可以由图像增强模型 的训练装置来执行,该图像增强模型的训练装置可以采用硬件和/或软件 的形式实现,该图像增强模型的训练装置可配置于计算机设备中。如图1 所示,该方法包括:
    45.s110、获取目标图像样本集;目标图像样本集包括:多个第一目标图像 和多个第二目标图像;第一目标图像的对比度低于第二目标图像的对比度。
    46.其中,目标图像样本集是用于训练图像增强模型的训练样本集,目标图 像样本集可以包括多个第一目标图像和多个第二目标图像,且第一目标图像 的对比度低于第二目标图像的对比度。具体可以为第一目标图像为低对比度 图像,第二目标图像为高对比度图像。需要说明的是第一目标图像和第二目 标图像无需相互关联。
    47.示例性的,获取第一目标图像的方式可以为通过扫描设备扫描纸质文档 得到第一目标图像,或者可以为通过具有图像采集功能的计算机设备拍摄纸 质文档得到第一目标图像,或者对拍摄的图像经过滤波或截取等预处理得到 第一目标图像。获取第二目标图像的方式可以为将纸质文档对应的pdf或 word格式的电子文档转换为固定分辨率大小的png等图片格式得到第二目标 图像。本发明实施例对获取目标图像样本集的方式不进行限制。需要说明的 是,第一目标图像的对比度较低,但一般都具有较高的分辨率。
    48.s120、将目标图像样本集中的目标图像输入循环生成对抗网络模型得到 预测图像;其中,循环生成对抗网络模型的生成网络包括:多个u型网络。
    49.其中,循环生成对抗网络cyclegan是一种非监督学习模型,由生成对抗 网络gan衍生而来。生成对抗网络一般包括一个生成网络和一个鉴别网络, 在训练过程中生成网络负责生成预测数据,使预测数据与真实数据难以区分, 而鉴别网络则努力区分出预测数据和真实数据,在训练过程中两者不断进行 着对抗。如图2所示,循环生成对抗网络则采用了两个生成网络g和f,以 及两个鉴别网络dx和dy,第一生成网络g表示从x域到y域的生成网络, 第二生成网络f代表y域到x域的生成网络,第一鉴别网络d
    x
    用于判断第一 生成网络f生成的f(y)是否属于x域的,第二鉴别网络dy则判断第二生成网 络g生成的g(x)是否属于y域。x和y分别代表两个不同的域,x域可以表 示为样本图像域,y域可以表示为预测图像域。第一个生成网络输出的图像 可以用作第二个生成网络的输入图像,第二个生成网络的输出图像应与原始 输入图像匹配。示例性的,x域可以表示第一目标图像,y域可以表示第二目 标图像。
    50.在循环生成对抗网络模型中,两个生成网络具有相同的结构。传统的循 环生成对抗网络模型中,常用的生成对抗网络为一个u型网络u-net,u-net 采用全卷积神经网络,左边网络为多个下采样块构成的特征提取网络,右边 网络为多个上采样块构成的特征融合网络。
    51.传统的循环生成对抗网络模型一般针对较低分辨率图像的处理,针对较 高分辨率图像的处理,本发明实施例中的循环生成对抗网络模型的两个生成 网络分别包括多个u型网络,多个u型网络连接作为生成网络,以此提高生 成模型的精度。
    52.示例性的,将多个u型网络相互连接的方式可以为相邻的两个u型网络 连接,具体的连接方式为当前u型网络的输入端和输出端分别与下一个u型 网络的输入端连接,各u型网络的输出端分别作为生成网络的一个输出端, 因此,生成网络具有多个输出端,输出端的数量与生成网络所包含的u型网 络的个数相同。u型网络的个数的选择可以根据实际应用场景对精度的要求 所确定,本发明实施例对此不设限制。
    53.具体的,目标图像样本集中目标图像输入循环生成对抗网络模型得到预 测图像,输入的目标图像可以为第一目标图像或第二目标图像。
    54.s130、根据预测图像和目标图像形成的损失函数训练循环生成对抗网络 模型的参数。
    55.具体的,将第一目标图像输入循环生成对抗网络模型得到的预测图像和 第一目标图像匹配形成两者之间的损失函数,训练循环生成对抗网络模型中 各个生成网络的参数,这是循环一致性对抗网络从x域到y域的正向训练循 环过程。同样的,在y域到x域的反向训练循环过程中会逆转过来,将第二 目标图像输入循环生成对抗网络模型得到的预测图像和第二目标图像匹配形 成两者之间的损失函数,训练循环生成对抗网络模型中各个生成网络的参数。
    56.示例性的,预测图像和目标图像形成的损失函数可以包括:第一生成网 络对应的第一对抗损失和第二生成网络对应的第二对抗损失构成的对抗损失, 第一对抗损失l
    gan(g,dy,x,y)
    为:
    57.l
    gan(g,dy,x,y)
    =e
    y~pdata(y)
    [log dy(y)] e
    x~pdata(x)
    [log(1-dy(g(x))];
    [0058]
    第二对抗损失为:
    [0059]
    l
    gan(f,dx,y,x)
    =e
    x~pdata(x)
    [log d
    x
    (x)] e
    y~pdata(y)
    [log(1-d
    x
    (f(y))];
    [0060]
    其中,d
    x
    表示第一鉴别网络和dy表示第二鉴别网络,g表示第一生成网 络,f表示第二生成网络。
    [0061]
    由于循环生成对抗网络模型的无监督训练中第一生成网络g和第二生成 网络f很容易就会联合鉴别网络一起欺骗,所以仅使用gan损失训练cyclegan 并不能保证保持循环的一致性,需要额外的循环一致性损失执行此属性,将 该环一致性损失定义为输入值x与前向预测f(g(x))以及输入值y与前向预测 g(f(y))之间的差异。差异越大,预测图像与目标图像的距离就越远。理想情 况下,我们的网络将这种损失降到最低。循环一致损失为:
    [0062]
    l
    cyc(g,f)
    =e
    x~pdata(x)
    [||f(g(x))-x||1] e
    y~pdata(y)
    [||g(f(y))-y||1];
    [0063]
    其中,l
    cyc(g,f)
    为循环一致损失;e
    x~pdata(x)
    为输入值x与前向预测f(g(x))之间的 差异,e
    y~pdata(y)
    为输入值y与前向预测g(f(y))之间的差异。该循环一致损失可 以为l1范数损失函数,即平均绝对误差函数;或者可以为图片结构相似性函 数(structural similarity,ssim),还可以为多尺度图片结构相似性函数 (multi-scale structural similarity,ms-ssim);还可以多种函数的加 权和。
    [0064]
    综上,预测图像和目标图像形成的损失函数为:
    [0065]
    l
    (g,f,dx,dy)
    =l
    gan(g,dy,x,y)
    l
    gan(f,dx,y,x)
    λl
    cyc(g,f)

    [0066]
    其中,l
    (g,f,dx,dy)
    为损失函数,l
    gan(gdy,x,y)
    为第一对抗损失,l
    gan(f,dx,y,x)
    为第 二对抗损失;λ为循环一致损失的权重。
    [0067]
    s140、返回执行将目标图像输入循环生成对抗网络模型得到预测图像的 操作,直至得到目标图像增强模型。
    [0068]
    具体的,迭代执行将目标图像样本集中的目标图像依次输入循环生成 对抗网络模型得到预测图像,根据预测图像和目标图像形成的损失函数训 练循环生成对抗网络模型的参数的操作,直到损失函数收敛或者达到预设 训练次数,将此时的循环生成对抗网络模型作为目标图像增强模型,用于 图像增强。
    [0069]
    本发明实施例所提供的图像增强模型的训练方法,通过获取目标图像 样本集;目标图像样本集包括:多个第一目标图像和多个第二目标图像; 第一目标图像的对比度低于第二目标图像的对比度;将目标图像样本集中 的目标图像输入循环生成对抗网络模型得到预测图像;其中,循环生成对 抗网络模型的生成网络包括:多个u型网络;根据预测图像和目标图像形 成的损失函数训练循环生成对抗网络模型的参数;返回执行将目标图像样 本集中的目标图像输入循环生成对抗网络模型得到预测图像的操作,直至 得到目标图像增强模型,将传统循环生成对抗网络模型的对抗生成网络进 行改进得到包含多个u型网络的目标图像增强模型,能够提高图像增强精 度和增强效果。
    [0070]
    在上述实施例的基础上,对循环生成对抗网络模型的结构进一步细化。 在此需要说明的是,为了使描述简要,在变型实施例中仅描述与上述实施例 的不同之处。
    [0071]
    在一个实施例中,该循环生成对抗网络模型包括:样本图像域到预测图 像域的第一生成网络和预测图像域到样本图像域的第二生成网络;其中,第 一生成网络和第二生成网络分别由第一u型网络和第二u型网络组成,第一 u型网络的输入端和第一u型网络的输出端分别与第二u型网络的输入端连 接;第一u型网络和第二u型网络具有相同的网络结
    构。
    [0072]
    其中,在如图2所示的循环生成对抗网络模型的结构基础上,本实施例 中第一生成网络g和第二生成网络f均由两个具有相同网络结构的u型网络 连接而成。
    [0073]
    具体的,如图3所示,两个相同的u型网络分别为第一u网络和第二u 型网络,第一u型网络的输入端和第一u型网络的输出端分别与第二u型网 络的输入端连接,第一u型网络的输入和输出共同作为第二u型网络的输入。
    [0074]
    在输出预测图像时,将第二u型网络的输出的图像作为预测图像,第一 u型网络的输出结果仅作为先验结果。在循环生成对抗网络模型的参数训练 过程中,则将第一u型网络的输出与第二u型网络的输出共同计算损失函数 值,对生成网络进行优化。
    [0075]
    本实施例通过将两个u型网络连接作为循环生成对抗网络模型的生成网 络,提高了循环生成对抗网络模型的图像增强精度,适用于对精度要求极高 的文档照片增强处理场景,使拍摄得到的图片清晰可见。
    [0076]
    在一个实施例中,u型网络的网络结构包括:第一预设数量的连续的上 采样块和第一预设数量的连续的下采样块;其中,连续的上采样块和连续的 下采样块之间采用空洞卷积块连接,空洞卷积块包括:第二预设数量的空洞 卷积。
    [0077]
    示例性的,图4是传统u型网络u-net的网络结构,对于256
    ×
    256
    ×
    3的 图像需要7次下采样和7次上次采样的深层次采样过程才能使u-net网络的 输出能够涵盖更大视野的图片信息。进一步,采用两个u型网络作为循环生 成对抗网络模型的生成网络会导致网络过深,从而导致对于同样尺寸的照片 需要的硬件要求会大幅提高。因此,为了减少对硬件资源的占用,我们在下 采样的卷积过程和上采样的卷积过程之间添加了空洞卷积块使得单个卷积就 可以获得极大的视野,以此来代替传统u型网络u-net中的深层次采样保证 视野范围的同时,减少采样次数以降低对硬件资源的消耗。
    [0078]
    具体的,如图5所示,u型网络的网络结构包括:第一预设数量的连 续的上采样块和第一预设数量的连续的下采样块;其中,连续的上采样块 和连续的下采样块之间采用空洞卷积块连接。空洞卷积块由第二预设数量 的空洞卷积拼接而成。
    [0079]
    在正向传播过程中,下采样块的输出作为首个空洞卷积的输入结果, 在空洞卷积块的运算过程中每个空洞卷积的输入结果和输出结果作为一 次拼接的输入结果,每次拼接的输出作为下一个空洞卷积的输入结果,直 至最后一次拼接的输出结果作为空洞卷积块的输出结果,将输出结果输入 到连续的上采样块中。
    [0080]
    需要说明的是,上采样块与下采样块的第一预设数量以及空洞卷积块 中空洞卷积的第二预设数量相互联系,第二预设数量可以由连续第一预设 数量上采样块对图片上采样后的图片大小所确定。第一预设数量和第二预 设数量可以根据实际需求设定,本发明实施例对此不作限制。
    [0081]
    示例性的,图6是空洞卷积块的结构示意图,如图6所示,空洞卷积 块由4个空洞卷积拼接而成,每个空洞卷积的步长为1,卷积核为3,空 洞卷积运算过程中两个相邻数值的距离即间隔大小设为系数l,当l为1 时与普通卷积相同。例如图6所示空洞卷积块中的四个空洞卷积的系数分 别为1、2、3和5。
    [0082]
    本实施例通过在连续的上采样块和连续的下采样块之间采用空洞卷 积块连接,代替传统u型网络u-net中的深层次采样保证视野范围的同时, 减少采样次数以降低对硬
    件资源的消耗。
    [0083]
    以上实施例所提供的生成网络所构成的循环生成对抗网络模型生成 的图片常常会带有棋盘状的阴影图案,这一点在文档照片图像增强的过程 中尤为显著,特别是在生成的清晰图中字体密集处、即图片的色彩亮度变 化较为频繁且剧烈的局部最为突出。该问题在传统的循环生成对抗网络模 型中所采用的u-net生成网络也有同样的问题。
    [0084]
    针对上述问题,在一个实施例中,所述上采样块包括:第一激活单元、 双线性插值单元、卷积单元和第一归一化单元;所述下采样块包括:第二 激活单元、空洞卷积单元、最大池化单元和第二归一化单元。
    [0085]
    图7是本发明实施例所提供的生成网络中上采样块的结构示意图,循 环生成对抗网络模型生成的图片常常会带有棋盘状的阴影图案是由于生 成网络中上采样块部分采用的转置卷积(反卷积)引起。当转置卷积中的步 幅和大小不完全匹配之时,就会出现重合的部分从而导致结果中的阴影, 合理选择转置卷积中的步幅和大小需要复杂的测试和训练。因此,本发明 实施例对上采样块进行改进,在上采样块中先通过双线性插值单元对进行 上采样使得输入的目标图片长宽变大一倍,再使用普通卷积,以此方案代 替原来的转置卷积操作。双线性插值是图像处理中变换尺寸时候常用的插 值方法,本发明对双线性插值方法不作赘述。
    [0086]
    具体的,如图7所示,在本发明实施例中上采样块包括:第一激活单 元、双线性插值单元、卷积单元和第一归一化单元。第一激活单元中的激 活函数例如可以是relu函数,卷积单元的卷积核为5
    ×
    5,步长为1。
    [0087]
    相应的,为适应改进后的上采样块对下采样块也进行调整。本发明实 施例中的下采样块如图8所示,下采样块具体包括第二激活单元、空洞卷 积单元、最大池化单元和第二归一化单元。第二激活单元例如可以是 leakyrelu激活函数,leakyrelu激活函数是relu的常见改进,在小于0 的区间内也添加了一个小梯度,一定程度能够防止网络节点的坏死。归一 化单元是一种常见的跟在卷积之后的层,一般可以加速网络的收敛速度、 提高收敛稳定性。
    [0088]
    在一个实施例中,所述损失函数包括:第一生成网络对应的第一对抗损 失、第二生成网络对应的第二对抗损失以及所述第一生成网络和所述第二生 成网络之间的循环一致损失;其中,所述循环一致损失包括第一预设权重的 多尺度图片结构相似性函数和平均绝对误差函数的加权和。
    [0089]
    具体的,图像增强过程并非对称的互相转换过程。在图像增强过程中即 第一生成器g生成图像的过程中,无疑会丢失部分信息。我们所期望的是能 够丢掉所有噪声包括图像获取时传感器噪声,图像存储时有损压缩所导致的 块效应等噪声。但是在第二生成器f生成图像的过程,因为循环损失的存在, 第二生成器f会尽力生成与原图相近的照片,即生成了包含了各种噪声的图 像。这对于整个模型来说无疑是一种极大的干扰。
    [0090]
    为此,循环一致损失包括第一预设权重的多尺度图片结构相似性函数和 平均绝对误差函数的加权和。多尺度图片结构相似性函数是基于人眼查看图 像时会提取其中结构化信息的假设提出的图像质量评价指标,和平均绝对误 差函数(l1损失函数)相比,多尺度图片结构相似性函数更能反映在人看来 的图像相似程度。
    [0091]
    在一个实施例中,所述获取目标图像样本集包括:
    [0092]
    获取纸质文档和电子文档;
    [0093]
    通过图像采集设备对纸质文档进行图像采集得到目标图像样本集中的第 一目标图像;
    [0094]
    将电子文档转化为图片格式得到目标图像样本集中的第二目标图像。
    [0095]
    其中,图像采集设备可以是扫描设备和摄像机等具有图像采集功能的设 备,图像采集设备还可以具有一定的过滤等图像预处理功能。
    [0096]
    具体的,通过图像采集设备采集纸质文档的文档照片,将文档照片作 为目标图像样本集中的第一目标图像;将word或pdf等格式的电子文档 转化为固定分辨率大小的jpeg或png等图片格式作为目标图像样本集中 的第二目标图像。
    [0097]
    为了减少对模型训练的干扰,第一目标图像在输入模型之前,还可以 进行裁剪等预处理,使第一目标图像为固定尺寸,如256
    ×
    256,且第一目 标图像画面中尽可能不出现文档以外的部分。
    [0098]
    实施例二
    [0099]
    图9为本发明实施例二提供了一种图像增强方法的流程图,本实施例 可适用于对文档图像进行图像增强的情况,该方法可以由图像增强装置来 执行,该图像增强装置可以采用硬件和/或软件的形式实现,该图像增强 装置可配置于计算机设备中。如图9所示,该方法包括:
    [0100]
    s210、获取待处理图像。
    [0101]
    具体的,获取待处理图像的方式可以为通过摄像头采集待处理图像,还 可以为通过截取的方式获取待处理图像,本发明实施例对获取待处理图像的 方式不进行限制。
    [0102]
    s220、通过目标图像增强模型对所述待处理图像进行图像增强处理得 到增强图像。
    [0103]
    其中,目标图像增强模型是通过目标图像样本集迭代训练循环生成对抗 网络模型得到。生成对抗网络模型的生成网络包括:多个u型网络。在循环 生成对抗网络模型中,两个生成网络具有相同的结构。传统的循环生成对抗 网络模型中,常用的生成对抗网络为一个u型网络u-net,u-net采用全卷积 神经网络,左边网络为多个下采样块构成的特征提取网络,右边网络为多个 上采样块构成的特征融合网络。
    [0104]
    传统的循环生成对抗网络模型一般针对较低分辨率图像的处理,针对较 高分辨率图像的处理,本发明实施例中的循环生成对抗网络模型的两个生成 网络分别包括多个u型网络,多个u型网络连接作为生成网络,以此提高生 成模型的精度。
    [0105]
    本发明实施例所提供的图像增强方法,通过获取待处理图像;通过目 标图像增强模型对所述待处理图像进行图像增强处理得到增强图像;其中, 对传统图像增强模型中的对抗生成网络进行改进,得到包含多个u型网络 的目标图像增强模型,能够提高图像增强精度和增强效果。
    [0106]
    实施例三
    [0107]
    图10为本发明实施例三提供的一种图像增强模型的训练装置的结构 示意图。如图10所示,该装置包括:获取模块310、预测模块320、训练 模块330和迭代模块340;
    [0108]
    其中,获取模块310,用于获取目标图像样本集;所述目标图像样本 集包括:多个第一目标图像和多个第二目标图像;所述第一目标图像的对 比度低于所述第二目标图像
    的对比度;
    [0109]
    预测模块320,用于将所述目标图像样本集中的目标图像输入循环生成 对抗网络模型得到预测图像;其中,所述循环生成对抗网络模型的生成网络 包括:多个u型网络;
    [0110]
    训练模块330,用于根据所述预测图像和所述目标图像形成的损失函数 训练所述循环生成对抗网络模型的参数;
    [0111]
    迭代模块340,用于返回执行将所述目标图像样本集中的目标图像输入 所述循环生成对抗网络模型得到预测图像的操作,直至得到目标图像增强模 型。
    [0112]
    可选的,所述循环生成对抗网络模型包括:样本图像域到预测图像域的 第一生成网络和预测图像域到样本图像域的第二生成网络;
    [0113]
    其中,所述第一生成网络和所述第二生成网络分别由第一u型网络和第 二u型网络组成,所述第一u型网络的输入端和所述第一u型网络的输出端 分别与所述第二u型网络的输入端连接;所述第一u型网络和所述第二u型 网络具有相同的网络结构。
    [0114]
    可选的,所述网络结构包括:第一预设数量的连续的上采样块和第一预 设数量的连续的下采样块;
    [0115]
    其中,所述连续的上采样块和所述连续的下采样块之间采用空洞卷积块 连接,所述空洞卷积块包括:第二预设数量的空洞卷积。
    [0116]
    可选的,所述上采样块包括:第一激活单元、双线性插值单元、卷积单 元和第一归一化单元;所述下采样块包括:第二激活单元、空洞卷积单元、 最大池化单元和第二归一化单元。
    [0117]
    可选的,所述损失函数包括:第一生成网络对应的第一对抗损失、第二 生成网络对应的第二对抗损失以及所述第一生成网络和所述第二生成网络之 间的循环一致损失;
    [0118]
    其中,所述循环一致损失包括第一预设权重的多尺度图片结构相似性函 数和平均绝对误差函数的加权和。
    [0119]
    可选的,所述获取模块310具体用于:
    [0120]
    获取纸质文档和电子文档;
    [0121]
    通过图像采集设备对所述纸质文档进行图像采集得到所述目标图像样本 集中的第一目标图像;
    [0122]
    将所述电子文档转化为图片格式得到所述目标图像样本集中的第二目标 图像。
    [0123]
    本发明实施例所提供的图像增强模型的训练装置可执行本发明任意 实施例所提供的图像增强模型的训练方法,具备执行方法相应的功能模块 和有益效果。
    [0124]
    实施例四
    [0125]
    图11为本发明实施例四提供的一种图像增强装置的结构示意图。如 图11所示,该装置包括:获取模块410和处理模块420;
    [0126]
    其中,获取模块410,用于获取待处理图像;
    [0127]
    处理模块420,用于通目标图像增强模型对所述待处理图像进行图像增 强处理得到增强图像。
    [0128]
    本发明实施例所提供的图像增强装置可执行本发明任意实施例所提 供的图像增强方法,具备执行方法相应的功能模块和有益效果。
    [0129]
    实施例五
    [0130]
    图12示出了可以用来实施本发明的实施例的计算机设备10的结构示 意图。计算机设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、 台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算 机、和其它适合的计算机。计算机设备还可以表示各种形式的移动装置, 诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、 手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、 以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要 求的本发明的实现。
    [0131]
    如图12所示,计算机设备10包括至少一个处理器11,以及与至少一 个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储 器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机 程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或 者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执 行各种适当的动作和处理。在ram 13中,还可存储计算机设备10操作所 需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此 相连。输入/输出(i/o)接口15也连接至总线14。
    [0132]
    计算机设备10中的多个部件连接至i/o接口15,包括:输入单元16, 例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存 储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调 器、无线通信收发机等。通信单元19允许计算机设备10通过诸如因特网 的计算机网络和/或各种电信网络与其他设备交换信息/数据。
    [0133]
    处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。 处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元 (gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型 算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制 器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如图 像增强模型的训练方法或者图像增强方法。
    [0134]
    在一些实施例中,图像增强模型的训练方法或者图像增强方法可被实 现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元 18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或 通信单元19而被载入和/或安装到计算机设备10上。当计算机程序加载 到ram 13并由处理器11执行时,可以执行上文描述的图像增强模型的训 练方法或者图像增强方法的一个或多个步骤。备选地,在其他实施例中, 处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置 为执行图像增强模型的训练方法或者图像增强方法。
    [0135]
    本文中以上描述的系统和技术的各种实施方式可以在数字电子电路 系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、 专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设 备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些 各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者 多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/ 或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储 系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将 数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出 装置。
    [0136]
    用于实施本发明的方法的计算机程序可以采用一个或多个编程语言 的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机 或其他可编程数据处理装置
    的处理器,使得计算机程序当由处理器执行时 使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在 机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行 且部分地在远程机器上执行或完全在远程机器或服务器上执行。
    [0137]
    在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可 以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装 置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限 于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设 备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是 机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多 个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只 读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光 纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、 或上述内容的任何合适组合。
    [0138]
    为了提供与用户的交互,可以在计算机设备上实施此处描述的系统和 技术,该计算机设备具有:用于向用户显示信息的显示装置(例如,crt (阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入 提供给计算机设备。其它种类的装置还可以用于提供与用户的交互;例如, 提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反 馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、 触觉输入)来接收来自用户的输入。
    [0139]
    可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如, 作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、 或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器 的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处 描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部 件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质 的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络 的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
    [0140]
    计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并 且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有 客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器 可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的 一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大, 业务扩展性弱的缺陷。
    [0141]
    应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或 删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执 行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果, 本文在此不进行限制。
    [0142]
    上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术 人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、 子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和 改进等,均应包含在本发明保护范围之内。

    技术特征:
    1.一种图像增强模型的训练方法,其特征在于,包括:获取目标图像样本集;所述目标图像样本集包括:多个第一目标图像和多个第二目标图像;所述第一目标图像的对比度低于所述第二目标图像的对比度;将所述目标图像样本集中的目标图像输入循环生成对抗网络模型得到预测图像;其中,所述循环生成对抗网络模型的生成网络包括:多个u型网络;根据所述预测图像和所述目标图像形成的损失函数训练所述循环生成对抗网络模型的参数;返回执行将所述目标图像样本集中的目标图像输入所述循环生成对抗网络模型得到预测图像的操作,直至得到目标图像增强模型。2.根据权利要求1所述的方法,其特征在于,所述循环生成对抗网络模型包括:样本图像域到预测图像域的第一生成网络和预测图像域到样本图像域的第二生成网络;其中,所述第一生成网络和所述第二生成网络分别由第一u型网络和第二u型网络组成,所述第一u型网络的输入端和所述第一u型网络的输出端分别与所述第二u型网络的输入端连接;所述第一u型网络和所述第二u型网络具有相同的网络结构。3.根据权利要求2所述的方法,其特征在于,所述网络结构包括:第一预设数量的连续的上采样块和第一预设数量的连续的下采样块;其中,所述连续的上采样块和所述连续的下采样块之间采用空洞卷积块连接,所述空洞卷积块包括:第二预设数量的空洞卷积。4.根据权利要求3所述的方法,其特征在于,所述上采样块包括:第一激活单元、双线性插值单元、卷积单元和第一归一化单元;所述下采样块包括:第二激活单元、空洞卷积单元、最大池化单元和第二归一化单元。5.根据权利要求2-4任一所述的方法,其特征在于,所述损失函数包括:第一生成网络对应的第一对抗损失、第二生成网络对应的第二对抗损失以及所述第一生成网络和所述第二生成网络之间的循环一致损失;其中,所述循环一致损失包括第一预设权重的多尺度图片结构相似性函数和平均绝对误差函数的加权和。6.一种图像增强方法,其特征在于,包括:获取待处理图像;通过权利要求1-5任一所述的目标图像增强模型对所述待处理图像进行图像增强处理得到增强图像。7.一种图像增强模型的训练装置,其特征在于,包括:获取模块,用于获取目标图像样本集;所述目标图像样本集包括:多个第一目标图像和多个第二目标图像;所述第一目标图像的对比度低于所述第二目标图像的对比度;预测模块,用于将所述目标图像样本集中的目标图像输入循环生成对抗网络模型得到预测图像;其中,所述循环生成对抗网络模型的生成网络包括:多个u型网络;训练模块,用于根据所述预测图像和所述目标图像形成的损失函数训练所述循环生成对抗网络模型的参数;迭代模块,用于返回执行将所述目标图像样本集中的目标图像输入所述循环生成对抗网络模型得到预测图像的操作,直至得到目标图像增强模型。
    8.一种图像增强装置,其特征在于,包括:获取模块,用于获取待处理图像;处理模块,用于通过权利要求1-5任一所述的目标图像增强模型对所述待处理图像进行图像增强处理得到增强图像。9.一种计算机设备,其特征在于,所述计算机设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的图像增强模型的训练方法或者执行权利要求6中所述的图像增强方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-5中任一项所述的图像增强模型的训练方法或者执行权利要求6中所述的图像增强方法。

    技术总结
    本发明公开了一种图像增强模型的训练和图像增强方法、装置、设备及介质。通过获取目标图像样本集;目标图像样本集包括:多个第一目标图像和多个第二目标图像;第一目标图像的对比度低于第二目标图像的对比度;将目标图像样本集中的目标图像输入循环生成对抗网络模型得到预测图像;循环生成对抗网络模型的生成网络包括:多个U型网络;根据预测图像和目标图像形成的损失函数训练循环生成对抗网络模型的参数;返回执行将目标图像样本集中的目标图像输入循环生成对抗网络模型得到预测图像的操作,直至得到目标图像增强模型,将传统循环生成对抗网络模型的对抗生成网络进行改进,能够提高图像增强精度和增强效果。提高图像增强精度和增强效果。提高图像增强精度和增强效果。


    技术研发人员:钟志育 李斌
    受保护的技术使用者:广州市乐无边教育科技有限公司
    技术研发日:2022.02.18
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-8379.html

    最新回复(0)