一种图像数据扩充方法及系统

    专利查询2025-07-18  5


    本发明属于图像处理,具体地涉及一种图像数据扩充方法及系统。


    背景技术:

    1、目前在数据扩充和图像增强领域,尤其是工业图像数据扩充和数据增强领域。由于收集真实数据存在诸多困难,如真实数据稀少,收集成本过高,无法短时间内收集到大量且全面的真实数据等。对后期的图像处理,模型训练工作带来极大影响。

    2、现有的图像增强方法针对上述困难,难以获得较好且精细的增强效果。例如采用图像分割器作为前置目标获取组件,将获取到的图像目标的mask通过复制粘贴等方式增强到真实场景图像中。存在前期标注工作繁琐,增加新类别时的适应性不强,且需要单独训练图像分割模型等困难。采用目标检测器作为前置目标获取组件时,由于目标检测结果通常是一个矩形,在获取的目标检测框中,存在多余的图像信息,无法做到精细扣取目标图像等困难。


    技术实现思路

    1、为了解决上述技术问题,本发明提供了一种图像数据扩充方法及系统,用于解决现有技术中的技术问题。

    2、一方面,该发明提供以下技术方案,一种图像数据扩充方法,所述方法包括:

    3、获取初始图像,将所述初始图像输入至预估网络,得到所述初始图像的预估值,将所述预估值及所述初始图像输入至去噪网络,得到去噪图像;

    4、转化所述去噪图像,得到所述去噪图像的色相、饱和度、及亮度,利用校正函数及图像处理滤波函数对所述亮度进行增强处理,将处理后的所述亮度与所述色相、及所述饱和度合并,得到合并后的颜色空间,并将所述颜色空间反向转化为提亮图像;

    5、利用单级特征金字塔结构提取所述提亮图像的融合图像,利用引入深度卷积层的编码器提取所述融合图像的局部特征,并聚合所述局部特征形成局部融合图像,利用解码器对所述局部融合图像进行解码得到目标图像;

    6、利用分割模型分割所述目标图像的目标,并获取所述目标的掩膜,利用图像处理库基于所述掩膜对需要扩充的图像上进行所述掩膜的粘贴、镜像、尺度变换,得到扩充图像。

    7、相比现有技术,本申请的有益效果为:通过得到去噪图像及得到提亮图像的步骤,可以有效的去除图像的噪声和提高图像的亮度,便于后期得到精度高的目标图像,再通过得到目标图像的步骤,提高对不同大小目标的检测能力,从而可以得到更精度目标,取得更加精细的操作,最后通过得到扩充图像的步骤,可以有效的得到若干的精细数据。

    8、进一步的,所述利用校正函数及图像处理滤波函数处理所述亮度的步骤包括:

    9、对所述亮度进行图像处理,得到第一处理层和第二处理层;

    10、利用图像处理滤波函数提取所述第一处理层的光照分量,利用加权计算公式基于所述光照分量计算,得到反射层;

    11、利用搜索算法所述第二处理层,得到校正值,利用校正函数基于所述校正值校正所述第二处理层每个像素点的亮度分量,形成亮度层;

    12、将所述亮度层叠加到所述反射层,并进行融合补偿得到光照层。

    13、进一步的,所述加权计算公式包括:

    14、

    15、表示为反射层,表示在位置(x,y) 处,第 i 个通道的亮度,表示为卷积操作,表示为图像处理滤波函数,表示为权重系数,卷积核的尺度,分别表示为像素点的横纵坐标;

    16、所述校正函数包括:

    17、

    18、其中,表示输出图像,表示为校正值,表示为像素灰度值,q表示为校正参数。

    19、进一步的,所述预估网络包括五个卷积神经网络框架和一移动窗口机制;

    20、所述去噪网络包括两个残差结构、两个卷积神经网络框架及三个多尺度结构,其中,所述多尺度结构包括分支单元、及融合单元。

    21、进一步的,所述利用单级特征金字塔结构提取所述提亮图像的融合图像的步骤包括:

    22、利用具有不同膨胀系数的膨胀卷积组代替残差网络中的下采样操作,并对其最后一层输出使用多组平行转置卷积操作,形成单级特征金字塔结构;

    23、利用所述单级特征金字塔结构提取所述提亮图像的含有浅层和深层特征信息的特征图像,对所述特征图像使用不同大小的转置卷积操作,形成融合图像。

    24、进一步的,引入深度卷积层的所述编码器包括:输入嵌入层、多头注意力层、残差归一化层、深度卷积层及全连接层,其中,所述深度卷积层来增强上下文的局部信息的关联性。

    25、进一步的,所述解码器中加入有权重约束的注意力机制;

    26、所述注意力机制包括:

    27、

    28、其中,表示第 x个头在第 x层的输出,、及分别表示第 x个头的查询、对应的值及键,表示残差连接的偏置项, x是层数的索引值,t表示转置,表示前一层的输出。

    29、第二方面,该发明提供以下技术方案,一种图像数据扩充系统,所述系统包括:

    30、去噪模块,用于获取初始图像,将所述初始图像输入至预估网络,得到所述初始图像的预估值,将所述预估值及所述初始图像输入至去噪网络,得到去噪图像;

    31、提亮模块,用于转化所述去噪图像,得到所述去噪图像的色相、饱和度、及亮度,利用校正函数及图像处理滤波函数对所述亮度进行增强处理,将处理后的所述亮度与所述色相、及所述饱和度合并,得到合并后的颜色空间,并将所述颜色空间反向转化为提亮图像;

    32、解码模块,用于利用单级特征金字塔结构提取所述提亮图像的融合图像,利用引入深度卷积层的编码器提取所述融合图像的局部特征,并聚合所述局部特征形成局部融合图像,利用解码器对所述局部融合图像进行解码得到目标图像;

    33、扩充模块,用于利用分割模型分割所述目标图像的目标,并获取所述目标的掩膜,利用图像处理库基于所述掩膜对需要扩充的图像上进行所述掩膜的粘贴、镜像、尺度变换,得到扩充图像。

    34、第三方面,该发明提供以下技术方案,一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的图像数据扩充方法。

    35、第四方面,该发明提供以下技术方案,一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的图像数据扩充方法。



    技术特征:

    1.一种图像数据扩充方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的图像数据扩充方法,其特征在于,所述利用校正函数及图像处理滤波函数处理所述亮度的步骤包括:

    3.根据权利要求2所述的图像数据扩充方法,其特征在于,所述加权计算公式包括:

    4.根据权利要求1所述的图像数据扩充方法,其特征在于,所述预估网络包括五个卷积神经网络框架和一移动窗口机制;

    5.根据权利要求1所述的图像数据扩充方法,其特征在于,所述利用单级特征金字塔结构提取所述提亮图像的融合图像的步骤包括:

    6.根据权利要求1所述的图像数据扩充方法,其特征在于,引入深度卷积层的所述编码器包括:输入嵌入层、多头注意力层、残差归一化层、深度卷积层及全连接层,其中,所述深度卷积层来增强上下文的局部信息的关联性。

    7.根据权利要求1所述的图像数据扩充方法,其特征在于,所述解码器中加入有权重约束的注意力机制;

    8.一种图像数据扩充系统,其特征在于,所述系统包括:

    9.一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的图像数据扩充方法。

    10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的图像数据扩充方法。


    技术总结
    本发明提供了一种图像数据扩充方法及系统,所述方法获取初始图像,所述初始图像输入至去噪网络,得到去噪图像;利用校正函数及图像处理滤波函数对所述亮度进行增强处理,将处理后的所述亮度与所述色相、及所述饱和度合并,得到合并后的颜色空间,并将所述颜色空间反向转化为提亮图像;利用单级特征金字塔结构提取所述提亮图像的融合图像,利用引入深度卷积层的编码器提取所述融合图像的局部特征,并聚合所述局部特征形成局部融合图像,利用解码器对所述局部融合图像进行解码得到目标图像;利用分割模型分割所述目标图像的目标,并获取所述目标的掩膜,得到扩充图像,有效的得到若干的精细数据。

    技术研发人员:杨淑盈,甘仿,李志翔,刘丁发,程巧玲,闻鹏,乐宁建
    受保护的技术使用者:江西软件职业技术大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-30400.html

    最新回复(0)