一种嵌套遮盖数据增强方法与流程

    专利查询2025-06-25  23


    本发明涉及视觉检测,尤其是一种嵌套遮盖数据增强方法。


    背景技术:

    1、现有技术中,数据增强方法包括以下几种:

    2、1、cutout(2017年提出):cutout算法是随机从图片上截取一块大小固定的正方形mask区域,并赋予固定值(一般为黑色);

    3、2、random erasing(2017年提出):random erasing和cutout算法近似,区别在于random erasing算法随机截取mask区域的长和宽是不固定的,并且mask区域的替代值也不固定;

    4、3、hide-and-seek(2018年提出):has算法将原图等分成小块,每个小块以一定的概率成为mask掩盖区域;

    5、4、gridmask(2020年提出):gridmask算法采用网格方式进行等距掩盖,使得目标区域不完全被mask区域遮盖;

    6、5、fencemask(2020年提出):和gridmask类似,fencemask将gridmask的等距网格换成了倾斜的等距网格;

    7、6、keepaugment(2020年提出):keepaugment算法通过特征图来定位mask区域,从而避免目标区域被mask遮盖。

    8、但是,以上现有技术存在以下缺陷:

    9、1、cutout(2017年提出),random erasing(2017年提出),hide-and-seek(2018年提出)的mask容易破坏原图特征结构;

    10、2、gridmask(2020年提出),fencemask(2020年提出):网格mask等距问题使得遮盖缺乏随机灵活性;

    11、3、keepaugment(2020年提出):特征图计算带来的训练耗时。


    技术实现思路

    1、本发明要解决的技术问题是:提供一种嵌套遮盖数据增强方法,解决了现有数据增强算法在缓解过拟合问题时存在完全遮挡目标等问题,提高模型泛化能力,有效提升包含小目标的分类准确率。

    2、本发明解决其技术问题所采用的技术方案是:一种嵌套遮盖数据增强方法,包括以下步骤,

    3、s1、获取一张图像,并设定初始参数;初始参数包括初始遮盖边长、嵌套比率以及嵌套次数;

    4、s2、根据设定的初始遮盖边长在图像上进行随机遮盖,获得遮盖区域;

    5、s3、在遮盖区域根据预设的嵌套比率计算出反遮盖区域的嵌套边长并进行随机反遮盖;

    6、s4、在随机反遮盖区域根据预设的嵌套比率计算出下一次的遮盖区域的嵌套边长并进行随机遮盖;

    7、s5、交替重复步骤s3和步骤s4;

    8、s6、重复直到满足预设的嵌套次数。

    9、进一步的说,本发明所述的步骤s5中,若上一次是遮盖操作,那么下一次就是反遮盖操作;若上一次是反遮盖操作,那么下一次就是遮盖操作。

    10、进一步的说,本发明每一次嵌套的嵌套边长的计算方式为:cn=c*rn;其中,c为初始边长,r为嵌套比率,n为嵌套次数。

    11、本发明的有益效果是,解决了背景技术中存在的缺陷,在现有数据增强方法的基础上添加随机嵌套结构,通过随机反遮盖操作释放一部分遮盖区域;采用本发明,能对不同分类图片数据进行预处理,在不影响模型训练和推理效率的同时,提高分类模型的泛化能力和分类准确率;同时本发明保留了cutout算法随机性和gridmask,fencemask的结构持续性,避免了keepaugment带来的额外特征图计算耗时,在数据集上普遍提升了分类准确率和模型泛化能力。



    技术特征:

    1.一种嵌套遮盖数据增强方法,其特征在于:包括以下步骤,

    2.如权利要求1所述的一种嵌套遮盖数据增强方法,其特征在于:所述的步骤s5中,若上一次是遮盖操作,那么下一次就是反遮盖操作;若上一次是反遮盖操作,那么下一次就是遮盖操作。

    3.如权利要求1所述的一种嵌套遮盖数据增强方法,其特征在于:每一次嵌套的嵌套边长的计算方式为:cn=c*rn;其中,c为初始边长,r为嵌套比率,n为嵌套次数。


    技术总结
    本发明涉及一种嵌套遮盖数据增强方法,包括步骤S1、获取一张图像,并设定初始遮盖边长、嵌套比率以及嵌套次数;S2、根据设定的初始遮盖边长在图像上进行随机遮盖,获得遮盖区域;S3、在遮盖区域根据预设的嵌套比率计算出反遮盖区域的嵌套边长并进行随机反遮盖;S4、在随机反遮盖区域根据预设的嵌套比率计算出下一次的遮盖区域的嵌套边长并进行随机遮盖;S5、交替重复步骤S3和步骤S4;S6、重复直到满足预设的嵌套次数。本发明能对不同分类图片数据进行预处理,在不影响模型训练和推理效率的同时,提高分类模型的泛化能力和分类准确率。

    技术研发人员:和江镇,王岩松,方志斌,陈嘉杰,吴健雄
    受保护的技术使用者:征图新视(江苏)科技股份有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-29776.html

    最新回复(0)