本发明属于数字图像处理中的视频数据增强,具体涉及一种自适应复制粘贴的集群目标运动序列视频生成方法。
背景技术:
1、近年来,深度学习领域快速发展,其中最具代表性的视觉目标检测广泛应用于生活、军事、安防等多个方面。基于深度学习的视觉目标检测的性能往往取决于数据量,在一些难以获取数据的特殊场景下目标检测算法的应用受到了限制。例如在无人机蜂群探测、机器人集群检测场景下,由于商业或国家机密等原因视频数据难以获取,进而对于算法研发需要对序列视频中的单个目标进行复制、粘贴、篡改生成集群模拟视频用于训练或测试。
2、当前很多类似的场景下大多采用ps图像编辑软件等手动进行目标的复制、粘贴,此方法会耗费大量时间与精力,进而部分研究者提出了相关的增强算法。王康等人基于视频时域信息挖掘视频时偏特性,提出了一种基于时偏特性的复制粘贴篡改算法;golnazghiasi等人提出了一种简单有效的目标复制粘贴方法,根据目标的标注信息随机将目标区域粘贴在图像的其他区域。
技术实现思路
1、(一)要解决的技术问题
2、现有技术的目标复制粘贴依赖于目标的分割标注信息,并且由于粘贴的随机性无规律性无法应用于序列视频上,生成多个目标共同以集群形式运动的序列视频。
3、(二)技术方案
4、为了解决上述现有技术的不足,本发明提供一种自适应复制粘贴的集群目标运动序列视频生成方法,在仅有目标检测框标注的条件下使用自适应目标分割算法提取目标的掩码区域,并按照原始目标在序列视频的运动规律粘贴多个目标,生成模拟的集群目标运动视频。
5、为达到上述目的,本发明一种自适应复制粘贴的集群目标运动序列视频生成方法,它包括以下步骤:
6、步骤1:对于已有标注的序列视频数据s,其总帧数为n,第i帧视频图像中目标的标注边框区域为bboxi,读取序列视频s的每一帧图像数据framei以及对应的边框标注bboxi。
7、步骤2:根据步骤1中读取到的边框标注数据截取目标的矩形图像区域recti,图像区域recti仅包含目标的图像信息以及相对纯洁的背景信息,过程如下式:
8、recti=cut(framei,bboxi)
9、其中cut(·)表示按照标注截取图像的矩形区域,输入图像为rgb三通道图像,截取操作同时在三个通道上执行。
10、步骤3:基于自适应阈值分割算法提取目标区域掩码,步骤2中截取的矩形图像区域recti为目标区域的外接矩形,即目标在当前矩形区域为前景,此处使用漫水填充分割、基于神经网络的前景分割等分割算法f(·)提取目标的不规则区域掩码maski,并根据掩码截取对应的目标图像数据areai,过程如下式所示:
11、maski=f(recti)
12、areai=cut(recti,maski)
13、步骤4:目标区域根据运动规律复制粘贴,基于步骤3得到的目标数据areai,根据视频中原始目标的位置设定新目标obj的数量m与粘贴位置偏差(ui,j,vi,j),其中j∈[1,m],并在原始图像上进行粘贴。为了新目标的逼真性与运动规律性,对所设定的位置(ui,j,vi,j)增加随机性的正弦扰动,以模拟集群目标的运动规律,计算公式如下式所示:
14、
15、其中i为当前视频帧的编号,k为手动设置的超参数,新目标的运动波动频率与其大小相关,分别为新目标objj在当前帧最终粘贴位置相对于原始目标的横纵坐标偏差。
16、步骤5:粘贴边界模糊,在步骤4的目标粘贴位置粘贴后,对其边界区域进行平均滤波模糊,以防止出现明显的粘贴痕迹。
17、步骤6:当前帧的目标复制粘贴完成后如果视频还未结束,返回步骤1执行下一帧操作,重复上述直至视频结束。
18、(三)有益效果
19、与现有技术相比,本发明具有以下有益的技术效果:
20、本发明设计了一种新的序列视频单目标复制粘贴为集群目标的数据增强方法,能够自适应分割出目标的不规则区域并按照具备一定随机性和合理性的规则粘贴目标,生成逼真的集群运动序列视频,用于相关算法或项目的研发。
1.一种自适应复制粘贴的集群目标运动序列视频生成方法,其特征在于,它包括以下步骤:
2.根据权利要求1所述的一种自适应复制粘贴的集群目标运动序列视频生成方法,其特征在于,自适应目标前景分割算法根据应用场景自由选择;新的目标数量和分布均可人为根据需求自行设定,无具体限制。
3.根据权利要求1所述的一种自适应复制粘贴的集群目标运动序列视频生成方法,其特征在于,新增目标的位置增加了随机的正弦扰动,以模拟更逼真的集群运动;在新增目标的粘贴边界进行核大小为5×5的平均滤波模糊,用于消除粘贴痕迹。
