拍照行为识别方法、装置、电子设备和存储介质与流程

    专利查询2022-07-08  167



    1.本发明涉及计算机技术领域,尤其涉及一种拍照行为识别方法、装置、电子设备和存储介质。


    背景技术:

    2.企业信息安全是各企业的关注重点。目前,大多企业均采用电脑办公,若员工通过拍照设备拍摄电脑屏幕,则可能会造成电脑中的技术资料泄露的风险,因此需要对拍照行为进行识别。
    3.目前,多采用基于one-stage的网络结构进行拍照行为识别,该结构通过预选出一定数量的anchor,并对这些anchor直接进行回归分类,从而识别是否存在拍照设备,然而该方法识别精度较低。


    技术实现要素:

    4.本发明提供一种拍照行为识别方法、装置、电子设备和存储介质,用以解决现有技术中识别精度较低的缺陷。
    5.本发明提供一种拍照行为识别方法,包括:
    6.确定指定区域内待识别的目标图像帧;
    7.将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果;所述识别结果用于表征所述指定区域内是否存在拍照设备;
    8.其中,所述拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;所述拍照行为识别模型用于提取所述目标图像帧的全局特征以及多个不同尺度的局部特征后,对所述全局特征以及所述多个不同尺度的局部特征进行融合,得到融合特征,并基于所述融合特征确定所述识别结果。
    9.根据本发明提供的一种拍照行为识别方法,所述将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果,包括:
    10.将所述目标图像帧输入至所述拍照行为识别模型的全局特征提取层,由所述全局特征提取层对所述目标图像帧进行全局特征提取,得到所述全局特征提取层输出的所述全局特征;
    11.将所述目标图像帧输入至所述拍照行为识别模型的局部特征提取层,由所述局部特征提取层提取所述目标图像帧的多个不同尺度的局部特征,并对各尺度的局部特征进行加权融合,得到所述局部特征提取层输出的加权局部特征;
    12.将所述全局特征和所述加权局部特征输入至所述拍照行为识别模型的融合层,由所述融合层对所述全局特征和所述加权局部特征进行特征融合,得到所述融合层输出的所述融合特征;
    13.将所述融合特征输入至所述拍照行为识别模型的行为识别层,由所述行为识别层基于所述融合特征进行行为识别,得到所述行为识别层输出的所述行为识别结果。
    14.根据本发明提供的一种拍照行为识别方法,所述将所述融合特征输入至所述拍照行为识别模型的行为识别层,由所述行为识别层基于所述融合特征进行行为识别,得到所述行为识别层输出的所述行为识别结果,包括:
    15.将所述融合特征输入至所述行为识别层的目标检测层,由所述目标检测层基于所述融合特征进行目标检测,得到所述目标检测层输出的目标检测框;
    16.将所述目标检测框以及所述目标图像帧输入至所述行为识别层的图像裁剪层,由所述图像裁剪层基于所述目标检测框对所述目标图像帧进行裁剪,得到所述图像裁剪层输出的目标区域图像;
    17.将所述目标区域图像输入至所述行为识别层的行为分类层,由所述行为分类层对所述目标区域图像进行拍照设备识别,得到所述行为分类层输出的所述行为识别结果。
    18.根据本发明提供的一种拍照行为识别方法,所述局部特征提取层基于如下步骤构建得到:
    19.确定初始特征金字塔网络;
    20.对所述初始特征金字塔网络的网络宽度进行裁剪,并基于裁剪后的初始特征金字塔网络构建所述局部特征提取层。
    21.根据本发明提供的一种拍照行为识别方法,所述全局特征提取层基于mobilenetv1网络构建得到。
    22.根据本发明提供的一种拍照行为识别方法,所述目标图像帧为连续视频帧;
    23.所述将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果,包括:
    24.将各视频帧输入至所述拍照行为识别模型,得到所述拍照行为识别模型输出的各视频帧对应的初始行为识别结果;
    25.基于各视频帧对应的初始行为识别结果,确定所述识别结果。
    26.根据本发明提供的一种拍照行为识别方法,所述得到所述拍照行为识别模型输出的识别结果,之后还包括:
    27.在所述识别结果为所述指定区域内存在拍照设备的情况下,进行预警提示。
    28.本发明还提供一种拍照行为识别装置,包括:
    29.确定单元,用于确定指定区域内待识别的目标图像帧;
    30.识别单元,用于将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果;所述识别结果用于表征所述指定区域内是否存在拍照设备;
    31.其中,所述拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;所述拍照行为识别模型用于提取所述目标图像帧的全局特征以及多个不同尺度的局部特征后,对所述全局特征以及所述多个不同尺度的局部特征进行融合,得到融合特征,并基于所述融合特征确定所述识别结果。
    32.本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述拍照行为识别方法的步骤。
    33.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述拍照行为识别方法的步骤。
    34.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述拍照行为识别方法的步骤。
    35.本发明提供的拍照行为识别方法、装置、电子设备和存储介质,通过拍照行为识别模型分别提取目标图像帧的全局特征以及多个不同尺度的局部特征,从而对全局特征和多个不同尺度的局部特征进行融合后得到的融合特征中既包含有目标图像帧的全局特征信息,也包含有目标图像帧在不同分辨率下的局部特征信息,进而能够进一步准确根据融合特征确定指定区域内是否存在拍照设备,提高拍照行为识别精度。
    附图说明
    36.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
    37.图1是本发明提供的拍照行为识别方法的流程示意图之一;
    38.图2是本发明提供的拍照行为识别方法的流程示意图之二;
    39.图3是本发明提供的拍照行为识别装置的结构示意图;
    40.图4是本发明提供的电子设备的结构示意图。
    具体实施方式
    41.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
    42.目前,多采用基于two-stage的网络结构或基于one-stage的网络结构进行拍照行为识别。其中,基于two-stage的网络结构首先需要从待识别的图片上预选出大量的区域,然后再对这些区域进行回归和分类,从而识别出是否存在拍照设备,该结构优点是检测精度高,缺点是运行速度慢。基于one-stage的网络结构则是预选出一定数量的anchor,并对这些anchor直接进行回归分类,从而识别出是否存在拍照设备,该结构的优点在于速度快,缺点为相对于two-stage的网络结构精度较低。
    43.对此,本发明提供一种拍照行为识别方法。图1是本发明提供的拍照行为识别方法的流程示意图之一,如图1所示,该方法包括如下步骤:
    44.步骤110、确定指定区域内待识别的目标图像帧。
    45.此处,指定区域指可能存在技术泄露风险的区域,例如,在采用电脑进行办公时,由于电脑屏幕上会显示技术资料,若采用拍照设备拍摄电脑屏幕上的技术资料,则可能会造成技术泄露的风险,因此可以将电脑屏幕附近区域设置为指定区域。目标图像帧即需要进行拍照行为识别的图像帧,若目标图像帧中存在拍照设备,则表明指定区域内存在拍照设备,也即指定区域内存在技术泄露风险的概率较高;若目标图像帧中不存在拍照设备,则表明指定区域内不存在拍照设备,也即指定区域内存在技术泄露风险的概率较低。
    46.步骤120、将目标图像帧输入至拍照行为识别模型,得到拍照行为识别模型输出的
    识别结果;识别结果用于表征指定区域内是否存在拍照设备;
    47.其中,拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;拍照行为识别模型用于提取目标图像帧的全局特征以及多个不同尺度的局部特征后,对全局特征以及多个不同尺度的局部特征进行融合,得到融合特征,并基于融合特征确定识别结果。
    48.具体地,在获取目标图像帧后,将目标图像帧输入至拍照行为识别模型,从而拍照行为识别模型可以分别提取目标图像帧的全局特征以及多个不同尺度的局部特征,然后对全局特征和多个不同尺度的局部特征进行融合,得到融合特征。
    49.需要说明的是,由于全局特征用于表征目标图像帧的全局特征信息,各尺度的局部特征用于表征目标图像帧在不同分辨率下的局部特征信息,从而对全局特征和多个不同尺度的局部特征进行融合后得到的融合特征既包含有目标图像帧的全局特征信息,也包含有目标图像帧在不同分辨率下的局部特征信息,进而能够进一步准确根据融合特征确定指定区域内是否存在拍照设备。该拍照设备可以为手机、照相机等具有拍照功能的设备。
    50.其中,拍照行为识别模型是基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到,样本拍照行为结果可以用于表征样本图像帧中是否存在拍照设备。
    51.在将目标图像帧输入至拍照行为识别模型之前,还可以预先训练得到拍照行为识别,具体可以通过执行如下步骤实现:首先,收集大量样本图像帧,通过人工标注确定其对应的样本图像帧的样本拍照行为结果。随即,基于样本图像帧以及样本图像帧的样本拍照行为结果对初始模型进行训练,从而得到拍照行为识别。
    52.本发明实施例提供的拍照行为识别方法,通过拍照行为识别模型分别提取目标图像帧的全局特征以及多个不同尺度的局部特征,从而对全局特征和多个不同尺度的局部特征进行融合后得到的融合特征中既包含有目标图像帧的全局特征信息,也包含有目标图像帧在不同分辨率下的局部特征信息,进而能够进一步准确根据融合特征确定指定区域内是否存在拍照设备,提高拍照行为识别精度。
    53.基于上述实施例,将目标图像帧输入至拍照行为识别模型,得到拍照行为识别模型输出的识别结果,包括:
    54.将目标图像帧输入至拍照行为识别模型的全局特征提取层,由全局特征提取层对目标图像帧进行全局特征提取,得到全局特征提取层输出的全局特征;
    55.将目标图像帧输入至拍照行为识别模型的局部特征提取层,由局部特征提取层提取目标图像帧的多个不同尺度的局部特征,并对各尺度的局部特征进行加权融合,得到局部特征提取层输出的加权局部特征;
    56.将全局特征和加权局部特征输入至拍照行为识别模型的融合层,由融合层对全局特征和加权局部特征进行特征融合,得到融合层输出的融合特征;
    57.将融合特征输入至拍照行为识别模型的行为识别层,由行为识别层基于融合特征进行行为识别,得到行为识别层输出的行为识别结果。
    58.具体地,拍照行为识别模型包括全局特征提取层、局部特征提取层、融合层以及行为识别层。其中,全局特征提取层可以是基于mobilenetv1轻量级网络构建得到,用于对目标图像帧进行全局特征提取,从而使得得到的全局特征中包含有目标图像帧的全局特征信息。
    59.局部特征提取层可以是基于特征金字塔网络((feature pyramid networks,fpn)构建得到,用于提取目标图像帧的多个不同尺度的局部特征,从而能够关注不同分辨率下的局部特征信息。此外,由于不同尺度的局部特征对识别结果的影响程度是不同的,因此在得到多个不同尺度的局部特征后,可以对局部特征进行加权融合,使得得到的加权局部特征中能够体现各尺度的局部特征对识别结果的影响程度。其中,在对局部特征进行加权融合时,可以采用拍照行为识别模型在训练过程中学习得到的权重对局部特征进行加权融合。
    60.在确定全局特征和加权局部特征后,由融合层对全局特征以及加权局部特征进行融合,得到融合特征,从而使得融合特征中既包含有目标图像帧的全局特征信息,也包含有目标图像帧在不同分辨率下的局部特征信息。
    61.接着,将融合特征输入至行为识别层,由行为识别层基于融合特征中目标图像帧的全局特征信息以及在不同分辨率下的局部特征信息,准确确定识别结果,也即确定指定区域内是否存在拍照设备,若是,则表明指定区域内存在拍照行为;若否,则表明指定区域内不存在拍照行为。
    62.基于上述任一实施例,将融合特征输入至拍照行为识别模型的行为识别层,由行为识别层基于融合特征进行行为识别,得到行为识别层输出的行为识别结果,包括:
    63.将融合特征输入至行为识别层的目标检测层,由目标检测层基于融合特征进行目标检测,得到目标检测层输出的目标检测框;
    64.将目标检测框以及目标图像帧输入至行为识别层的图像裁剪层,由图像裁剪层基于目标检测框对目标图像帧进行裁剪,得到图像裁剪层输出的目标区域图像;
    65.将目标区域图像输入至行为识别层的行为分类层,由行为分类层对目标区域图像进行拍照设备识别,得到行为分类层输出的行为识别结果。
    66.具体地,在确定融合特征后,将融合特征输入至目标检测层,由目标检测层基于融合特征进行目标检测,得到目标检测框;其中,该目标检测框可能是拍照设备的检测框,也可能是非拍照设备的检测框。
    67.若要进一步确定得到的目标检测框是否为拍照设备的检测框,则需要将目标检测框以及目标图像帧输入至图像裁剪层,由图像裁剪层基于目标检测框的坐标信息从目标图像帧中裁剪得到目标区域图像,该目标区域图像即为目标检测层进行目标检测后得到的目标物体的图像,其可能为拍照设备的区域图像,也可能为非拍照设备的图像。
    68.此时,将目标区域图像输入至行为分类层,由行为分类层对目标区域图像进行拍照设备识别,从而能够准确确定目标区域图像中是否包含拍照设备,若是,则表明指定区域内存在拍照行为;若否,则表明指定区域内不存在拍照行为。
    69.需要说明的是,本发明实施例是从目标图像帧中裁剪得到目标区域图像,滤除目标图像帧中其它图像的干扰(如背景图像的干扰),从而行为分类层可以根据目标区域图像准确进行分类识别,确定目标图像中是否存在拍照设备,进而能够进一步提高识别结果的精度。
    70.基于上述任一实施例,局部特征提取层基于如下步骤构建得到:
    71.确定初始特征金字塔网络;
    72.对初始特征金字塔网络的网络宽度进行裁剪,并基于裁剪后的初始特征金字塔网
    络构建局部特征提取层。
    73.具体地,初始特征金字塔网络指原始特征金字塔网络,通过实验发现,在拍照行为识别任务中,初始特征金字塔网络的网络宽度是存在冗余的,因此本发明实施例可以对初始特征金字塔网络的网络宽度进行裁剪,并基于裁剪后的初始特征金字塔网络构建局部特征提取层。其中,在对初始特征金字塔网络的网络宽度进行裁剪时,可以将网络宽度裁剪为初始网络宽度的1/2、1/4等,本发明实施例对此不作具体限定。
    74.由此可见,本发明实施例构建得到的局部特征提取层,不仅能够保证提取局部特征的精度,而且局部特征提取层是基于裁剪后的初始特征金字塔网络构建得到的,进而能够提高网络的运行速度,进而能够进一步提高拍照行为的识别效率。
    75.基于上述任一实施例,全局特征提取层基于mobilenetv1网络构建得到。
    76.具体地,mobilenetv1网络是一种体积较小、计算量较少、适用于移动设备的卷积神经网络。mobilenetv1网络的主要是用深度可分离卷积(depthwise separable convolution)代替普通的卷积,并使用宽度乘数(width multiply)减少参数量,从而能够提高网络的运行速度。
    77.由此可见,本发明实施例基于mobilenetv1网络构建得到全局特征提取层,从而能够减小全局特征提取层的网络运行速度,进而提高拍照行为的识别效率。
    78.基于上述任一实施,目标图像帧为连续视频帧;
    79.将目标图像帧输入至拍照行为识别模型,得到拍照行为识别模型输出的识别结果,包括:
    80.将各视频帧输入至拍照行为识别模型,得到拍照行为识别模型输出的各视频帧对应的初始行为识别结果;
    81.基于各视频帧对应的初始行为识别结果,确定识别结果。
    82.具体地,目标图像帧可以理解为预设时段的连续视频帧,如5分钟内的连续视频帧。由于基于单个视频帧得到的识别结果可能会存在误差,即无法准确判断指定区域内是否存在拍照设备。
    83.因此,本发明实施例将多个连续视频帧分别输入至拍照行为识别模型,可以得到各视频帧对应的初始行为识别结果,然后根据各视频帧对应的初始行为识别结果综合判断,最终确定识别结果。
    84.例如,当具有相同识别结果的视频帧数量在连续视频帧数量总数的占比超过预设比例时,则可以将该相同识别结果作为最终的识别结果,从而能够进一步保证识别结果的精度。
    85.基于上述任一实施例,得到拍照行为识别模型输出的识别结果,之后还包括:
    86.在识别结果为指定区域内存在拍照设备的情况下,进行预警提示。
    87.具体地,在识别结果为指定区域内存在拍照设备的情况下,则表明指定区域存在技术泄露风险的概率较大,此时可以进行预警提示,以使相关人员及时处理,避免技术泄露。可以理解的是,可以以信息提示的方式进行预警提示,也可以以声音提示的方式进行预警提示,本发明实施例对此不作具体限定。
    88.基于上述任一实施例,本发明还提供一种拍照行为识别方法,如图2所示,该方法包括:
    89.将多个连续视频帧(如t视频帧,t 1视频帧,

    ,t n视频帧)输入至fpn网络,由fpn网络分别提取得到各视频帧对应不同尺度的局部特征,并对各尺度局部特征进行加权,得到各视频帧的加权局部特征。其中,fpn网络的网络宽度为初始特征金字塔网络宽度的1/2.
    90.同时,将多个连续视频帧输入至mobilenetv1网络,由mobilenetv1网络分别对各视频帧进行全局特征提取,得到各视频帧的全局特征。
    91.然后,对各视频帧的加权局部特征和全局特征进行融合,得到各视频帧的融合特征,并由目标检测层基于各视频帧的融合特征进行目标检测,得到目标检测框。接着,基于目标检测框中携带的坐标信息从对应视频帧中裁剪得到目标区域图像,然后对各视频帧的目标区域图像进行分类,确定各视频帧的初始行为识别结果,也即各视频帧中是否存在拍照设备。
    92.最后,基于各视频帧的初始行为识别结果,确定最终的识别结果,从而能够避免单个视频帧的初始行为识别结果存在误差,导致影响最终识别结果精度的问题。
    93.下面对本发明提供的拍照行为识别装置进行描述,下文描述的拍照行为识别装置与上文描述的拍照行为识别方法可相互对应参照。
    94.基于上述任一实施例,本发明还提供一种拍照行为识别装置,如图3所示,该装置包括:
    95.确定单元310,用于确定指定区域内待识别的目标图像帧;
    96.识别单元320,用于将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果;所述识别结果用于表征所述指定区域内是否存在拍照设备;
    97.其中,所述拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;所述拍照行为识别模型用于提取所述目标图像帧的全局特征以及多个不同尺度的局部特征后,对所述全局特征以及所述多个不同尺度的局部特征进行融合,得到融合特征,并基于所述融合特征确定所述识别结果。
    98.基于上述任一实施例,所述识别单元320,包括:
    99.全局特征提取单元,用于将所述目标图像帧输入至所述拍照行为识别模型的全局特征提取层,由所述全局特征提取层对所述目标图像帧进行全局特征提取,得到所述全局特征提取层输出的所述全局特征;
    100.局部特征提取单元,用于将所述目标图像帧输入至所述拍照行为识别模型的局部特征提取层,由所述局部特征提取层提取所述目标图像帧的多个不同尺度的局部特征,并对各尺度的局部特征进行加权融合,得到所述局部特征提取层输出的加权局部特征;
    101.特征融合单元,用于将所述全局特征和所述加权局部特征输入至所述拍照行为识别模型的融合层,由所述融合层对所述全局特征和所述加权局部特征进行特征融合,得到所述融合层输出的所述融合特征;
    102.行为识别单元,用于将所述融合特征输入至所述拍照行为识别模型的行为识别层,由所述行为识别层基于所述融合特征进行行为识别,得到所述行为识别层输出的所述行为识别结果。
    103.基于上述任一实施例,所述行为识别单元,包括:
    104.目标检测单元,用于将所述融合特征输入至所述行为识别层的目标检测层,由所述目标检测层基于所述融合特征进行目标检测,得到所述目标检测层输出的目标检测框;
    105.图像裁剪单元,用于将所述目标检测框以及所述目标图像帧输入至所述行为识别层的图像裁剪层,由所述图像裁剪层基于所述目标检测框对所述目标图像帧进行裁剪,得到所述图像裁剪层输出的目标区域图像;
    106.行为分类单元,用于将所述目标区域图像输入至所述行为识别层的行为分类层,由所述行为分类层对所述目标区域图像进行拍照设备识别,得到所述行为分类层输出的所述行为识别结果。
    107.基于上述任一实施例,所述装置还包括:
    108.初始网络确定单元,用于确定初始特征金字塔网络;
    109.网络裁剪单元,用于对所述初始特征金字塔网络的网络宽度进行裁剪,并基于裁剪后的初始特征金字塔网络构建所述局部特征提取层。
    110.基于上述任一实施例,所述全局特征提取层基于mobilenetv1网络构建得到。
    111.基于上述任一实施例,所述目标图像帧为连续视频帧;
    112.所述识别单元320,包括:
    113.初始结果确定单元,用于将各视频帧输入至所述拍照行为识别模型,得到所述拍照行为识别模型输出的各视频帧对应的初始行为识别结果;
    114.识别结果确定单元,用于基于各视频帧对应的初始行为识别结果,确定所述识别结果。
    115.基于上述任一实施例,所述装置还包括:
    116.预警单元,用于在得到所述拍照行为识别模型输出的识别结果之后,在所述识别结果为所述指定区域内存在拍照设备的情况下,进行预警提示。
    117.图4是本发明提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communications interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行拍照行为识别方法,该方法包括:确定指定区域内待识别的目标图像帧;将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果;所述识别结果用于表征所述指定区域内是否存在拍照设备;其中,所述拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;所述拍照行为识别模型用于提取所述目标图像帧的全局特征以及多个不同尺度的局部特征后,对所述全局特征以及所述多个不同尺度的局部特征进行融合,得到融合特征,并基于所述融合特征确定所述识别结果。
    118.此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
    119.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在
    非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的拍照行为识别方法,该方法包括:确定指定区域内待识别的目标图像帧;将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果;所述识别结果用于表征所述指定区域内是否存在拍照设备;其中,所述拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;所述拍照行为识别模型用于提取所述目标图像帧的全局特征以及多个不同尺度的局部特征后,对所述全局特征以及所述多个不同尺度的局部特征进行融合,得到融合特征,并基于所述融合特征确定所述识别结果。
    120.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的拍照行为识别方法,该方法包括:确定指定区域内待识别的目标图像帧;将所述目标图像帧输入至拍照行为识别模型,得到所述拍照行为识别模型输出的识别结果;所述识别结果用于表征所述指定区域内是否存在拍照设备;其中,所述拍照行为识别模型基于样本图像帧以及样本图像帧的样本拍照行为结果训练得到;所述拍照行为识别模型用于提取所述目标图像帧的全局特征以及多个不同尺度的局部特征后,对所述全局特征以及所述多个不同尺度的局部特征进行融合,得到融合特征,并基于所述融合特征确定所述识别结果。
    121.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
    122.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
    123.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
    转载请注明原文地址:https://tc.8miu.com/read-2867.html

    最新回复(0)