一种商品特征识别模型的训练方法、装置以及设备与流程

    专利查询2024-01-10  118



    1.本技术涉及图像识别领域,具体涉及一种商品特征识别模型的训练方法、装置以及设备。


    背景技术:

    2.随着人工智能技术(artificial intelligence,ai)的发展,图像识别商业领域的应用已愈加的普遍。图像识别可通过神经网络模型来进行图像中的特定物体,典型的,可识别图像中包含的商品,而该应用则可具体用于无人超市、智慧超市的自动化管理中,例如通过图像识别监督超市现场的商品销售情况、铺货情况,辅助商品的运营管理。
    3.对于用来识别图像中所包含商品的神经网络模型,可通过大量的样本图像训练得到,具体的,可预先准备大量的商品图像,这些商品图像中不仅可包含相应的商品,还可包含货架、墙壁等背景内容,图像由工作人员配置图像中所包含商品的标注信息后,可作为训练集依次输入神经网络模型进行训练,完成训练的模型则可投入实际应用,对输入图像进行商品识别。
    4.而在现有的相关技术的研究过程中,发明人发现,现有训练得到的神经网络模型,其对于相似商品,识别精度不高,很可能识别不出相似商品的区别,而在实际应用中,可能存在同类型的商品还存在着细微的区别,例如同个厂家推出的两款不同口味的方便面。


    技术实现要素:

    5.本技术提供了一种商品特征识别模型的训练方法、装置以及设备,用于结合第二神经网络模型来促使第一神经网络模型提升注意力、提升细微相似商品特征的识别精度的效果,使其对于相似的商品可取得更为精确的识别结果。
    6.第一方面,本技术提供了一种商品特征识别模型的训练方法,方法包括:
    7.获取第一商品图像以及第二商品图像,第二商品图像的商品特征信息以及第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;
    8.将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果;
    9.结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化第一神经网络模型,进行模型的训练,并将完成训练的第一神经网络模型确认为商品特征识别模型,商品特征识别模型用于识别输入的图像中的商品特征信息。
    10.结合本技术第一方面,在本技术第一方面第一种可能的实现方式中,结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数包括:
    11.将第一商品特征识别结果对应的特征向量与第一神经网络模型配置的第一权重值相乘,得到第一特征向量;
    12.将第二商品特征识别结果对应的特征向量与第二神经网络模型配置的第二权重值相乘,得到第二特征向量;
    13.基于第一特征向量与第二特征向量的和,计算损失函数。
    14.结合本技术第一方面第一种可能的实现方式,在本技术第一方面第二种可能的实现方式中,第一权重值的大小与第一神经网络模型的当前训练次数呈正相关,第二权重值的大小与当前训练次数呈负相关。
    15.结合本技术第一方面第二种可能的实现方式,在本技术第一方面第三种可能的实现方式中,第一权重值的大小为:当前训练次数/预设总训练次数;
    16.第二权重值的大小为:1-当前训练次数/预设总训练次数。
    17.结合本技术第一方面,在本技术第一方面第四种可能的实现方式中,将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果之后,方法还包括:
    18.根据损失函数计算结果优化第二神经网络模型,进行模型的训练。
    19.结合本技术第一方面,在本技术第一方面第五种可能的实现方式中,将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果之前,方法还包括:
    20.获取第一初始图像以及第二初始图像;
    21.分别对第一初始图像以及第二初始图像进行任一种图像增强处理,得到第一商品图像以及第二商品图像,其中,图像增强处理包括旋转处理、裁剪处理、平移处理、缩放处理、遮挡处理、翻转处理、颜色变化处理、模糊处理或者噪声添加处理。
    22.结合本技术第一方面,在本技术第一方面第六种可能的实现方式中,将完成训练的模型确认为商品特征识别模型之后,方法还包括:
    23.将待识别图像输入商品特征识别模型,进行商品特征识别,并得到商品特征识别模型输出的第一商品特征信息;
    24.将第一商品特征信息与预设的商品特征信息集合中的不同商品特征信息进行匹配;
    25.将匹配到的第二商品特征信息对应的商品确定为待识别图像的商品识别结果。
    26.第二方面,本技术提供了一种商品特征识别模型的训练装置,装置包括:
    27.获取单元,用于获取第一商品图像以及第二商品图像,第二商品图像的商品特征信息以及第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;
    28.识别单元,用于将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果;
    29.训练单元,用于结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化第一神经网络模型,进行模型的训练,并将完成训练的第一神经网络模型确认为商品特征识别模型,商品特征识别模型用于识别输入的图像中的商品特征信息。
    30.结合本技术第二方面,在本技术第二方面第一种可能的实现方式中,训练单元,具体用于:
    31.将第一商品特征识别结果对应的特征向量与第一神经网络模型配置的第一权重值相乘,得到第一特征向量;
    32.将第二商品特征识别结果对应的特征向量与第二神经网络模型配置的第二权重值相乘,得到第二特征向量;
    33.基于第一特征向量与第二特征向量的和,计算损失函数。
    34.结合本技术第二方面第一种可能的实现方式,在本技术第二方面第二种可能的实现方式中,第一权重值的大小与第一神经网络模型的当前训练次数呈正相关,第二权重值的大小与当前训练次数呈负相关。
    35.结合本技术第二方面第二种可能的实现方式,在本技术第二方面第三种可能的实现方式中,第一权重值的大小为:当前训练次数/预设总训练次数;
    36.第二权重值的大小为:1-当前训练次数/预设总训练次数。
    37.结合本技术第二方面,在本技术第二方面第四种可能的实现方式中,训练单元,还用于:
    38.根据损失函数计算结果优化第二神经网络模型,进行模型的训练。
    39.结合本技术第二方面,在本技术第二方面第五种可能的实现方式中,装置还包括预处理单元,用于:
    40.获取第一初始图像以及第二初始图像;
    41.分别对第一初始图像以及第二初始图像进行任一种图像增强处理,得到第一商品图像以及第二商品图像,其中,图像增强处理包括旋转处理、裁剪处理、平移处理、缩放处理、遮挡处理、翻转处理、颜色变化处理、模糊处理或者噪声添加处理。
    42.结合本技术第二方面,在本技术第二方面第六种可能的实现方式中,装置还包括应用单元,用于:
    43.将待识别图像输入商品特征识别模型,进行商品特征识别,并得到商品特征识别模型输出的第一商品特征信息;
    44.将第一商品特征信息与预设的商品特征信息集合中的不同商品特征信息进行匹配;
    45.将匹配到的第二商品特征信息对应的商品确定为待识别图像的商品识别结果。
    46.第三方面,本技术还提供了一种商品特征识别设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本技术第一方面或者第一方面任一种可能的实现方式提供的方法。
    47.第四方面,本技术还提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本技术第一方面或者第一方面任一种可能的实现方式提供的方法。
    48.从以上内容可得出,本技术具有以下的有益效果:
    49.针对于存在细微相似商品特征的商品进行的商品识别,本技术预先配置第一商品图像以及第二商品图像,两图像的商品特征信息之间具有预设相似关系,即,俩图像为相似商品图像,在每一次的训练过程中,一边将第一商品图像输入第一神经网络模型进行识别,
    另一边将第二商品图像输入第二神经网络模型进行识别,根据两模型输出的商品特征识别结果计算损失函数并根据该损失函数计算结果来优化第一神经网络模型,达到训练第一神经网络模型的目的,在该训练机制下,由于两模型在商品识别处理中所关注的重点区域是存在不同的,并且两模型输入的图像为相似商品的图像,因此在第一神经网络模型所识别得到的商品特征识别结果的基础上,结合第二神经网络模型所识别得到的商品特征识别结果来计算损失函数,可将第二神经网络模型在图像中所关注的重点区域作为参考,引导第一神经网络模型也对这些重点区域进行关注,从而达到提升注意力、提升细微相似商品特征的识别精度的效果,对于相似的商品可取得更为精确的识别结果。
    附图说明
    50.图1为本技术中商品特征识别模型的训练方法的一种场景示意图;
    51.图2为本技术中商品特征识别模型的训练方法的一种流程示意图;
    52.图3为本技术图像预处理的一种流程示意图;
    53.图4为本技术计算损失函数的一种流程示意图;
    54.图5为本技术商品特征识别模型的应用处理的一种流程示意图;
    55.图6为本技术中商品特征识别模型的训练装置的一种结构示意图;
    56.图7为本技术中商品特征识别模型的训练设备的一种结构示意图。
    具体实施方式
    57.首先,在介绍本技术之前,先介绍下本技术关于应用背景的相关内容。
    58.本技术提供的商品特征识别模型的训练方法、装置以及计算机可读存储介质,可应用于商品特征识别模型的训练设备上,用于结合第二神经网络模型来促使第一神经网络模型提升注意力、提升细微相似商品特征的识别精度的效果,使其对于相似的商品可取得更为精确的识别结果。
    59.本技术提及的商品特征识别模型的训练方法,其执行主体可以为商品识别模型的训练装置,或者集成了该装置的服务器设备、物理主机或者用户设备(user equipment,ue)等不同类型的商品特征识别模型的训练设备,其中,装置可以采用硬件或者软件的方式实现,ue具体可以为智能手机、平板电脑、笔记本电脑、掌上电脑、台式电脑或者个人数字助理(personal digital assistant,pda)等终端设备,其中,商品特征识别模型的训练设备具体还可分为多个设备,以设备集群的形式存在。
    60.下面,开始介绍本技术提供的商品特征识别模型的训练方法。
    61.结合图1示出的本技术中商品特征识别模型的训练方法的一种场景示意图,参阅图2示出了本技术中商品特征识别模型的训练方法的一种流程示意图,本技术所提供的商品特征识别模型的训练方法,具体可包括如下步骤:
    62.步骤s201,获取第一商品图像以及第二商品图像,第二商品图像的商品特征信息以及第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;
    63.步骤s202,将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果;
    64.步骤s203,结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化第一神经网络模型,进行模型的训练,并将完成训练的第一神经网络模型确认为商品特征识别模型,商品特征识别模型用于识别输入的图像中的商品特征信息。
    65.结合图1及图2所示实施例内容可看出,针对于存在细微相似商品特征的商品进行的商品识别,本技术预先配置第一商品图像以及第二商品图像,两图像的商品特征信息之间具有预设相似关系,即,俩图像为相似商品图像,在每一次的训练过程中,一边将第一商品图像输入第一神经网络模型进行识别,另一边将第二商品图像输入第二神经网络模型进行识别,根据两模型输出的商品特征识别结果计算损失函数并根据该损失函数计算结果来优化第一神经网络模型,达到训练第一神经网络模型的目的,在该训练机制下,由于两模型在商品识别处理中所关注的重点区域是存在不同的,并且两模型输入的图像为相似商品的图像,因此在第一神经网络模型所识别得到的商品特征识别结果的基础上,结合第二神经网络模型所识别得到的商品特征识别结果来计算损失函数,可将第二神经网络模型在图像中所关注的重点区域作为参考,引导第一神经网络模型也对这些重点区域进行关注,从而达到提升注意力、提升细微相似商品特征的识别精度的效果,对于相似的商品可取得更为精确的识别结果。
    66.下面,则继续介绍图2所示实施例中各步骤及其在实际应用中可能存在的具体实现方式。
    67.在本技术中,所称的商品,为各种超市或者商店中向客户提供的零售服务所涉及的物品,其一般陈列在货架中进行摆放,如此,在对于现场的商品具有销售监督、铺货等需求时,可在现场采集图像,而这些图像中通常包含了众多的商品,并且由于在实际中,相似的商品都是摆放在较为相近的地方的,因此,摄入图像,或者说图像中所包含的商品,则可能为相似商品,这些相似商品可能由于相同的商品性质、相同的厂家或者相同内容等缘故,其商品的外形特征是较为类似的。
    68.例如,俩可乐商品,可能仅存在500ml、300ml、1l不同规格所导致的瓶身大小的区别,而其瓶身存在近似于等比例缩放的情况,由于计算机视觉天然是要求有尺度不变性的特点,这种情况通常是很难进行区分的。
    69.基于现有技术中存在的该情况,本技术则提出了一种新的商品特征识别模型的训练方式,使得模型对于细微相似商品特征具有更高的识别精度,从而对于相似的商品可取得更为精确的识别结果。
    70.在进行模型的训练时,工作人员可配置两组训练集,第一训练集包含多组的第一商品图像,第二训练集也包含多组的第二商品图像,每组的第一商品图像与第二商品图像,为具有相似关系的商品图像,或者说,俩图像中的商品具有预设相似关系的商品特征信息。
    71.可以理解,第一商品图像以及第二商品图像分别标注有图像的商品特征信息。该标注处理通常由工作人员完成,在标注过程中,具体可对图像中的商品的像素进行语义信息的配置,例如为某个图像中商品1的每一个像素点都配置“商品1,商品1总个数为5”的语义信息。
    72.相似商品图像,其相似关系可直接由工作人员进行配置,例如,可配置训练集时,可将第一训练集以及第二训练集中具有相似关系的商品图像直接分组,形成一新的训练
    集,例如将第一训练集[a1,a2,a3

    ax]以及第二训练集[b1,b2,b3

    by]分组为[(a1,b1),(a2,b2),(a3,a4,b2)

    (ax,by)];
    [0073]
    或者,在对商品配置的语义信息中,还可以直接标注与自身图像具有相似关系的商品图像,例如,“商品1,商品1总个数为5,相似商品图像为图像标识z(例如g0ds9hal8jjdh16sa45kt)”。
    [0074]
    当然,相似商品图像之间的相似关系,也可由商品特征识别模型的训练设备自动进行配置,其相似关系的配置形式可以参考上述介绍的工作人员的配置形式。而商品特征识别模型的训练设备对于相似关系的识别,则可在利用现有技术中的商品特征识别模型进行商品识别的过程中,当存在商品识别错误的商品图像并且由工作人员标注了相似商品时,此时商品特征识别模型的训练设备可将这些相似商品对应的商品图像识别为具有相似关系的商品图像,作为本技术所涉及的第一商品图像以及第二商品图像。
    [0075]
    在实际应用中,考虑到商品图像的样本可能存在数量有限的情况,则可通过图像的预处理,或者说通过图像增强处理,来提高商品图像的样本多样性,以在初始商品图像有限的情况下,保证模型的训练效果。
    [0076]
    具体的,可参阅图3示出的本技术图像预处理的一种流程示意图,其可包括:
    [0077]
    步骤s301,获取第一初始图像以及第二初始图像;
    [0078]
    可以理解,第一初始图像以及第二初始图像就是分别为第一商品图像以及第二商品图像在经过图像增强处理之前的初始商品图像。
    [0079]
    步骤s302,分别对第一初始图像以及第二初始图像进行任一种图像增强处理,得到第一商品图像以及第二商品图像,其中,图像增强处理包括旋转处理、裁剪处理、平移处理、缩放处理、遮挡处理、翻转处理、颜色变化处理、模糊处理或者噪声添加处理。
    [0080]
    可以理解,可以从旋转处理、裁剪处理、平移处理、缩放处理、遮挡处理、翻转处理、颜色变化处理、模糊处理以及噪声添加处理等图像增强处理方式中,按照随机等挑选方式,挑选一种或者多种处理方式,对第一初始图像以及第二初始图像进行处理,进一步的,对于同一种图像增强处理方式,还可按照随机等挑选方式,挑选相应的增强幅度。
    [0081]
    本技术在训练第一神经网络模型时,其训练分为了多次的训练过程,在每一次的训练过程中,分别向第一神经网络模型以及第二神经网络模型输入一组相似商品图像(俩商品图像具有相似关系的商品特征信息),进行正向传播。
    [0082]
    由于两神经网络模型是天然不同的,对于具有相似商品特征信息的商品图像,其关注点也不尽相同的,在细微的商品特征信息上,存在着不同的关注度。该关注度可以理解为模型中特征图(feature map)对于不同预设特征的权重大小,受到越高关注度的预设特征,具有越高的权重值,当商品图像输入模型后转化得到的特征向量与特征图相乘(与特征图中对于每个预设特征配置的权重值进行相乘)时,通过特征图(不同权重值)的层层筛选,保留下商品图像中更为价值的商品特征信息,最后得到输入图像的商品特征识别结果。
    [0083]
    当两神经网络模型输出各自输出输入图像的商品特征识别结果后,则可结合两输入图像原本标注的图像的商品特征信息,计算损失函数,再根据损失函数计算结果进行反向传播,调整第一神经网络模型的参数(特征图所涉及的不同权重值),达到优化第一神经网络模型的商品特征识别精度的目的,完成次数为1的模型训练。
    [0084]
    在这过程中,由于两模型在商品识别处理中所关注的重点区域是存在不同的,并
    且两模型输入的图像为相似商品图像,因此在第一神经网络模型所识别得到的商品特征识别结果的基础上,结合第二神经网络模型所识别得到的商品特征识别结果来计算损失函数,可将第二神经网络模型在图像中所关注的重点区域作为参考,引导第一神经网络模型也对这些重点区域进行关注,从而达到提升注意力、提升细微相似商品特征的识别精度的效果,对于相似的商品可取得更为精确的识别结果。
    [0085]
    以此类推,当经过多次的模型训练后,若达到训练次数、训练时间、识别精度等训练要求后,则可完成训练,将当前的第一神经网络模型确认为可投入实际使用的商品特征识别模型。
    [0086]
    其中,示例性的,损失函数可采用交叉熵损失函数(cross entropy loss)、三元组(triplet loss)损失函数、中心(center loss)损失函数以及焦点损失函数(focal loss)等不同类型的损失函数,当同时采用多种损失函数时,可为每种损失函数配置相应的权重,将每种损失函数计算得到的损失函数计算结果与其对应的权重进行相乘,再将多个相乘计算结果相加,得到最终的损失函数计算结果,并根据该最终的损失函数计算结果进行模型的训练。
    [0087]
    在结合第一神经网络模型所识别得到的商品特征识别结果以及第二神经网络模型所识别得到的商品特征识别结果,来计算损失函数时,可直接将两者进行相加,再基于两者的和计算损失函数。
    [0088]
    可以理解的是,神经网络模型所以识别得到的商品特征识别结果,是以特征向量(特征矢量)的形式存在的。
    [0089]
    进一步的,在实际应用中,在计算损失函数进行模型的优化时,还可为第一神经网络模型以及第二神经网络模型配置对应的影响因子,具体的,如图4示出的本技术计算损失函数的一种流程示意图,损失函数的计算处理,可包括:
    [0090]
    步骤s401,将第一商品特征识别结果对应的特征向量与第一神经网络模型配置的第一权重值相乘,得到第一特征向量;
    [0091]
    具体的,影响因子,可通过权重值的形式来体现对于损失函数计算处理的影响程度,在实际应用中,可为第一神经网络模型以及第二神经网络模型配置各自对应的权重值,例如0.65以及0.35,权重值的大小具体可随实际需要调整,通常可由工作人员预先配置。
    [0092]
    当得到第一神经网络模型识别得到的第一商品特征识别结果后,则可将其对应的特征向量与第一神经网络模型配置的第一权重值进行相乘,得到第一特征向量。
    [0093]
    步骤s402,将第二商品特征识别结果对应的特征向量与第二神经网络模型配置的第二权重值相乘,得到第二特征向量;
    [0094]
    类似的,当得到第二神经网络模型识别得到的第二商品特征识别结果婚后,则可将其对应的特征向量与第二神经网络模型配置的第二权重进行相乘,得到第二特征向量。
    [0095]
    步骤s403,基于第一特征向量与第二特征向量的和,计算损失函数。
    [0096]
    如此,当得到通过权重值调整对于损失函数计算处理的影响程度的第一特征向量以及第二特征向量后,则可基于两者的和,进行损失函数计算处理,计算损失函数,以便灵活调整第二神经网络模型对输入商品图像所关注的重点区域,对于第一神经网络模型的影响,即,通过第二神经网络模型来优化第一神经网络模型对于输入商品图像的注意力。
    [0097]
    可以理解,在本技术中,在每一次的训练过程中,第二神经网络模型都在一定程度
    上改善了第一神经网络模型对于输入商品图像的注意力,而在本技术中,还可认为,每一次的训练所带来的注意力改善效果,应当呈现为逐渐收敛的特点的,以便从最初的大幅度注意力改善效果慢慢地转变至轻微幅度的注意力改善效果,如此方可完成该注意力改善机制的改善效果。
    [0098]
    而在实际应用中,还可进一步的通过调整,加快该收敛效率。例如,上述提及的权重值,在实际应用中除了可以为预先配置的固定值,还可以为可灵活调整大小的变化值,以灵活调整第二神经网络模型对于第一神经网络模型的注意力改善效果。
    [0099]
    示例性的,一方面第一神经网络模型配置的第一权重值的大小具体可与第一神经网络模型的当前训练次数呈正相关,另一方面第二神经网络模型配置的第二权重值的大小则可与当前训练次数呈负相关,使得第二神经网络模型对于第一神经网络模型的注意里改善效果随着第一神经网络模型的训练次数的提高,而逐渐减弱,如此在训练过程中加强第一神经网络模型自身在识别细微商品特征的影响程度。
    [0100]
    进一步的,第一神经网络模型完成模型训练的训练要求可包括一预设总训练次数,训练次数需满足该预设总训练次数,才可完成模型训练,或者其他模型训练要求满足也都满足时,才可完成模型训练。
    [0101]
    在情况下,第一权重值的大小可以配置为:当前训练次数/预设总训练次数,以逐步调整的方式,实现与第一神经网络模型的当前训练次数呈正相关;对应的,第二权重值的大小可以配置为:1-当前训练次数/预设总训练次数,以逐步调整的方式,实现与第一神经网络模型的当前训练次数呈负相关。
    [0102]
    在又一种示例性的实现方式中,可以理解,在得到损失函数计算结后,除了可用于训练第一神经网络模型,还可以用于训练第二神经网络模型,换句话说,第二神经网络模型,除了可以为现有技术中已经投入实际使用的商品特征识别模型,或者为本技术为训练第一神经网络模型所配置的已完成训练的商品特征识别模型,第二神经网络模型还可以为待训练的神经网络模型。
    [0103]
    当然,该第二神经网络模型可以为初始化状态的神经网络模型,或者也可以为其他状态的神经网络模型,例如投入实际使用状态、已完成训练状态。
    [0104]
    类似的,在本技术中,第一神经网络模型也可以为初始化状态、投入实际使用状态或者已完成训练状态等状态的神经网络模型,并通过触发本技术提供的商品特征识别模型的训练方法,继续结合第二神经网络模型进行模型训练,提高对细微商品特征的识别精度(注意力)。
    [0105]
    在本技术中,第一神经网络模型,以及第二神经网络模型,其模型类型,具体可以采用如yolov3模型、resnet模型、r-cnn模型、fast r-cnn模型、faster r-cnn模型、mask r-cnn模型或者ssd模型等不同类型的模型。
    [0106]
    第一神经网络模型在完成模型后,则可作为商品特征识别模型投入实际使用,根据模型识别得到的商品特征,确定对应的商品。
    [0107]
    商品特征识别模型的应用处理,如图5示出的本技术商品特征识别模型的应用处理的一种流程示意图,可包括:
    [0108]
    步骤s501,将待识别图像输入商品特征识别模型,进行商品特征识别,并得到商品特征识别模型输出的第一商品特征信息;
    [0109]
    可以理解,当存在具有商品识别需求的商品图像时,则可将其作为待识别图像输入商品特征识别模型,进行商品特征的识别。
    [0110]
    步骤s502,将第一商品特征信息与预设的商品特征信息集合中的不同商品特征信息进行匹配;
    [0111]
    可以理解,可以预先根据是商品库里的商品,抽取或者建立一一对应的商品特征信息,汇总形成商品特征信息集合,用于商品特征的记录以及后续的商品匹配。
    [0112]
    步骤s503,将匹配到的第二商品特征信息对应的商品确定为待识别图像的商品识别结果。
    [0113]
    在通过商品特征识别模型得到待识别图像包含的商品特征后,即可将其与商品特征信息集合中的不同商品特征信息进行匹配,由此可匹配到相对应的商品特征信息,该商品特征信息所对应的商品即为待识别图像所识别得到的商品识别结果。
    [0114]
    为便于更好的实施本技术提供的商品特征识别模型的训练方法,本技术还提供了商品特征识别模型的训练装置。
    [0115]
    参阅图6,图6为本技术商品特征识别模型的训练装置的一种结构示意图,在本技术中,商品特征识别模型的训练装置600具体可包括如下结构:
    [0116]
    获取单元601,用于获取第一商品图像以及第二商品图像,第二商品图像的商品特征信息以及第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;
    [0117]
    识别单元602,用于将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果;
    [0118]
    训练单元603,用于结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化第一神经网络模型,进行模型的训练,并将完成训练的第一神经网络模型确认为商品特征识别模型,商品特征识别模型用于识别输入的图像中的商品特征信息。
    [0119]
    在一种示例性的实现方式中,训练单元603,具体用于:
    [0120]
    将第一商品特征识别结果对应的特征向量与第一神经网络模型配置的第一权重值相乘,得到第一特征向量;
    [0121]
    将第二商品特征识别结果对应的特征向量与第二神经网络模型配置的第二权重值相乘,得到第二特征向量;
    [0122]
    基于第一特征向量与第二特征向量的和,计算损失函数。
    [0123]
    在又一种示例性的实现方式中,第一权重值的大小与第一神经网络模型的当前训练次数呈正相关,第二权重值的大小与当前训练次数呈负相关。
    [0124]
    在又一种示例性的实现方式中,第一权重值的大小为:当前训练次数/预设总训练次数;
    [0125]
    第二权重值的大小为:1-当前训练次数/预设总训练次数。
    [0126]
    在又一种示例性的实现方式中,训练单元603,还用于:
    [0127]
    根据损失函数计算结果优化第二神经网络模型,进行模型的训练。
    [0128]
    在又一种示例性的实现方式中,装置还包括预处理单元604,用于:
    [0129]
    获取第一初始图像以及第二初始图像;
    [0130]
    分别对第一初始图像以及第二初始图像进行任一种图像增强处理,得到第一商品图像以及第二商品图像,其中,图像增强处理包括旋转处理、裁剪处理、平移处理、缩放处理、遮挡处理、翻转处理、颜色变化处理、模糊处理或者噪声添加处理。
    [0131]
    在又一种示例性的实现方式中,装置还包括应用单元605,用于:
    [0132]
    将待识别图像输入商品特征识别模型,进行商品特征识别,并得到商品特征识别模型输出的第一商品特征信息;
    [0133]
    将第一商品特征信息与预设的商品特征信息集合中的不同商品特征信息进行匹配;
    [0134]
    将匹配到的第二商品特征信息对应的商品确定为待识别图像的商品识别结果。
    [0135]
    本技术还提供了商品特征识别模型的训练设备,参阅图7,图7示出了本技术商品特征识别模型的训练设备的一种结构示意图,具体的,本技术商品特征识别模型的训练设备包括处理器701、存储器702以及输入输出设备703,处理器701用于执行存储器702中存储的计算机程序时实现如图1至图5对应任意实施例中商品特征识别模型的训练方法的各步骤;或者,处理器701用于执行存储器702中存储的计算机程序时实现如图6对应实施例中各单元的功能,存储器702用于存储处理器701执行上述图1至图5对应任意实施例中商品特征识别模型的训练方法所需的计算机程序。
    [0136]
    示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器702中,并由处理器701执行,以完成本技术。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
    [0137]
    商品特征识别模型的训练设备可包括,但不仅限于处理器701、存储器702、输入输出设备703。本领域技术人员可以理解,示意仅仅是商品特征识别模型的训练设备的示例,并不构成对商品特征识别模型的训练设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如商品特征识别模型的训练设备还可以包括网络接入设备、总线等,处理器901、存储器702、输入输出设备703以及网络接入设备等通过总线相连。
    [0138]
    处理器701可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是商品特征识别模型的训练设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
    [0139]
    存储器702可用于存储计算机程序和/或模块,处理器701通过运行或执行存储在存储器702内的计算机程序和/或模块,以及调用存储在存储器702内的数据,实现计算机装置的各种功能。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据商品特征识别模型的训练设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全
    数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
    [0140]
    处理器701用于执行存储器702中存储的计算机程序时,具体可实现以下功能:
    [0141]
    获取第一商品图像以及第二商品图像,第二商品图像的商品特征信息以及第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;
    [0142]
    将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果;
    [0143]
    结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化第一神经网络模型,进行模型的训练,并将完成训练的第一神经网络模型确认为商品特征识别模型,商品特征识别模型用于识别输入的图像中的商品特征信息。
    [0144]
    所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的商品特征识别模型的训练装置、设备及其相应单元的具体工作过程,可以参考如图1至图5对应任意实施例中商品特征识别模型的训练方法的说明,具体在此不再赘述。
    [0145]
    本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
    [0146]
    为此,本技术提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术如图1至图5对应任意实施例中商品特征识别模型的训练方法中的步骤,具体操作可参考如图1至图5对应任意实施例中商品特征识别模型的训练方法的说明,在此不再赘述。
    [0147]
    其中,该计算机可读存储介质可以包括:只读存储器(read only memory,rom)、随机存取记忆体(random access memory,ram)、磁盘或光盘等。
    [0148]
    由于该计算机可读存储介质中所存储的指令,可以执行本技术如图1至图5对应任意实施例中商品特征识别模型的训练方法中的步骤,因此,可以实现本技术如图1至图5对应任意实施例中商品特征识别模型的训练方法所能实现的有益效果,详见前面的说明,在此不再赘述。
    [0149]
    以上对本技术提供的商品特征识别模型的训练方法、装置、设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。

    技术特征:
    1.一种商品特征识别模型的训练方法,其特征在于,所述方法包括:获取第一商品图像以及第二商品图像,所述第二商品图像的商品特征信息以及所述第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;将所述第一商品图像输入第一神经网络模型,得到所述第一神经网络模型输出的第一商品特征识别结果,以及将所述第二商品图像输入第二神经网络模型,得到所述第二神经网络模型输出的第二商品特征识别结果;结合所述第一商品特征识别结果以及所述第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化所述第一神经网络模型,进行模型的训练,并将完成训练的所述第一神经网络模型确认为商品特征识别模型,所述商品特征识别模型用于识别输入的图像中的商品特征信息。2.根据权利要求1所述的方法,其特征在于,所述结合所述第一商品特征识别结果以及所述第二商品特征识别结果计算损失函数包括:将所述第一商品特征识别结果对应的特征向量与所述第一神经网络模型配置的第一权重值相乘,得到第一特征向量;将所述第二商品特征识别结果对应的特征向量与所述第二神经网络模型配置的第二权重值相乘,得到第二特征向量;基于所述第一特征向量与所述第二特征向量的和,计算损失函数。3.根据权利要求2所述的方法,其特征在于,所述第一权重值的大小与所述第一神经网络模型的当前训练次数呈正相关,所述第二权重值的大小与所述当前训练次数呈负相关。4.根据权利要求3所述的方法,其特征在于,所述第一权重值的大小为:所述当前训练次数/预设总训练次数;所述第二权重值的大小为:1-所述当前训练次数/所述预设总训练次数。5.根据权利要求1所述的方法,其特征在于,所述将所述第一商品图像输入第一神经网络模型,得到所述第一神经网络模型输出的第一商品特征识别结果,以及将所述第二商品图像输入第二神经网络模型,得到所述第二神经网络模型输出的第二商品特征识别结果之后,所述方法还包括:根据所述损失函数计算结果优化所述第二神经网络模型,进行模型的训练。6.根据权利要求1所述的方法,其特征在于,所述将所述第一商品图像输入第一神经网络模型,得到所述第一神经网络模型输出的第一商品特征识别结果,以及将所述第二商品图像输入第二神经网络模型,得到所述第二神经网络模型输出的第二商品特征识别结果之前,所述方法还包括:获取第一初始图像以及第二初始图像;分别对所述第一初始图像以及所述第二初始图像进行任一种图像增强处理,得到所述第一商品图像以及所述第二商品图像,其中,所述图像增强处理包括旋转处理、裁剪处理、平移处理、缩放处理、遮挡处理、翻转处理、颜色变化处理、模糊处理或者噪声添加处理。7.根据权利要求1所述的方法,其特征在于,所述将完成训练的模型确认为商品特征识别模型之后,所述方法还包括:将待识别图像输入所述商品特征识别模型,进行商品特征识别,并得到所述商品特征识别模型输出的第一商品特征信息;
    将所述第一商品特征信息与预设的商品特征信息集合中的不同商品特征信息进行匹配;将匹配到的第二商品特征信息对应的商品确定为所述待识别图像的商品识别结果。8.一种商品特征识别模型的训练装置,其特征在于,所述装置包括:获取单元,用于获取第一商品图像以及第二商品图像,所述第二商品图像的商品特征信息以及所述第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;识别单元,用于将所述第一商品图像输入第一神经网络模型,得到所述第一神经网络模型输出的第一商品特征识别结果,以及将所述第二商品图像输入第二神经网络模型,得到所述第二神经网络模型输出的第二商品特征识别结果;训练单元,用于结合所述第一商品特征识别结果以及所述第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化所述第一神经网络模型,进行模型的训练,并将完成训练的所述第一神经网络模型确认为商品特征识别模型,所述商品特征识别模型用于识别输入的图像中的商品特征信息。9.一种商品特征识别模型的训练设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。

    技术总结
    本申请提供了一种商品特征识别模型的训练方法、装置以及设备,用于结合第二神经网络模型来促使第一神经网络模型对于相似的商品可取得更为精确的识别结果。方法包括:获取第一商品图像以及第二商品图像,第二商品图像的商品特征信息以及第一商品图像的商品特征信息两者为具有预设相似关系的商品特征信息;将第一商品图像输入第一神经网络模型,得到第一神经网络模型输出的第一商品特征识别结果,以及将第二商品图像输入第二神经网络模型,得到第二神经网络模型输出的第二商品特征识别结果;结合第一商品特征识别结果以及第二商品特征识别结果计算损失函数,并根据损失函数计算结果优化第一神经网络模型,进行模型的训练。进行模型的训练。进行模型的训练。


    技术研发人员:相鹏
    受保护的技术使用者:顺丰科技有限公司
    技术研发日:2020.11.23
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-20693.html

    最新回复(0)