一种基于面包图像的智能识别方法、系统、设备及介质与流程

    专利查询2025-10-09  17


    本发明属于人工智能,具体涉及一种基于面包图像的智能识别方法、系统、设备及介质。


    背景技术:

    1、面包智能识别技术主要依赖于ai图像识别、机器学习和深度学习等先进技术。这些技术能够通过摄像头捕捉面包的形状、颜色和大小等特征,并迅速准确地识别出面包的种类和价格,这种技术广泛应用于零售业,特别是在24小时无人智慧面包坊中。顾客只需将选好的面包放在指定区域,系统便会在几秒钟内自动识别并显示价格,从而实现自助结账。

    2、尽管深度学习在图像识别领域取得了显著的成果,但在实际应用中,技术的可靠性和稳定性仍然是一个挑战;传统的图像采集方式存在反馈不及时的问题,这可能导致生产者无法及时调整图像采集环境与条件,从而影响最终的识别效果;在实际应用中,光线、角度、遮挡等外部因素对图像识别的准确性有较大影响。这些因素可能会导致识别结果的误差;面包的识别和分类需要大量的数据集进行模型的训练和优化,而且需要针对不同类型的面包进行细致的标注和分类,这对于数据集的获取和模型训练提出了一定挑战。


    技术实现思路

    1、为解决现有技术中存在的上述问题,本发明提供了一种面包图像智能识别方法、系统、设备及介质,

    2、本发明的目的可以通过以下技术方案实现:

    3、s1:通过门店摄像头获取面包图像数据,预设图像质量评估指标和图像有效性验证规则,根据所述图像质量评估指标将满足所述图像有效性验证规则对应的所述面包影像数据进行异常图像识别处理和噪声干扰处理得到预处理图像数据;对所述预处理图像数据进行识别范围标定并统一数据格式;

    4、s2:根据数据标准图库预设初始训练集,将卷积神经网络作为面包图像的特征值提取模型,通过所述初始训练集对所述特征值提取模型进行预训练得到预训练模型,并将所述预训练模型进行压缩优化后部署至边缘运算设备;

    5、s3:在所述边缘运算设备内构建目标识别模型,所述目标识别模型通过所述预训练模型提取所述预处理图像数据的特征图,通过路径增强结构保留所述特征图的空间信息并增强所述特征图的空间定位能力,通过池化模块对所述特征图进行多尺度池化并将所述特征图进行拼接融合得到所述预处理图像数据的多尺度特征图;根据所述多尺度特征图对面包检测目标进行分类和位置回归得到输出向量;

    6、s4:通过门店每日实时获取的面包图像数据构建目标训练集,预设目标损失函数,通过所述目标训练集训练所述目标识别模型,根据所述目标识别模型输出的输出向量和所述损失函数计算当前训练数据的损失值,通过反向传播算法计算所述目标识别模型的模型参数的损失梯度,根据所述损失梯度使用随机梯度下降法更新所述模型参数;

    7、s5:通过门店自动结算平台的面包检测系统获取结算商品图片,通过所述目标识别模型对所述结算商品图片进行目标识别得到面包辨识种类和数量并反馈至所述门店自动结算平台。

    8、具体地,所述图像质量评估指标包括自然图像评价指标、视觉信息保真度、感知度评价指标;所述自然图像评价指标为标准图像与处理图像的像素级差异,所述视觉信息保真度为人眼对图像的感知受到亮度、对比度、颜色、结构影响的图像失真评价指数,所述感知度评价指标为处理图像的亮度、对比度和结构信息。

    9、具体地,所述图像有效性验证规则为所述图像质量评估指标的合格判定阈值。

    10、具体地,所述压缩优化方法为:将所述预训练模型的卷积层和全连接层进行结构化剪枝,并将浮点数参数转换为8位整数。

    11、具体地,所述路径增强结构为一次对三组特征向量进行聚合处理,并将维度最低的特征向量通过一维卷积层调整通道数为中间维度的特征向量的通道数,再通过上采样的方式将维度最低的特征向量的维度转换为中间维度的特征向量的维度,计算公式为:

    12、

    13、其中,y2为融合后的特征向量,upsample为上采样操作,采用最临近插值法,y1为最低维特征向量,y2为中间层特征向量,为拼接操作。

    14、具体地,所述多尺度特征通过多层感知器对特征图的每个通道进行加权处理,并通过激活函数计算得到权重系数,将所述权重系数与原始特征图相乘得到通道特征图,对所述通道特征图进行最大池化和平均池化,拼接融合后进行卷积处理后得到空间注意力特征图,将所述空间注意力特征图与所述通道特征图相乘得到所述多尺度特征图,计算公式为:f′=f×σ(mlp(avgpool(f))+mlp(maxpool(f)))×σ(fn×n(fc(avgpool(f)),mlp(maxpool(f)))),

    15、其中,f′为多尺度特征图,f为原始特征图,avgpool(f)为平均池化操作,maxpool(f)为最大池化操作,fn×n为使用n×n卷积核进行滤波,fc为组合,σ为激活函数,mlp为多层感知器。

    16、具体地,所述目标损失函数包括置信度损失、分类损失和位置损失,所述置信度损失和所述分类损失通过二元交叉熵函数计算,计算公式为:

    17、

    18、其中,lobj为置信度损失,lcls为分类损失,s表示单元格数量;b表示各个单元格中含有候选框的数量,表示第i个单元格中第j个预测框中出现正样本时值为1,否则为0;iij表示第i个单元格中第j个预测框中没有出现正样本时值为1,否则为0;ci表示在第i个单元格内的真实目标置信度,表示在第i个单元格内的预测目标置信度;λ为权重系数,classes为训练目标的类别数,pi(c)表示该类别真实框的概率值,为该类别预测框的概率值;

    19、所述位置损失为通过预测框与真实框之间的重叠程度计算,计算公式为:

    20、

    21、其中,lcoord为位置损失,iou为预测边界框与实际边界框的交并比,b为预测边界框的中心,bgt为实际边界框的中心,c为覆盖预测边界框与实际边界框的最小矩形的对角线长度,a为权重函数,v为度量宽高比的一致性参数。

    22、一种基于面包图像的智能识别系统,包括:预处理模块、预训练模块、目标识别模块、模型训练模块、应用模块;

    23、所述预处理模块用于通过门店摄像头获取面包图像数据,预设图像质量评估指标和图像有效性验证规则,根据所述图像质量评估指标将满足所述图像有效性验证规则对应的所述面包影像数据进行异常图像识别处理和噪声干扰处理得到预处理图像数据;对所述预处理图像数据进行识别范围标定并统一数据格式;

    24、所述预训练模块用于根据数据标准图库预设初始训练集,将卷积神经网络作为面包图像的特征值提取模型,通过所述初始训练集对所述特征值提取模型进行预训练得到预训练模型,并将所述预训练模型进行压缩优化后部署至边缘运算设备;

    25、所述目标识别模块用于在所述边缘运算设备内构建目标识别模型,所述目标识别模型通过所述预训练模型提取所述预处理图像数据的特征图,通过路径增强结构保留所述特征图的空间信息并增强所述特征图的空间定位能力,通过池化模块对所述特征图进行多尺度池化并将所述特征图进行拼接融合得到所述预处理图像数据的多尺度特征图;根据所述多尺度特征图对面包检测目标进行分类和位置回归得到输出向量;

    26、所述模型训练模块用于通过门店每日实时获取的面包图像数据构建目标训练集,预设目标损失函数,通过所述目标训练集训练所述目标识别模型,根据所述目标识别模型输出的输出向量和所述损失函数计算当前训练数据的损失值,通过反向传播算法计算所述目标识别模型的模型参数的损失梯度,根据所述损失梯度使用随机梯度下降法更新所述模型参数;

    27、所述应用模块用于通过门店自动结算平台的面包检测系统获取结算商品图片,通过所述目标识别模型对所述结算商品图片进行目标识别得到面包辨识种类和数量并反馈至所述门店自动结算平台。

    28、本发明的有益效果为:

    29、通过图像质量评估指标和图像有效性验证规则对实时数据源图像进行异常图像识别处理和噪声干扰处理,检测图像中是否存在像素损坏、模糊、失真等问题,对图像的内容、尺寸、格式等进行验证,排除不规范或异常的图像数据,识别和过滤掉不符合规范的图像数据,减少因为噪声数据带来的影响,提升数据质量,增强后续处理和分析的可靠性;通过根据数据标准图库预训练特征提取模型,并部署至边缘运算设备,避免在边缘设备上进行复杂的模型训练,提高边缘设备的计算效率,可以在本地对数据进行处理和分析,减少对云端的数据传输需求,有助于减少网络传输量和降低延迟,尤其适用于对实时性要求较高的门店结算平台的应用场景;通过路径增强结构保留特征图的空间信息并增强所述特征图的空间定位能力,有助于保留原始特征图的空间信息,通过更精确的路径增强操作,可以提高特征图的空间分辨率,使得特征图更加细致,有助于准确表征图像中的空间结构和模式,改善模型对图像的视觉表征能力,使得模型对图像中的关键信息有更好的捕获和传递,有助于提高模型的性能和泛化能力。


    技术特征:

    1.一种基于面包图像的智能识别方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,所述图像质量评估指标包括自然图像评价指标、视觉信息保真度、感知度评价指标;所述自然图像评价指标为标准图像与处理图像的像素级差异,所述视觉信息保真度为人眼对图像的感知受到亮度、对比度、颜色、结构影响的图像失真评价指数,所述感知度评价指标为处理图像的亮度、对比度和结构信息。

    3.根据权利要求1所述的方法,其特征在于,所述图像有效性验证规则为所述图像质量评估指标的合格判定阈值。

    4.根据权利要求1所述的方法,其特征在于,所述压缩优化方法为:将所述预训练模型的卷积层和全连接层进行结构化剪枝,并将浮点数参数转换为8位整数。

    5.根据权利要求1所述的方法,其特征在于,所述路径增强结构为一次对三组特征向量进行聚合处理,并将维度最低的特征向量通过一维卷积层调整通道数为中间维度的特征向量的通道数,再通过上采样的方式将维度最低的特征向量的维度转换为中间维度的特征向量的维度,计算公式为:

    6.根据权利要求1所述的方法,其特征在于,所述多尺度特征通过多层感知器对特征图的每个通道进行加权处理,并通过激活函数计算得到权重系数,将所述权重系数与原始特征图相乘得到通道特征图,对所述通道特征图进行最大池化和平均池化,拼接融合后进行卷积处理后得到空间注意力特征图,将所述空间注意力特征图与所述通道特征图相乘得到所述多尺度特征图,计算公式为:

    7.根据权利要求1所述的方法,其特征在于,所述目标损失函数包括置信度损失、分类损失和位置损失,所述置信度损失和所述分类损失通过二元交叉熵函数计算,计算公式为:

    8.一种基于面包图像的智能识别系统,用于执行如权利要求1-7所述的方法,其特征在于,包括:预处理模块、预训练模块、目标识别模块、模型训练模块、应用模块;

    9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的面包图像智能识别方法。

    10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的面包图像智能识别方法。


    技术总结
    本发明涉及一种基于面包图像的智能识别方法、系统、设备及介质,属于人工智能技术领域。其中,该方法包括:获取面包图像数据,对面包影像数据进行异常图像识别处理和噪声干扰处理得到预处理图像数据;通过初始训练集对特征值提取模型进行预训练得到预训练模型,进行压缩优化后部署至边缘运算设备;构建目标识别模型,对面包检测目标进行分类和位置回归得到输出向量;构建目标训练集,使用随机梯度下降法更新模型参数;获取结算商品图片,通过目标识别模型对结算商品图片进行目标识别得到面包辨识种类和数量并反馈至门店自动结算平台。减少对云端的数据传输需求,减少网络传输量和降低延迟,提高了智能识别模型的性能和泛化能力。

    技术研发人员:曹嘉修,司洋,孙建英,宋桂棉,董晓娟,张建杰
    受保护的技术使用者:上海迪维欧电子设备有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-31389.html

    最新回复(0)