处理器操作方法与装置、电子装置与程序产品与流程

    专利查询2025-11-26  1


    本公开的实施例涉及处理器领域,且更具体地涉及处理器操作方法、处理器操作装置、电子装置、计算机程序产品。


    背景技术:

    1、卷积神经网络(convolutional neural network, cnn)是深度学习领域中主要应用于计算机视觉领域的深度学习算法,在图像识别、语音识别、视频识别、自然语言处理等领域都有广泛的应用。

    2、卷积层是cnn的核心部分,卷积层用于对输入的例如图像的数据进行特征提取。卷积的计算范围是在像素点的空间邻域内进行的,因此可以利用输入数据的空间信息。卷积层的主要作用是对输入数据进行特征计算。卷积层由若干个卷积核(convolution kernel)和可能的偏置项组成。卷积核用于在输入数据(如图像)上进行滑动窗口操作,以计算输入数据的特征。在图像处理中,卷积核通常是一个小的矩阵(或称为滤波器、模板),其大小、形状和值决定了要计算的特征类型。不同的卷积核可以用来计算不同的特征。例如,一个卷积核用来计算边缘特征,一个卷积核用来计算亮度特征等等。卷积核通过在其滑动窗口覆盖的输入数据区域上进行元素级的乘法并求和(有时还包括一个偏置项),来生成输出特征图(feature map)上的一个像素值。这个过程会重复进行,直到卷积核遍历了整个输入数据。每次移动卷积核(的滑动窗口)时,它都会与输入数据的一个局部区域进行交互,从而计算出该区域的特定特征。

    3、通过堆叠多个卷积层,cnn能够学习到更加复杂和抽象的特征表示。每个卷积层都会接收到前一层的输出作为输入数据,并应用一组不同的卷积核来计算更高级别的特征。这种层次化的特征计算方式使得cnn在图像识别、目标检测、图像分割等任务中表现出色。

    4、在传统的全连接神经网络中,每个神经元都与前一层中的所有神经元相连接,这导致网络参数的数量随着网络层数的增加而急剧增加。相比之下,在卷积神经网络中,卷积层通过卷积核实现了局部连接(local connectivity),即每个神经元(或称为卷积核)仅与输入数据的局部区域相连接。这种局部连接特性大大减少了网络参数的数量,因为每个卷积核的权值是共享的,并且只与输入数据的一小部分区域相关。卷积核带来的直接好处是减少网络各层之间的连接的数量,同时降低过拟合的风险,为卷积神经网络带来了优势。

    5、边缘填充(edge padding)是图像处理中的一个常见操作,它主要用于在图像的边缘周围添加额外的像素(通常是重复边缘像素的值、设置为固定值如0或255,或者是其他计算得出的值),以便在进行某些图像处理操作时(如卷积等)能够保持图像信息的完整性,防止边缘信息丢失或产生不希望的边缘效应。


    技术实现思路

    1、根据本公开的一个方面,至少一个实施例提供一种处理器操作方法,包括:根据滑动窗口,从全局内存中加载至少张量的第一部分数据块到共享内存中;在进行矩阵乘操作的过程中,根据滑动窗口,针对共享内存中要对张量的第一部分数据块进行边缘填充的数据块的位置提取掩码值来进行矩阵乘操作。

    2、根据本公开的另一个方面,至少一个实施例提供一种处理器操作装置,包括:加载装置,被配置为根据滑动窗口,从全局内存中加载至少张量的第一部分数据块到共享内存中;掩码装置,被配置为在进行矩阵乘操作的过程中,根据滑动窗口,针对共享内存中要对张量的第一部分数据块进行边缘填充的数据块的位置提取掩码值来进行矩阵乘操作。

    3、根据本公开的另一个方面,至少一个实施例提供一种电子装置,包括根据本公开的至少一个实施例的处理器操作装置。

    4、根据本公开的另一个方面,至少一个实施例提供一种处理器操作装置,包括:存储器,用于存储计算机指令;处理单元,用于执行存储器中的计算机指令以实施根据本公开的至少一个实施例的处理器操作方法。

    5、根据本公开的另一个方面,至少一个实施例提供一种计算机程序产品,包括计算机指令,其中,计算机指令在被处理器执行时,使得处理器执行根据本公开的至少一个实施例的处理器操作方法。



    技术特征:

    1.一种处理器操作方法,包括:

    2.根据权利要求1所述的处理器操作方法,还包括:

    3.根据权利要求1或2所述的处理器操作方法,其中,所述掩码值是通过软件可配置的。

    4.根据权利要求2所述的处理器操作方法,其中,所述根据所述滑动窗口,对所述共享内存中要对所述第一部分数据块进行边缘填充的数据块的位置进行掩码以形成所述掩码值,通过软件指令来实现。

    5.根据权利要求2所述的处理器操作方法,其中,所述根据所述滑动窗口,对所述共享内存中要对所述第一部分数据块进行边缘填充的数据块的位置进行掩码以形成所述掩码值,包括:

    6.根据权利要求1所述的处理器操作方法,其中,所述根据滑动窗口,从全局内存中加载至少张量的第一部分数据块到共享内存中包括不对所述张量进行边缘填充。

    7.根据权利要求1所述的处理器操作方法,其中,所述根据滑动窗口,从全局内存中加载至少张量的第一部分数据块到共享内存中包括紧挨着所述共享内存中已存储的数据来加载所述第一部分数据块。

    8.根据权利要求1所述的处理器操作方法,其中,所述共享内存中要对所述第一部分数据块进行边缘填充的数据块的位置处存储的数据是所述张量的第二部分数据块或其他张量的有效数据。

    9.根据权利要求1所述的处理器操作方法,其中,所述根据滑动窗口,从所述全局内存中加载至少所述第一部分数据块到所述共享内存中,包括:

    10.根据权利要求1所述的处理器操作方法,其中,所述张量是输入张量和/或卷积核,或者所述张量是输出张量和/或被旋转的卷积核。

    11.根据权利要求10所述的处理器操作方法,其中,

    12.一种处理器操作装置,包括:

    13.一种处理器操作装置,包括,

    14.一种电子装置,包括根据权利要求12或13所述的处理器操作装置。

    15.一种计算机程序产品,存储计算机指令,


    技术总结
    本发明提供处理器操作方法、处理器操作装置、电子装置、计算机程序产品。方法包括:根据滑动窗口,从全局内存中加载至少张量的第一部分数据块到共享内存中;在进行矩阵乘操作的过程中,根据滑动窗口,针对共享内存中要对张量的第一部分数据块进行边缘填充的数据块的位置提取掩码值来进行矩阵乘操作。

    技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名
    受保护的技术使用者:上海壁仞科技股份有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-32225.html

    最新回复(0)