本公开总体上涉及硬件分配,并且更具体地,涉及映射工作负载的方法、系统、制品和装置。
背景技术:
1、近年来,诸如机器学习、深度学习等人工智能技术在解决问题和/或执行任务等方面变得越来越普遍,这些方面包括但不限于图像识别、图案识别(pattern recognition)、自动车辆导航、蛋白质折叠分析。这样的技术采用不同类型的硬件资源来完成各种任务。
技术实现思路
1、根据本公开的实施例,提供了一种用于为神经网络生成资源映射的装置,所述装置包括:约束定义器,所述约束定义器用于定义所述神经网络的性能特性目标;动作确定器,所述动作确定器用于将第一资源配置应用于与所述神经网络相对应的候选资源;回报确定器,所述回报确定器用于基于(a)资源性能度量和(b)所述性能特性目标来计算结果度量;以及层映射生成器,所述层映射生成器用于生成资源映射文件,所述资源映射文件包括针对所述神经网络的对应层的相应资源分配,所述资源分配是基于所述结果度量来选择的。
2、根据本公开的实施例,提供了一种非暂态计算机可读存储介质,包括计算机可读指令,指令在被执行时,使一个或多个处理器至少执行以下操作:定义神经网络的性能特性目标;将第一资源配置应用于与所述神经网络相对应的候选资源;基于(a)资源性能度量和(b)所述性能特性目标来计算结果度量;以及生成资源映射文件,所述资源映射文件包括针对所述神经网络的对应层的相应资源分配,所述资源分配是基于所述结果度量来选择的。
3、根据本公开的实施例,提供了一种用于为神经网络生成资源映射的方法,所述方法包括:通过使用至少一个处理器执行指令,定义所述神经网络的性能特性目标;通过使用至少一个处理器执行指令,将第一资源配置应用于与所述神经网络相对应的候选资源;通过使用至少一个处理器执行指令,基于(a)资源性能度量和(b)所述性能特性目标来计算结果度量;以及通过使用至少一个处理器执行指令,生成资源映射文件,所述资源映射文件包括针对所述神经网络的对应层的相应资源分配,所述资源分配是基于所述结果度量来选择的。
4、根据本公开的实施例,提供了一种用于为神经网络生成资源映射的系统,所述系统包括:性能特性定义装置,用于定义所述神经网络的目标;动作应用装置,用于将第一资源配置应用于与所述神经网络相对应的候选资源;结果计算装置,用于基于(a)资源性能度量和(b)所述性能特性目标来计算结果度量;以及映射生成装置,用于生成资源映射文件,所述资源映射文件包括针对所述神经网络的对应层的相应资源分配,所述资源分配是基于所述结果度量来选择的。
1.一种非暂态机器可读存储介质,包括指令,所述指令使第一处理器电路至少执行以下操作:
2.根据权利要求1所述的非暂态机器可读存储介质,还包括指令使所述第一处理器电路:生成与在所述硬件电路的第一配置或所述硬件电路的第二配置中确定的一者相对应的报告。
3.根据权利要求1所述的非暂态机器可读存储介质,其中,所述指令使第一处理器电路:
4.根据权利要求1所述的非暂态机器可读存储介质,其中,所述指令使所述处理器电路:生成与所述硬件电路的第一配置或所述硬件电路的第二配置相对应的配置指令。
5.根据权利要求1所述的非暂态机器可读存储介质,其中,所述nn模型包括第一层和第二层,所述指令使所述处理器电路:
6.根据权利要求5所述的非暂态机器可读存储介质,其中,所述指令使所述处理器电路:比较所述第一层性能度量和所述第二层性能度量。
7.根据权利要求6所述的非暂态机器可读存储介质,其中,所述指令使所述处理器电路:基于所述比较来分配所述nn模型的第一层或所述第二层中的一层在所述硬件电路的第一配置上执行。
8.根据权利要求6所述的非暂态机器可读存储介质,其中,所述指令使所述处理器电路:实例化模拟器以确定所述第一层性能度量和所述第二层性能度量。
9.根据权利要求6所述的非暂态机器可读存储介质,其中,所述指令使所述处理器电路:生成所述第一层性能度量和所述第二层性能度量之间的相对得分。
10.一种方法,包括:
11.根据权利要求10所述的方法,还包括:生成与在所述硬件电路的第一配置或所述硬件电路的第二配置中确定的一者相对应的报告。
12.根据权利要求10所述的方法,还包括:
13.根据权利要求12所述的方法,还包括:基于对所述第一层性能度量和所述第二层性能度量的比较来分配所述nn模型的所述第一层或所述第二层中的一者在所述硬件电路的第一配置上执行。
14.一种设备,包括执行根据权利要求10至13中任一项所述的方法的装置。
15.一种计算机程序产品,包括指令,所述指令当由至少一个处理器执行时,使所述处理器执行根据权利要求10至13中任一项所述的方法。