本发明涉及计算机应用,尤其涉及一种基于自适应联邦学习的设备选择方法和装置。
背景技术:
1、在联邦学习过程中,服务器在每个联邦轮次从所有参与的边端设备中选取部分设备,执行训练和传输过程。然而,在实际场景中,由于各边端设备间存在硬件资源的异构性,边缘设备可能同时执行多种任务,导致分配给本地模型更新任务的资源发生波动,无法确保每个设备都能成功完成本地训练任务;由于各边端设备间存在通信资源的异构性,有可能出现未能及时上传参数更新的情况。现有技术在边端设备存在资源异构性的场景下,随机选取边端设备进行联邦训练,效率低、失败率高,无效算力、通信开销大。
技术实现思路
1、本发明提供一种基于自适应联邦学习的设备选择方法和装置,用以解决现有技术中在边端设备存在资源异构性的场景下,随机选取边端设备进行联邦训练,导致联邦训练的效率低、失败率高,无效算力、通信开销大的缺陷。
2、第一方面,本发明提供一种基于自适应联邦学习的设备选择方法,包括:
3、以当前轮次联邦训练选取的边端设备节点的数量最大化为目标,建模多臂老虎机(multi-armed bandit, mab)问题,基于当前轮次联邦训练的预设资源利用率阈值、预设时间阈值和预设设备数量阈值确定约束条件;
4、确定每一边端设备节点的性能参数预测值、下载速率、上传速率、当前本地数据量和本地模型测试精度,提取得到所述每一边端设备节点的性能特征向量,所述性能参数预测值包括训练时间预测值和资源利用率预测值;
5、基于所述每一边端设备节点的性能特征向量,在所述约束条件下,对所述mab问题进行求解,确定当前轮次联邦训练的最优设备选取方案。
6、在一些实施例中,所述性能参数预测值是基于预先构建的预测函数和所述当前本地数据量进行预测得到的,所述预测函数的确定过程包括:
7、根据所述每一边端设备节点的历史训练时间、历史资源利用率和历史本地数据量,构建线性回归模型;
8、采用最小二乘法最小化所述线性回归模型的残差,得到最优回归系数,基于所述最优回归系数,确定所述预测函数。
9、在一些实施例中,所述线性回归模型的表达式如下:
10、
11、
12、其中,表示资源利用率预测值,表示训练时间预测值,表示当前本地数据量,和是资源利用率预测值与当前本地数据量之间的回归系数,和是训练时间预测值与当前本地数据量之间的回归系数。
13、在一些实施例中,所述mab问题的目标函数的计算公式如下:
14、
15、
16、
17、其中,表示第轮联邦训练选取的边端设备节点集合,表示第轮次中选取的边端设备节点的数量,表示第个边端设备节点,,为大于等于1的自然数,表示中央处理器(central processing unit,cpu)、内存或能量资源,表示第轮次中设备的cpu、内存或能量的资源利用率预测值,表示第轮次中设备的预设资源利用率阈值,表示第轮次中设备下载全局模型的时间开销,表示第轮次中设备上传本地模型的时间开销,表示第轮次中设备的本地模型的训练时间预测值,表示第轮联邦训练的预设时间阈值,表示联邦学习系统中的边端设备节点的总数量,为超参数,表示所述预设设备数量阈值,表示第轮次中每一边端设备节点需要下载的全局模型的大小,表示第轮次中设备将上传的本地模型的大小,表示第轮次中设备的下载速率,表示第轮次中设备的上传速率。
18、在一些实施例中,所述mab问题的奖励函数的计算公式如下:
19、
20、
21、其中,表示第轮联邦训练的累计奖励值,表示第个边端设备节点是否能够成为候选设备,1表示是,0表示否,表示设备的当前本地数据量,表示第轮次中设备的本地模型的测试精度。
22、在一些实施例中,所述对所述mab问题进行求解,确定当前轮次联邦训练的最优设备选取方案,包括:
23、基于所述每一边端设备节点的性能特征向量,得到所述每一边端设备节点的期望奖励值;
24、采用置信区间上界(upper confidence bound,ucb)算法,基于所述每一边端设备节点的期望奖励值,计算所述每一边端设备节点的置信区间上界;
25、基于所述每一边端设备节点的置信区间上界,确定当前轮次联邦训练的最优设备选取方案。
26、在一些实施例中,所述每一边端设备节点的期望奖励值的计算公式如下:
27、
28、
29、其中,表示第轮次中第个边端设备节点的期望奖励值,表示第轮次中第个边端设备节点的实际奖励值,表示第轮次中第个边端设备节点的性能特征向量,为的转置矩阵,表示第轮次中第个边端设备节点的期望奖励值与性能特征向量之间的系数向量估计值,表示第轮次中第个边端设备节点对应的单位矩阵,表示第轮次中第个边端设备节点对应的零值矩阵。
30、第二方面,本发明还提供一种基于自适应联邦学习的设备选择装置,包括:
31、问题建模单元,用于以当前轮次联邦训练选取的边端设备节点的数量最大化为目标,建模多臂老虎机mab问题,基于当前轮次联邦训练的预设资源利用率阈值、预设时间阈值和预设设备数量阈值确定约束条件;
32、特征提取单元,用于确定每一边端设备节点的性能参数预测值、下载速率、上传速率、当前本地数据量和本地模型测试精度,提取得到所述每一边端设备节点的性能特征向量,所述性能参数预测值包括训练时间预测值和资源利用率预测值;
33、问题求解单元,用于基于所述每一边端设备节点的性能特征向量,在所述约束条件下,对所述mab问题进行求解,确定当前轮次联邦训练的最优设备选取方案。
34、本发明提供的基于自适应联邦学习的设备选择方法和装置,通过以当前轮次联邦训练选取的边端设备节点的数量最大化为目标,建模多臂老虎机mab问题,确定约束条件,基于每一边端设备节点的性能参数预测值、下载速率、上传速率、当前本地数据量和本地模型测试精度,提取得到每一边端设备节点的性能特征向量,在约束条件下,对mab问题进行求解,确定当前轮次联邦训练的最优设备选取方案,提高了联邦训练的效率和成功率,降低了算力和通信资源开销。
1.一种基于自适应联邦学习的设备选择方法,其特征在于,包括:
2.根据权利要求1所述的基于自适应联邦学习的设备选择方法,其特征在于,所述性能参数预测值是基于预先构建的预测函数和所述当前本地数据量进行预测得到的,所述预测函数的确定过程包括:
3.根据权利要求2所述的基于自适应联邦学习的设备选择方法,其特征在于,所述线性回归模型的表达式如下:
4.根据权利要求1所述的基于自适应联邦学习的设备选择方法,其特征在于,所述mab问题的目标函数的计算公式如下:
5.根据权利要求4所述的基于自适应联邦学习的设备选择方法,其特征在于,所述mab问题的奖励函数的计算公式如下:
6.根据权利要求1所述的基于自适应联邦学习的设备选择方法,其特征在于,所述对所述mab问题进行求解,确定当前轮次联邦训练的最优设备选取方案,包括:
7.根据权利要求1所述的基于自适应联邦学习的设备选择方法,其特征在于,所述每一边端设备节点的期望奖励值的计算公式如下:
8.一种基于自适应联邦学习的设备选择装置,其特征在于,包括:
