本公开涉及通信,具体而言,涉及一种联邦训练方法、装置、设备、介质及产品。
背景技术:
1、联邦学习是一种分散式学习方法,需要通过多个联邦客户端完成联邦学习任务,但在根据联邦学习任务进行联邦学习的过程中,会因为各种原因导致联邦客户端意外离线,导致该联邦客户端不能进行联邦学习任务,从而影响联邦学习的学习效率。
2、相关技术中,通过不断重新建立离线客户端与联邦服务器之间的通信连接的方式,使离线客户端重新加入到联邦学习,由于需要多次建立离线客户端与联邦服务器之间的通信连接,导致需要消耗较多的通信资源和离线客户端的训练时间,从而影响联邦学习的学习效率。
技术实现思路
1、鉴于上述问题而提出了本公开。本公开提供一种联邦训练方法、装置、设备、介质及产品。
2、根据本公开的一个方面,提供了一种联邦训练方法,包括:
3、在确定第一联邦客户端退出联邦学习任务的当前训练轮次的情况下,获取所述第一联邦客户端和第二联邦客户端在历史训练轮次训练得到的历史模型参数;其中,所述第二联邦客户端为当前训练轮次未退出的客户端;
4、基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的相似度;
5、基于所述相似度在所述第二联邦客户端中确定所述第一联邦客户端的替代联邦客户端,并通过所述替代联邦客户端执行所述第一联邦客户端针对当前训练轮次的训练任务。
6、此外,根据本公开一个方面的所述基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的相似度,还包括:
7、基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的模型参数的相似度;
8、根据所述模型参数的相似度和训练状态计算所述目标模型的相似度;其中,所述训练状态用于指示所述第一联邦客户端和所述第二联邦客户端在历史训练轮次的训练状态。
9、此外,根据本公开一个方面的所述基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的模型参数的相似度,还包括:
10、确定所述历史模型参数中的第一模型参数;其中,所述第一模型参数为所述第一联邦客户端和所述第二联邦客户端在第一历史训练轮次下训练得到的所述目标模型的模型参数,所述第一历史训练轮次为所述当前训练轮次之前的目标数量个训练轮次;
11、基于各所述第一历史训练轮次对应第一模型参数,计算第一相似度;
12、对所述目标数量个第一相似度进行归一化处理,得到所述模型参数的相似度。
13、此外,根据本公开一个方面,所述方法还包括:
14、基于所述当前训练轮次的初始模型参数和所述第二联邦客户端的训练数据集,确定第二模型参数;其中,所述第二模型参数用于指示每个所述第二联邦客户端对所述目标模型进行训练后得到的参数;
15、对全部所述第二联邦客户端输出的第二模型参数进行聚合,得到聚合模型参数;
16、将所述聚合模型参数确定为下一训练轮次的初始模型参数;其中,所述下一训练轮次的初始模型参数用于指示所述下一训练轮次中每个联邦客户端针对所述目标模型的初始模型参数。
17、此外,根据本公开一个方面的所述基于所述当前训练轮次的初始模型参数和所述第二联邦客户端的训练数据集,确定第二模型参数,还包括:
18、基于所述当前训练轮次的初始模型参数和所述训练数据集的样本数量,计算每个所述第二联邦客户端在所述当前训练轮次的预测误差值;其中,所述预测误差值用于指示所述第二联邦客户端的预测值和实际值之间的差值;
19、根据每个所述第二联邦客户端的预测误差值和该第二联邦客户端的学习率计算所述第二模型参数;其中,所述学习率用于指示第二联邦客户端的模型参数的更新幅度。
20、此外,根据本公开一个方面的所述对全部所述第二联邦客户端输出的第二模型参数进行聚合,得到聚合模型参数,还包括:
21、对全部所述第二联邦客户端的第二模型参数进行加权求和处理,得到处理结果;
22、对所述第二联邦客户端的学习率和所述处理结果进行聚合处理,得到所述聚合模型参数;其中,所述学习率用于指示第二联邦客户端的模型参数的更新幅度。
23、此外,根据本公开一个方面的在通过所述替代联邦客户端执行所述第一联邦客户端针对当前训练轮次的训练任务之后,还包括:
24、根据所述第二联邦客户端在所述当前训练轮次的预测误差值,确定所述第二联邦客户端的预测准确度的变化值;其中,所述变化值用于指示所述第二联邦客户端在当前训练轮次的预测准确度与上一训练轮次的预测准确度之间的变化;
25、确定与所述变化值相对应的贡献权重;其中,所述贡献权重用于指示所述第二联邦客户端针对所述联邦学习任务的贡献程度;
26、基于所述变化值与所述贡献权重,计算所述第二联邦客户端针对所述当前训练轮次的贡献度。
27、此外,根据本公开一个方面的所述确定与所述变化值相对应的贡献权重,还包括:
28、获取所述替代联邦客户端的第一选择权重、所述第一联邦客户端的第二选择权重和目标相似度;其中,所述目标相似度用于指示所述替代联邦客户端和所述第一联邦客户端之间的相似度;
29、基于所述第一选择权重、所述第二选择权重和所述目标相似度,确定与所述替代联邦客户端的变化值相对应的贡献权重。
30、此外,根据本公开一个方面的在基于所述变化值与所述贡献权重,计算所述第二联邦客户端针对所述当前训练轮次的贡献度之后,还包括:
31、基于所述变化值确定每个所述第二联邦客户端在所述当前训练轮次下的预设奖励值;
32、根据所述贡献度和所述预设奖励值,计算每个所述第二联邦客户端在所述当前训练轮次下的当前奖励值;
33、对每个所述第二联邦客户端在历史训练轮次下的历史奖励值和所述当前奖励值进行求和处理,得到所述第二联邦客户端的第一奖励值;其中,所述第一奖励值用于指示所述第二联邦客户端在联邦学习任务中获得的奖励值。
34、此外,根据本公开一个方面的所述基于所述变化值确定每个所述第二联邦客户端在所述当前训练轮次下的预设奖励值,还包括:
35、确定所述第二联邦客户端在最后一个训练轮次下的准确度;
36、基于所述准确度、所述变化值和第二奖励值,确定所述第二联邦客户端在所述当前训练轮次下的预设奖励值;其中,所述第二奖励值用于指示联邦学习任务所设置的奖励值。
37、根据本公开的另一个方面,提供了一种联邦训练装置,包括:
38、获取单元,用于在确定第一联邦客户端退出联邦学习任务的当前训练轮次的情况下,获取所述第一联邦客户端和第二联邦客户端在历史训练轮次训练得到的历史模型参数;其中,所述第二联邦客户端为当前训练轮次未退出的客户端;
39、处理单元,用于基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的相似度;
40、客户端确定单元,用于基于所述相似度在所述第二联邦客户端中确定所述第一联邦客户端的替代联邦客户端,并通过所述替代联邦客户端执行所述第一联邦客户端针对当前训练轮次的训练任务。
41、根据本公开的又一个方面,提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述联邦训练方法中的步骤。
42、根据本公开的又一个方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述联邦训练方法中的步骤。
43、根据本公开的又一个方面,提供了一种计算机程序产品,所述计算机程序产品被存储在存储介质中,所述程序产品被至少一个处理器执行以实现上述联邦训练方法中的步骤。
44、如以下将详细描述的,根据本公开实施例的联邦训练方法、装置、设备、介质及产品,通过计算第一联邦客户端和第二联邦客户端之间在历史训练轮次所训练得到的目标模型的相似度;其中,第一联邦客户端为退出联邦学习任务的当前训练轮次的客户端,第二联邦客户端为当前训练轮次未退出的客户端;并基于该相似度在第二联邦客户端中确定第一联邦客户端的替代联邦客户端的方式,从而节省联邦训练过程中消耗的通信资源和第一联邦客户端的训练时间,提高联邦学习的学习效率。
45、要理解的是,前面的一般描述和下面的详细描述两者都是示例性的,并且意图在于提供要求保护的技术的进一步说明。
1.一种联邦训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的相似度,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述历史模型参数,计算所述第一联邦客户端和所述第二联邦客户端之间在历史训练轮次所训练得到的目标模型的模型参数的相似度,包括:
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述当前训练轮次的初始模型参数和所述第二联邦客户端的训练数据集,确定第二模型参数,包括:
6.根据权利要求4所述的方法,其特征在于,所述对全部所述第二联邦客户端输出的第二模型参数进行聚合,得到聚合模型参数,包括:
7.根据权利要求1所述的方法,其特征在于,在通过所述替代联邦客户端执行所述第一联邦客户端针对当前训练轮次的训练任务之后,包括:
8.根据权利要求7所述的方法,其特征在于,所述确定与所述变化值相对应的贡献权重,包括:
9.根据权利要求7所述的方法,其特征在于,在基于所述变化值与所述贡献权重,计算所述第二联邦客户端针对所述当前训练轮次的贡献度之后,包括:
10.根据权利要求9所述的方法,其特征在于,所述基于所述变化值确定每个所述第二联邦客户端在所述当前训练轮次下的预设奖励值,包括确定所述第二联邦客户端在最后一个训练轮次下的准确度;
11.一种联邦训练装置,其特征在于,包括:
12.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至10任一所述的联邦训练方法的步骤。
13.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至10任一所述的联邦训练方法的步骤。
14.一种计算机程序产品,其特征在于,所述计算机程序产品被存储在存储介质中,所述程序产品被至少一个处理器执行以实现如权利要求1至10任一所述的联邦训练方法。