本发明涉及一种排序方法,尤其涉及一种排序方法、装置、电子设备及计算机存储介质
背景技术:
1、随着移动互联网的飞速发展,电子商务规模不断增大,物品的数量呈指数式增长,用户需要花费大量时间精力才能找到自己想要的物品,过程中会浏览大量的无关内容,会出现信息过载情况,而推荐系统是解决信息过载最有效的方式。推荐系统的核心目标是从总物品库中为用户挑选出其最感兴趣的一部分物品,从而节省用户时间,也提高电商平台的转化效率,为交易的顺利进行提供助力。推荐系统的整个过程可以分为召回、粗排、精排和重排四个阶段,其中,精排是推荐系统中最重要的一个环节,精排是将粗排选出来的物品进行细分析,按照用户可能感兴趣的程度,从高到低进行排序。
2、目前,一般是基于深度点击率预估模型对物品进行排序,即预测用户对展示的物品的点击率,当前深度点击率预估模型是通过用户的历史行为数据拟合得到点击率预估函数,基于点击率预估函数对物品进行排序,但在实际应用中,绝大多数用户的历史行为数据是有限的,数据一般存在很大的稀疏性,因此,拟合得到的点击率预估函数无法准确预测用户对物品的真实的点击率,存在建模偏差,影响推荐系统的排序效果。
技术实现思路
1、本发明实施例主要提供一种排序换方法、装置、电子设备及计算机存储介质。
2、本发明实施例提供了一种排序方法,所述方法包括:
3、获取用户的历史行为数据,根据所述用户的历史行为数据,确定所述用户的兴趣偏好数据;所述兴趣偏好数据用于表征所述用户对历史物品集中各个物品的感兴趣程度;
4、根据所述用户的兴趣偏好数据,基于稀疏高斯过程回归方法,确定目标任务的第一概率分布函数的均值和方差;所述第一概率分布函数用于预估所述用户对候选物品集中各个物品的感兴趣程度;
5、根据所述目标任务的第一概率分布函数的均值和方差,获取所述候选物品集中各个物品的评分结果;
6、根据所述候选物品集中各个物品的评分结果,对所述各个物品进行排序。
7、上述方案中,所述确定目标任务的第一概率分布函数的均值和方差之前,所述方法还包括:根据所述用户的兴趣偏好数据,拟合得到所述目标任务的第二概率分布函数;在所述目标任务的第二概率分布函数服从高斯分布的情况下,根据所述目标任务的第二概率分布函数,确定所述目标任务的第一概率分布函数。
8、可以看出,根据用户的兴趣偏好数据,可以拟合得到目标任务的第二概率分布函数,在第二概率分布函数服从高斯分布的情况下,根据目标任务的第二概率分布函数,确定目标任务的第一概率分布函数,即基于高斯过程回归方法确定目标任务的第一概率分布函数,能够有效处理数据样本较少的问题。
9、上述方案中,所述在所述目标任务的第二概率分布函数服从高斯分布的情况下,根据所述目标任务的第二概率分布函数,确定所述目标任务的第一概率分布函数,包括:在所述用户的历史行为数据中确定至少一个样本数据;根据所述至少一个样本数据,拟合得到所述目标任务的第三概率分布函数;确定所述目标任务的第二概率分布函数和所述目标任务的第三概率分布函数的联合分布函数;确定所述联合分布函数为先验分布函数,确定所述先验分布函数与所述目标任务的第一概率分布函数之间的似然函数;在所述似然函数满足高斯分布的情况下,根据所述联合分布函数和所述似然函数,确定后验分布函数;根据所述后验分布函数,确定所述目标任务的第一概率分布函数。
10、可以看出,通过在用户的历史行为数据中确定至少一个样本数据,对高斯过程回归方法进行稀疏化,可以减少数据样本的维数,能够有效简化高斯过程的运算,减少高斯过程回归方法的训练时间和预测时间。
11、上述方案中,所述方法还包括:在所述似然函数不满足高斯分布的情况下,设置变分分布函数;所述变分分布函数用于近似拟合所述后验分布函数;通过调整所述变分分布函数的均值和方差,使所述变分分布函数与所述后验分布函数的相对熵散度(kullback-leible,kl)最小化,将所述变分分布函数作为所述后验分布函数。
12、可以看出,通过调整变分分布函数的均值和方差,使变分分布函数与后验分布函数的相对熵散度kl最小化,则以近似的变分分布函数替代后验分布函数,从而确定目标任务的第一概率分布函数。
13、上述方案中,所述根据所述目标任务的第一概率分布函数的均值和方差,获取所述候选物品集中各个物品的评分结果,包括:根据所述目标任务的第一概率分布函数的均值和方差,基于bandit算法,获取所述候选物品集中各个物品的评分结果。
14、可以看出,与基于bandit算法相结合,在根据目标任务的第一概率分布函数,获取候选物品集中各个物品的评分结果时,可以对各个物品的评分结果产生一定的波动,使得在考虑用户历史的兴趣偏好的同时,又能够探索到用户新的兴趣偏好,能够有效降低模型的马太效应。
15、本发明实施例还提供了一种排序装置,所述装置至少包括:
16、第一获取模块,用于获取用户的历史行为数据,根据所述用户的历史行为数据,确定所述用户的兴趣偏好数据;所述兴趣偏好数据用于表征所述用户对历史物品集中各个物品的感兴趣程度;
17、确定模块,用于根据所述用户的兴趣偏好数据,基于稀疏高斯过程回归方法,确定目标任务的第一概率分布函数的均值和方差;所述第一概率分布函数用于预估所述用户对候选物品集中各个物品的感兴趣程度;
18、第二获取模块,用于根据所述目标任务的第一概率分布函数的均值和方差,获取所述候选物品集中各个物品的评分结果;
19、排序模块,用于根据所述候选物品集中各个物品的评分结果,对所述各个物品进行排序。
20、在一种实现方式中,所述确定模块在确定目标任务的第一概率分布函数的均值和方差之前,还用于:
21、根据所述用户的兴趣偏好数据,拟合得到所述目标任务的第二概率分布函数;
22、在所述目标任务的第二概率分布函数服从高斯分布的情况下,根据所述目标任务的第二概率分布函数,确定所述目标任务的第一概率分布函数。
23、在一种实现方式中,所述确定模块,用于在所述目标任务的第二概率分布函数服从高斯分布的情况下,根据所述目标任务的第二概率分布函数,确定所述目标任务的第一概率分布函数,包括:
24、在所述用户的历史行为数据中确定至少一个样本数据;
25、根据所述至少一个样本数据,拟合得到所述目标任务的第三概率分布函数;
26、确定所述目标任务的第二概率分布函数和所述目标任务的第三概率分布函数的联合分布函数;
27、确定所述联合分布函数为先验分布函数,确定所述先验分布函数与所述目标任务的第一概率分布函数之间的似然函数;
28、在所述似然函数满足高斯分布的情况下,根据所述联合分布函数和所述似然函数,确定后验分布函数;
29、根据所述后验分布函数,确定所述目标任务的第一概率分布函数。
30、在一种实现方式中,所述装置还包括处理模块,所述处理模块用于:
31、在所述似然函数不满足高斯分布的情况下,设置变分分布函数;所述变分分布函数用于近似拟合所述后验分布函数;
32、通过调整所述变分分布函数的均值和方差,使所述变分分布函数与所述后验分布函数的相对熵散度kl最小化,将所述变分分布函数作为所述后验分布函数。
33、在一种实现方式中,所述第二获取模块,用于根据所述目标任务的第一概率分布函数的均值和方差,获取所述候选物品集中各个物品的评分结果,包括:
34、根据所述目标任务的第一概率分布函数的均值和方差,基于bandit算法,获取所述候选物品集中各个物品的评分结果。
35、本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一种排序方法。
36、本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一种排序方法。
37、基于本发明实施例提供的一种排序方法、装置、电子设备及计算机存储介质,所述方法包括:获取用户的历史行为数据,根据所述用户的历史行为数据,确定所述用户的兴趣偏好数据;所述兴趣偏好数据用于表征所述用户对历史物品集中各个物品的感兴趣程度;根据所述用户的兴趣偏好数据,基于稀疏高斯过程回归方法,确定目标任务的第一概率分布函数的均值和方差;所述第一概率分布函数用于预估所述用户对候选物品集中各个物品的感兴趣程度;根据所述目标任务的第一概率分布函数的均值和方差,获取所述候选物品集中各个物品的评分结果;根据所述候选物品集中各个物品的评分结果,对所述各个物品进行排序。
38、本发明实施例中,高斯过程回归方法对于处理数据样本较少的问题具有很强的适应性,可以提高高斯过程预估结果的可靠性,同时,通过对高斯过程回归方法进行稀疏化,可以减少数据样本的维数,能够有效简化高斯过程的运算,减少高斯过程回归方法的训练时间和预测时间。
39、可以看出,本发明实施例中,基于稀疏高斯过程回归方法,通过对根据用户的历史行为数据确定的用户的兴趣偏好数据进行建模,可以确定目标任务的第一概率分布函数的均值和方差,这里,第一概率分布函数用于预估所述用户对候选物品集中各个物品的感兴趣程度,根据目标任务的第一概率分布函数的均值和方差,可以获取候选物品集中各个物品的评分结果,从而对各个物品进行排序,能够准确地预估用户对物品的感兴趣程度,有效提升了排序效果。
40、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本发明。
1.一种排序方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定目标任务的第一概率分布函数的均值和方差之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述在所述目标任务的第二概率分布函数服从高斯分布的情况下,根据所述目标任务的第二概率分布函数,确定所述目标任务的第一概率分布函数,包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标任务的第一概率分布函数的均值和方差,获取所述候选物品集中各个物品的评分结果,包括:
6.一种排序装置,其特征在于,所述装置至少包括:
7.根据权利要求6所述的装置,其特征在于,所述确定模块在确定目标任务的第一概率分布函数的均值和方差之前,还用于:
8.根据权利要求7所述的装置,其特征在于,所述确定模块,用于在所述目标任务的第二概率分布函数服从高斯分布的情况下,根据所述目标任务的第二概率分布函数,确定所述目标任务的第一概率分布函数,包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-5中任一项所述的排序方法。
10.一种计算机存储介质,所述存储介质存储有计算机程序;其特征在于,所述计算机程序被执行后能够实现权利要求1-5中任一项所述的排序方法。
