本技术涉及计算机应用,特别是涉及一种对象分类模型构建方法、对象分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术:
1、随着计算机技术的发展,出现了各种各样为用户提供信息资源的信息服务平台。平台服务方通过对用户进行分类,针对不同类别用户匹配对应的服务策略,以提高服务质量。
2、传统技术中,基于设定的类别标签对用户进行分类,再使用携带类别标签的已分类对象训练得到对象分类模型。由于模型的构建过程所依托的是预先设定的类别标签,无法适应不同场景下的分类需求,存在灵活性差的缺点。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高灵活性的对象分类模型构建方法、对象分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种对象分类模型构建方法。所述方法包括:
3、获取多个样本对象各自针对接收的历史信息所产生的交互行为记录;
4、基于各所述交互行为记录,分别对每一所述样本对象进行特征提取,确定每一所述样本对象各自的交互特征;
5、对各所述交互特征进行分层聚类处理,得到多个聚类层次,并从各所述聚类层次中确定满足层次条件的选定聚类层次;
6、针对每一所述样本对象,基于所述样本对象在所述选定聚类层次所属的聚类类别,确定所述样本对象的类别标签;
7、使用包括各所述样本对象各自的交互特征和类别标签的训练样本集进行模型训练,得到用于确定待分类对象的对象类别的对象分类模型。
8、第二方面,本技术还提供了一种对象分类模型构建装置。所述装置包括:
9、记录获取模块,用于获取多个样本对象各自针对接收的历史信息所产生的交互行为记录;
10、特征提取模块,用于基于各所述交互行为记录,分别对每一所述样本对象进行特征提取,确定每一所述样本对象各自的交互特征;
11、分层聚类模块,用于对各所述交互特征进行分层聚类处理,得到多个聚类层次,并从各所述聚类层次中确定满足层次条件的选定聚类层次;
12、类别标签确定模块,用于针对每一所述样本对象,基于所述样本对象在所述选定聚类层次所属的聚类类别,确定所述样本对象的类别标签;
13、模型训练模块,用于使用包括各所述样本对象各自的交互特征和类别标签的训练样本集进行模型训练,得到用于确定待分类对象的对象类别的对象分类模型。
14、在其中一个实施例中,所述特征提取模块包括:
15、多特征提取单元,用于针对每一所述样本对象,基于所述样本对象的交互行为记录,对所述样本对象进行多特征提取,得到所述样本对象的多个候选特征;
16、特征选择单元,用于从所述多个候选特征中筛选出满足重要度条件的选定特征;
17、交互特征确定单元,用于基于各所述选定特征确定所述样本对象的交互特征。
18、在其中一个实施例中,所述候选特征包括信息偏好特征;所述多特征提取单元具体用于:
19、确定所述历史信息所包含的信息类别;
20、针对每一所述信息类别,对与所述信息类别关联的交互行为记录进行统计分析,确定所述信息类别的关注度;
21、确定表征各所述信息类别各自的关注度的信息偏好特征。
22、在其中一个实施例中,所述特征选择单元具体用于:
23、针对每一所述候选特征,基于至少两种方式对所述候选特征进行重要度分析,确定所述候选特征在每一方式下各自的重要度;
24、基于每一所述重要度各自的影响系数,对各所述重要度进行统计计算,确定所述候选特征的综合重要度;
25、从各所述候选特征中筛选出综合重要度满足重要度条件的选定特征。
26、在其中一个实施例中,所述分层聚类模块包括:
27、特征相似性确定单元,用于确定各所述交互特征中任意两个交互特征之间的特征相似性;
28、映射单元,用于基于各所述特征相似性,将各所述交互特征映射至同一特征空间;
29、分层聚类单元,用于按照各所述交互特征在所述特征空间中各自的位置,对各所述交互特征进行分层聚类处理,得到多个聚类层次。
30、在其中一个实施例中,所述特征相似性通过多个相似性指标表征;所述特征相似性确定单元具体用于:
31、针对任意两个交互特征,基于各所述相似性指标各自的相似性算法,确定各所述相似性指标各自的指标值;
32、基于各所述相似性指标各自的指标权重,对各所述指标值进行统计,确定所述两个交互特征之间的特征相似性。
33、在其中一个实施例中,所述对象分类模型包括支持向量机模型;所述模型训练模块包括:
34、聚类类别选定单元,用于从各所述聚类类别中确定选定聚类类别;
35、模型训练单元,用于将属于所述选定聚类类别的各样本对象作为正样本进行模型训练,得到用于识别所述选定聚类类别的待分类对象的支持向量机模型。
36、在其中一个实施例中,所述聚类类别选定单元具体用于:
37、确定各所述聚类类别在所述特征空间中各自的聚类中心位置;
38、基于各所述聚类中心位置,从各所述聚类类别中确定与其余聚类类别之间的各聚类中心距离满足距离条件的选定聚类类别。
39、在其中一个实施例中,所述模型训练单元具体用于:
40、获取多个候选模型参数;
41、基于交叉验证算法,从各所述候选模型参数中确定性能最优的选定模型参数;
42、将属于所述选定聚类类别的各样本对象作为正样本,基于所述选定模型参数进行模型训练,得到用于识别所述选定聚类类别的待分类对象的支持向量机模型。
43、在其中一个实施例中,所述分层聚类模块具体用于:
44、获取设定类别数量、以及各所述聚类层次各自包含的聚类类别数量;
45、从各所述聚类层次中,筛选出聚类类别数量与所述设定类别数量匹配的选定聚类层次。
46、在其中一个实施例中,所述分层聚类模块具体用于:
47、从各所述聚类层次中确定满足类别数量条件的多个预选聚类层次;
48、基于各所述预选聚类层次各自的聚类质量分数和聚类类别数量,确定聚类质量分数和聚类类别数量之间的对应关系;
49、根据所述对应关系,从各所述聚类层次中确定聚类质量最优的选定聚类层次;各所述聚类层次各自的聚类类别数量各不相同。
50、第三方面,本技术还提供了一种对象分类方法。所述方法包括:
51、获取待分类对象针对接收的历史信息所产生的交互行为记录;
52、基于所述待分类对象的交互行为记录,对所述待分类对象进行特征提取,确定所述待分类对象的交互特征;
53、使用对象分类模型对所述待分类对象的交互特征进行分类,确定所述待分类对象的对象类别;所述对象分类模型基于上述的对象分类模型构建方法建立。
54、第四方面,本技术还提供了一种对象分类装置。所述装置包括:
55、交互行为记录获取模块,用于获取待分类对象针对接收的历史信息所产生的交互行为记录;
56、交互特征提取模块,用于基于所述待分类对象的交互行为记录,对所述待分类对象进行特征提取,确定所述待分类对象的交互特征;
57、对象分类模块,用于使用对象分类模型对所述待分类对象的交互特征进行分类,确定所述待分类对象的对象类别;所述对象分类模型基于上述的对象分类模型构建方法建立。
58、第五方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
59、第六方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
60、第七方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
61、上述对象分类模型构建方法、对象分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,在对象分类建模过程中,基于多个样本对象各自针对接收的历史信息所产生的交互行为记录,分别对每一样本对象进行特征提取,确定每一样本对象各自的交互特征,能够确保获得的交互特征可以表征样本对象针对历史信息的交互行为特点;对各交互特征进行分层聚类处理,得到多个聚类层次,可以实现对样本对象的不同粒度的分类;从各聚类层次中确定满足层次条件的选定聚类层次,基于样本对象在该选定聚类层次所属的聚类类别,确定该样本对象的类别标签,进而获得用于进行模型训练的已分类样本对象,相当于可以从不同粒度的分层聚类结果中,选择合适粒度的分层聚类结果以支持模型训练,能够适应不同场景下的分类需求,有利于提高模型构建方法的灵活性。
1.一种对象分类模型构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于各所述交互行为记录,分别对每一所述样本对象进行特征提取,确定每一所述样本对象各自的交互特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述候选特征包括信息偏好特征;
4.根据权利要求2所述的方法,其特征在于,所述从所述多个候选特征中筛选出满足重要度条件的选定特征,包括:
5.根据权利要求1所述的方法,其特征在于,所述对各所述交互特征进行分层聚类处理,得到多个聚类层次,包括:
6.根据权利要求5所述的方法,其特征在于,所述特征相似性通过多个相似性指标表征;所述确定各所述交互特征中任意两个交互特征之间的特征相似性,包括:
7.根据权利要求5所述的方法,其特征在于,所述对象分类模型包括支持向量机模型;
8.根据权利要求7所述的方法,其特征在于,所述从各所述聚类类别中确定选定聚类类别,包括:
9.根据权利要求7所述的方法,其特征在于,所述将属于所述选定聚类类别的各样本对象作为正样本进行模型训练,得到用于识别所述选定聚类类别的待分类对象的支持向量机模型,包括:
10.根据权利要求1至9中任意一项所述的方法,其特征在于,所述从各所述聚类层次中确定满足层次条件的选定聚类层次,包括:
11.根据权利要求1至9中任意一项所述的方法,其特征在于,所述从各所述聚类层次中确定满足层次条件的选定聚类层次,包括:
12.一种对象分类方法,其特征在于,包括:
13.一种对象分类模型构建装置,其特征在于,所述装置包括:
14.一种对象分类装置,其特征在于,所述装置包括:
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任意一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任意一项所述的方法的步骤。
17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任意一项所述的方法的步骤。
