1.本技术涉及人工智能技术领域,尤其涉及一种基于随机森林的信息推荐方法、装置、设备及存储介质。
背景技术:
2.人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
3.当前向客户发送产品推荐和推荐话术时,所采用的方式是先根据以往产品数据分析客户的偏好信息,通过聚类分析的方式,将同一偏好的客户进行聚类,并将对应产品和推荐话术直接推荐给客户。然而这种方式只将客户进行分类,没有对产品信息、客户信息等方面进行综合评判,从而导致信息推荐的效率较低。现亟需一种能够提高信息推荐效率的方法。
技术实现要素:
4.本技术实施例的目的在于提出一种基于随机森林的信息推荐方法、装置、设备及存储介质,以提高信息推荐的效率。
5.为了解决上述技术问题,本技术实施例提供一种基于随机森林的信息推荐方法,包括:
6.获取样本数据集,其中,所述样本数据集包括产品信息、客户信息以及经纪人信息;
7.采用预设方式,对所述样本数据集进行抽取样本,得到多个子训练集;
8.通过多个所述子训练集对决策树模型进行训练,得到目标决策树;
9.获取历史语音数据,并对所述历史语音数据进行声学特征提取,得到声学特征;
10.基于所述声学特征进行语音特征分析,得到分析结果,并通过预设模型对所述分析结果进行模式匹配,得到目标语音模型;
11.获取目标客户信息,并基于所述目标决策树和所述目标语音模型对所述目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将所述目标推荐产品和所述推荐话术推送至目标客户。
12.为了解决上述技术问题,本技术实施例提供一种基于随机森林的信息推荐装置,包括:
13.样本数据集获取模块,用于获取样本数据集,其中,所述样本数据集包括产品信息、客户信息以及经纪人信息;
14.子训练集生成模块,用于采用预设方式,对所述样本数据集进行抽取样本,得到多个子训练集;
15.目标决策树训练模块,用于通过多个所述子训练集对决策树模型进行训练,得到
目标决策树;
16.声学特征提取模块,用于获取历史语音数据,并对所述历史语音数据进行声学特征提取,得到声学特征;
17.目标语音模型生成模块,用于基于所述声学特征进行语音特征分析,得到分析结果,并通过预设模型对所述分析结果进行模式匹配,得到目标语音模型;
18.信息推荐模块,用于获取目标客户信息,并基于所述目标决策树和所述目标语音模型对所述目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将所述目标推荐产品和所述推荐话术推送至目标客户。
19.为解决上述技术问题,本发明采用的一个技术方案是:提供一种计算机设备,包括,一个或多个处理器;存储器,用于存储一个或多个程序,使得一个或多个处理器实现上述任意一项所述的基于随机森林的信息推荐方法。
20.为解决上述技术问题,本发明采用的一个技术方案是:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于随机森林的信息推荐方法。
21.本发明实施例提供了一种基于随机森林的信息推荐方法、装置、设备及存储介质。其中,方法包括:获取样本数据集;采用预设方式,对样本数据集进行抽取样本,得到多个子训练集;通过多个子训练集对决策树模型进行训练,得到目标决策树;获取历史语音数据,并对历史语音数据进行声学特征提取,得到声学特征;基于声学特征进行语音特征分析,得到分析结果,并通过预设模型对分析结果进行模式匹配,得到目标语音模型;获取目标客户信息,并基于目标决策树和目标语音模型对目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将目标推荐产品和推荐话术推送至目标客户。本技术实施例通过结合产品信息、客户信息以及经纪人信息进行训练决策树,同时结合历史语音信息进行分析对应产品的推荐话术,使得精准分析客户对相应信息的偏好程度以及相匹配的推荐话术,从而有利于提高信息推荐的效率。
附图说明
22.为了更清楚地说明本技术中的方案,下面将对本技术实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1根据本技术实施例提供的基于随机森林的信息推荐方法的一实现流程图;
24.图2是本技术实施例提供的基于随机森林的信息推荐方法中子流程的一实现流程图;
25.图3是本技术实施例提供的基于随机森林的信息推荐方法中子流程的又一实现流程图;
26.图4是本技术实施例提供的基于随机森林的信息推荐方法中子流程的又一实现流程图;
27.图5是本技术实施例提供的基于随机森林的信息推荐方法中子流程的又一实现流程图;
28.图6是本技术实施例提供的基于随机森林的信息推荐方法中子流程的又一实现流
程图;
29.图7是本技术实施例提供的基于随机森林的信息推荐方法中子流程的又一实现流程图;
30.图8是本技术实施例提供的基于随机森林的信息推荐装置示意图;
31.图9是本技术实施例提供的计算机设备的示意图。
具体实施方式
32.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术;本技术的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本技术的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
33.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
34.为了使本技术领域的人员更好地理解本技术方案,下面将结合附图,对本技术实施例中的技术方案进行清楚、完整地描述。
35.下面结合附图和实施方式对本发明进行详细说明。
36.需要说明的是,本技术实施例所提供的基于随机森林的信息推荐方法一般由服务器执行,相应地,基于随机森林的信息推荐装置一般配置于服务器中。
37.请参阅图1,图1示出了基于随机森林的信息推荐方法的一种具体实施方式。
38.需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限,该方法包括如下步骤:
39.s1:获取样本数据集,其中,样本数据集包括产品信息、客户信息以及经纪人信息。
40.具体的,通过搜集现有产品信息、客户信息、经纪人等信息组成数据源,将数据源作为原始样本集。进一步的,选择客户信息时,优选推荐成功案例中的客户信息。
41.s2:采用预设方式,对样本数据集进行抽取样本,得到多个子训练集。
42.进一步的,采用有放回重复抽样的方式,对样本数据集进行抽取样本,得到多个子训练集。其中,有放回重复抽样是简单随机抽样的操作方式之一,该方式是把总体中的抽样单位从1至n编号,每抽取一个号码后再将它放回总体,对于任意一次抽取而言,由于总体容量不变,所以n个号码被抽中的机会均等。本技术实施例中,将数据源作为原始样本集,使用有放回重复抽样的方式抽取个训练样本,进行多轮抽取,得到相互独立的子训练集。
43.s3:通过多个子训练集对决策树模型进行训练,得到目标决策树。
44.请参阅图2,图2示出了步骤s3的一种具体实施方式,详叙如下:
45.s31:计算多个子训练集的基尼指数。
46.s32:构建将多个子训练集的决策树,并基于基尼指数确定最优特征和最优分割点。
47.s33:根据最优特征和最优分割点对决策树进行递归分割,得到初始决策树。
48.s34:计算初始决策树的预测误差,并基于预测误差,对初始决策树进行剪枝处理,得到目标决策树。
49.具体的,计算多个子训练集的基尼指数的方式为:对于给定的样本集d,其基尼指数为其中,ck是样本集d中属于第k类的样本子集,k是类的个数;如果样本集合d根据特征a是否取某一可能值α被分割成d1和d2两部分,即:
50.d1={(x,j)∈d|a(x)=a},d2=d-d1;
51.则在特征a的条件下,样本集d的基尼指数定义为:
[0052][0053]
基尼指数gini(d)表示集合d的不确定性,基尼指数gini(d,a)表示经a=α分割后集合d的不确定性,基尼指数越大,样本集合的不确定性越大。
[0054]
进一步的,对决策树的训练过程:输入:子训练集d,停止计算的条件输出:目标决策树。根据训练数据集,从根节点开始,递归地对每个节点进行一下操作,构建二叉决策树。具体过程为:步骤1设结点的训练数据集为d,计算现有特征对该数据集的基尼指数,此时,对每一个特征a,对其可能取得每个值α,根据样本点对a=α的测试为是或否将d分割为d1和d2两部分,通过上述基尼指数计算方法计算a=α时的基尼指数。步骤2在所有可能的特征a以及它们所有可能的切分点α中,选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点。根据最优特征与最优切分点,从现结点生成来两个子结点,将训练集依特征分配到两个子结点中。步骤三对两个子结点递归地调用上述步骤1和步骤2,直至满足停止条件,最终生成目标决策树。
[0055]
本实施中,通过计算多个子训练集的基尼指数,再构建将多个子训练集的决策树,并基于基尼指数确定最优特征和最优分割点,然后根据最优特征和最优分割点对决策树进行递归分割,得到初始决策树,计算初始决策树的预测误差,并基于预测误差,对初始决策树进行剪枝处理,得到目标决策树,实现了对决策树进行训练,生成目标决策树,有利于输出客户的偏好产品,从而有利于提高信息推荐的效率。
[0056]
请参阅图3,图3示出了步骤s34的一种具体实施方式,详叙如下:
[0057]
s341:计算初始决策树的预测误差。
[0058]
s342:通过预测误差对初始决策树的每个节点进行节点剪枝处理,得到剪枝后的决策树。
[0059]
s343:判断剪枝后的决策树的根节点是否构成单独树,若否,则重复对初始决策树进行剪枝处理,直至剪枝后的决策树的根节点构成单独树,得到子树序列。
[0060]
s344:采用交叉验证的方式,对子树序列进行验证处理,得到目标决策树。
[0061]
具体的,剪枝指的是在深度优先搜索中去掉一些不符合题目要求的或是浪费时间而没有作用的答案,从而使得深度优先搜索能够更快得到正确答案。在本技术实施例中,通过判断决策树的每个节点是否满足剪枝条件,对其进行剪枝处理。其中,单独树是指由根节点单独构成的树。
[0062]
在本技术实施例中,通过获取预测数据,并计算预测数据与初始决策树的差距,从而得到预测误差,再通过预测误差判断决策树的内部节点与其特征所取得的值是否相等,若相等则对节点进行剪枝处理,然后判断剪枝后的决策树是否构成单独树,若否,则重复对初始决策树进行剪枝处理,直至剪枝后的决策树的根节点构成单独树,得到子树序列,再采用交叉验证的方式,对子树序列进行验证处理,得到目标决策树,从而实现了对初始决策树的剪枝处理和验证处理,有效提高了决策树的分析精准度,有利于提高信息推荐的效率。
[0063]
s4:获取历史语音数据,并对历史语音数据进行声学特征提取,得到声学特征。
[0064]
请参阅图4,图4示出了步骤s4的一种具体实施方式,详叙如下:
[0065]
s41:获取历史语音数据,并对历史语音数据进行预处理,得到基础语音段。
[0066]
s42:通过对基础语音段进行信号转化处理,得到梅尔频率。
[0067]
s43:采用倒谱分析的方式,对梅尔频率进行声学特征提取,得到声学特征。
[0068]
具体的,获取历史语音数据,并对历史语音数据进行预处理,得到基础语音段,其中,历史语音数据为以往经纪人或者人工智能与客户交流的语音数据,进一步的历史语音数据中包括每种产品对应的推荐话术,这些推荐话术包括推荐效果较好的、较差的以及一般的。经过预处理以后便得到有效的语音信号,也即基础语音段。然后对每一帧波形的基础语音通过mfcc声学特征提取得到一个多维向量。mfcc声学特征提取:将语音信号转化到梅尔频率,然后进行倒谱分析,从而得到声学特征。其中,mfcc:mel频率倒谱系数(mel frequency cepstrum coefficient,mfcc)的缩写。mel频率是基于人耳听觉特性提出来,它与hz频率呈非线性对应关系;mel频率倒谱系数(mfcc)则是利用它们之间的这种关系,计算得到的hz频谱特征,也即得到声学特征。
[0069]
本实施例中,通过对获取到的历史语音数据进行预处理和声学特征提取,有利于后续构建目标语音模型,便于后续输出相应的推荐话术,从而提高信息推荐的效率。
[0070]
请参阅图5,图5示出了步骤s41的一种具体实施方式,详叙如下:
[0071]
s411:获取历史语音数据,并对历史语音数据进行静音切除处理,得到有效语音段。
[0072]
s412:对有效语音段进行去噪处理,得到去噪后的有效语音段。
[0073]
s413:通过谱减法对去噪后的有效语音段进行语音增强处理,得到基础语音段。
[0074]
具体的,预处理:主要对输入的声音进行静音切除、噪音处理和语音增强。静音切除:对语音信号进行端点检测,将语音信号中的语音和非语音信号时段区分开来,准确地确定出语音信号的前端点和后端点,从连续的语音流中检测出有效的语音段。
[0075]
噪音处理:对收集到的有效语音段从起始背景噪音开始进行分组、fourier变换,对这些分组求平均得到噪声的频谱,将含噪语音反向补偿之后进行噪声抑制。语音增强:通过短时谱估计增强算法中的谱减法,消除环境噪声对语音的影响,增强效果。
[0076]
请参阅图6,图6示出了步骤s411的一种具体实施方式,详叙如下:
[0077]
s4111:获取历史语音数据,并对历史语音数据进行端点检测,识别历史语音数据中的语音段信号和非语音段信号。
[0078]
s4112:确定语音段信号的前端点和后端点,并基于前端点和后端点,获取语音段信号中的连续语音段。
[0079]
s4113:对连续语音段进行语音检测,得到有效语音段。
[0080]
具体的,对历史语音数据进行端点检测,识别历史语音数据中的语音段信号和非语音段信号,而从获取到语音段信号的开始阶段和结束阶段,以及非语言段的开始阶段和结束阶段,然后确定语音段信号的前端点和后端点(也即语音段信号的开始阶段和结束阶段),并基于前端点和后端点,获取语音段信号中的连续语音段,从而对联系语音段进行语音检测,从而得到有效语音段。本实施例中,通过对历史语音段进行端点检测,识别出连续语音段,并识别出有效语音段,从而切除冗余的非语音数据,有效提高数据处理的效率,同时识别出有效语音段,便于后续进行预设模型的匹配。
[0081]
s5:基于声学特征进行语音特征分析,得到分析结果,并通过预设模型对分析结果进行模式匹配,得到目标语音模型。
[0082]
具体的,在上述步骤中已经对历史语音数据进行了声学特征的提取,现需要针对不同类型的产品匹配相应的推荐话术,所以本技术实施例通过隐马尔可夫模型hmm和动态时间规整算法模型去分类匹配对应类型产品的声学特征,也即对应其推荐话术,从而得到目标语音模型。具体的,由于历史语音数据中,包括每种产品对应的推荐话术,这些推荐话术包括推荐效果较好的、较差的以及一般的,其中,推荐效果是通过推荐产品的成功与否进行评判的。将每种产品类型对应推荐效果较好的声学特征与该产品类型进行匹配,在后续需要对该产品进行输出推荐话术时,直接根据该产品类型,则可根据目标语音模型获取到对应的推荐话术,从而输出该推荐话术。
[0083]
s6:获取目标客户信息,并基于目标决策树和目标语音模型对目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将目标推荐产品和推荐话术推送至目标客户。
[0084]
具体的,由于上述步骤已经生成了目标决策树和目标语音模型,在需要对目标客户进行推荐产品信息时,通过获取目标客户信息,并基于目标决策树和目标语音模型对目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将目标推荐产品和推荐话术推送至目标客户。
[0085]
本实施例中,获取样本数据集;采用预设方式,对样本数据集进行抽取样本,得到多个子训练集;通过多个子训练集对决策树模型进行训练,得到目标决策树;获取历史语音数据,并对历史语音数据进行声学特征提取,得到声学特征;基于声学特征进行语音特征分析,得到分析结果,并通过预设模型对分析结果进行模式匹配,得到目标语音模型;获取目标客户信息,并基于目标决策树和目标语音模型对目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将目标推荐产品和推荐话术推送至目标客户。本技术实施例通过结合产品信息、客户信息以及经纪人信息进行训练决策树,同时结合历史语音信息进行分析对应产品的推荐话术,使得精准分析客户对相应信息的偏好程度以及相匹配的推荐话术,从而有利于提高信息推荐的效率。
[0086]
请参阅图7,图7示出了步骤s6的一种具体实施方式,详叙如下:
[0087]
s61:获取目标客户信息,并通过目标决策树对目标客户信息进行分析处理,得到目标推荐产品。
[0088]
s62:通过目标语音模型匹配目标推荐产品,输出推荐话术。
[0089]
s63:将目标推荐产品和推荐话术推送至目标客户。
[0090]
具体的,在需要对目标客户进行推荐相应产品时,将获取该目标客户信息,再将其通过目标决策树对目标客户信息进行分析处理,得到目标推荐产品。通过目标语音模型匹
配目标推荐产品,输出推荐话术;将目标推荐产品和推荐话术反馈到目标客户。本实施例通过结合产品信息、客户信息以及经纪人信息进行训练决策树,得到训练好的决策树,同时结合历史语音信息进行分析对应产品的推荐话术,使得精准分析客户对相应信息的偏好程度以及相匹配的推荐话术,从而有利于提高信息推荐的效率。
[0091]
需要强调的是,为进一步保证上述目标客户信息的私密和安全性,上述目标客户信息还可以存储于一区块链的节点中。
[0092]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
[0093]
请参考图8,作为对上述图1所示方法的实现,本技术提供了一种基于随机森林的信息推荐装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
[0094]
如图8所示,本实施例的基于随机森林的信息推荐装置包括:样本数据集获取模块71、子训练集生成模块72、目标决策树训练模块73、声学特征提取模块74、目标语音模型生成模块75及信息推荐模块76,其中:
[0095]
样本数据集获取模块71,用于获取样本数据集,其中,样本数据集包括产品信息、客户信息以及经纪人信息;
[0096]
子训练集生成模块72,用于采用预设方式,对样本数据集进行抽取样本,得到多个子训练集;
[0097]
目标决策树训练模块73,用于通过多个子训练集对决策树模型进行训练,得到目标决策树;
[0098]
声学特征提取模块74,用于获取历史语音数据,并对历史语音数据进行声学特征提取,得到声学特征;
[0099]
目标语音模型生成模块75,用于基于声学特征进行语音特征分析,得到分析结果,并通过预设模型对分析结果进行模式匹配,得到目标语音模型;
[0100]
信息推荐模块76,用于获取目标客户信息,并基于目标决策树和目标语音模型对目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将目标推荐产品和推荐话术推送至目标客户。
[0101]
进一步的,目标决策树训练模块73包括:
[0102]
基尼指数计算子模块,用于计算多个子训练集的基尼指数;
[0103]
决策树构建子模块,用于构建将多个子训练集的决策树,并基于基尼指数确定最优特征和最优分割点;
[0104]
递归分割子模块,用于根据最优特征和最优分割点对决策树进行递归分割,得到初始决策树;
[0105]
目标决策树生成子模块,用于计算初始决策树的预测误差,并基于预测误差,对初始决策树进行剪枝处理,得到目标决策树。
[0106]
进一步的,目标决策树生成子模块包括:
[0107]
预测误差计算单元,用于计算初始决策树的预测误差;
[0108]
节点剪枝单元,用于通过预测误差对初始决策树的每个节点进行节点剪枝处理,得到剪枝后的决策树;
[0109]
子树序列生成单元,用于判断剪枝后的决策树的根节点是否构成单独树,若否,则重复对初始决策树进行剪枝处理,直至剪枝后的决策树的根节点构成单独树,得到子树序列;
[0110]
交叉验证单元,用于采用交叉验证的方式,对子树序列进行验证处理,得到目标决策树。
[0111]
进一步的,声学特征提取模块74包括:
[0112]
基础语音段生成子模块,用于获取历史语音数据,并对历史语音数据进行预处理,得到基础语音段;
[0113]
梅尔频率生成子模块,用于通过对基础语音段进行信号转化处理,得到梅尔频率;
[0114]
声学特征生成子模块,用于采用倒谱分析的方式,对梅尔频率进行声学特征提取,得到声学特征。
[0115]
进一步的,基础语音段生成子模块包括:
[0116]
静音切除单元,用于获取历史语音数据,并对历史语音数据进行静音切除处理,得到有效语音段;
[0117]
去噪处理单元,用于对有效语音段进行去噪处理,得到去噪后的有效语音段;
[0118]
语音增强单元,用于通过谱减法对去噪后的有效语音段进行语音增强处理,得到基础语音段。
[0119]
进一步的,静音切除单元包括:
[0120]
端点检测子单元,用于获取历史语音数据,并对历史语音数据进行端点检测,识别历史语音数据中的语音段信号和非语音段信号;
[0121]
连续语音段获取子单元,用于确定语音段信号的前端点和后端点,并基于前端点和后端点,获取语音段信号中的连续语音段;
[0122]
有效语音段检测子单元,用于对连续语音段进行语音检测,得到有效语音段。
[0123]
进一步的,信息推荐模块76包括:
[0124]
目标推荐成品生产子模块,用于获取目标客户信息,并通过目标决策树对目标客户信息进行分析处理,得到目标推荐产品;
[0125]
推荐话术输出子模块,用于通过目标语音模型匹配目标推荐产品,输出推荐话术;
[0126]
推荐信息反馈子模块,用于将目标推荐产品和推荐话术推送至目标客户。
[0127]
需要强调的是,为进一步保证上述目标客户信息的私密和安全性,上述目标客户信息还可以存储于一区块链的节点中。
[0128]
为解决上述技术问题,本技术实施例还提供计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
[0129]
计算机设备8包括通过系统总线相互通信连接存储器81、处理器82、网络接口83。需要指出的是,图中仅示出了具有三种组件存储器81、处理器82、网络接口83的计算机设备8,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储
的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
[0130]
计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
[0131]
存储器81至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器81可以是计算机设备8的内部存储单元,例如该计算机设备8的硬盘或内存。在另一些实施例中,存储器81也可以是计算机设备8的外部存储设备,例如该计算机设备8上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,存储器81还可以既包括计算机设备8的内部存储单元也包括其外部存储设备。本实施例中,存储器81通常用于存储安装于计算机设备8的操作系统和各类应用软件,例如基于随机森林的信息推荐方法的程序代码等。此外,存储器81还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0132]
处理器82在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器82通常用于控制计算机设备8的总体操作。本实施例中,处理器82用于运行存储器81中存储的程序代码或者处理数据,例如运行上述基于随机森林的信息推荐方法的程序代码,以实现基于随机森林的信息推荐方法的各种实施例。
[0133]
网络接口83可包括无线网络接口或有线网络接口,该网络接口83通常用于在计算机设备8与其他电子设备之间建立通信连接。
[0134]
本技术还提供了另一种实施方式,即提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序可被至少一个处理器执行,以使至少一个处理器执行如上述的一种基于随机森林的信息推荐方法的步骤。
[0135]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例的方法。
[0136]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0137]
显然,以上所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例,附
图中给出了本技术的较佳实施例,但并不限制本技术的专利范围。本技术可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本技术的公开内容的理解更加透彻全面。尽管参照前述实施例对本技术进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本技术说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本技术专利保护范围之内。
技术特征:
1.一种基于随机森林的信息推荐方法,其特征在于,包括:获取样本数据集,其中,所述样本数据集包括产品信息、客户信息以及经纪人信息;采用预设方式,对所述样本数据集进行抽取样本,得到多个子训练集;通过多个所述子训练集对决策树模型进行训练,得到目标决策树;获取历史语音数据,并对所述历史语音数据进行声学特征提取,得到声学特征;基于所述声学特征进行语音特征分析,得到分析结果,并通过预设模型对所述分析结果进行模式匹配,得到目标语音模型;获取目标客户信息,并基于所述目标决策树和所述目标语音模型对所述目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将所述目标推荐产品和所述推荐话术推送至目标客户。2.根据权利要求1所述的基于随机森林的信息推荐方法,其特征在于,所述通过多个所述子训练集对决策树模型进行训练,得到目标决策树,包括:计算多个所述子训练集的基尼指数;构建将多个所述子训练集的决策树,并基于所述基尼指数确定最优特征和最优分割点;根据所述最优特征和所述最优分割点对所述决策树进行递归分割,得到初始决策树;计算所述初始决策树的预测误差,并基于所述预测误差,对所述初始决策树进行剪枝处理,得到所述目标决策树。3.根据权利要求2所述的基于随机森林的信息推荐方法,其特征在于,所述计算所述初始决策树的预测误差,并基于所述预测误差,对所述初始决策树进行剪枝处理,得到所述目标决策树,包括:计算所述初始决策树的预测误差;通过所述预测误差对所述初始决策树的每个节点进行节点剪枝处理,得到剪枝后的决策树;判断所述剪枝后的决策树的根节点是否构成单独树,若否,则重复对所述初始决策树进行剪枝处理,直至所述剪枝后的决策树的根节点构成单独树,得到子树序列;采用交叉验证的方式,对所述子树序列进行验证处理,得到所述目标决策树。4.根据权利要求1所述的基于随机森林的信息推荐方法,其特征在于,所述获取历史语音数据,并对所述历史语音数据进行声学特征提取,得到声学特征,包括:获取所述历史语音数据,并对所述历史语音数据进行预处理,得到基础语音段;通过对所述基础语音段进行信号转化处理,得到梅尔频率;采用倒谱分析的方式,对所述梅尔频率进行声学特征提取,得到所述声学特征。5.根据权利要求4所述的基于随机森林的信息推荐方法,其特征在于,所述获取所述历史语音数据,并对所述历史语音数据进行预处理,得到基础语音段,包括:获取所述历史语音数据,并对所述历史语音数据进行静音切除处理,得到有效语音段;对所述有效语音段进行去噪处理,得到去噪后的有效语音段;通过谱减法对所述去噪后的有效语音段进行语音增强处理,得到所述基础语音段。6.根据权利要求5所述的基于随机森林的信息推荐方法,其特征在于,所述获取所述历史语音数据,并对所述历史语音数据进行静音切除处理,得到有效语音段,包括:
获取所述历史语音数据,并对所述历史语音数据进行端点检测,识别所述历史语音数据中的语音段信号和非语音段信号;确定所述语音段信号的前端点和后端点,并基于所述前端点和所述后端点,获取所述语音段信号中的连续语音段;对所述连续语音段进行语音检测,得到所述有效语音段。7.根据权利要求1至6任一项所述的基于随机森林的信息推荐方法,其特征在于,所述获取目标客户信息,并基于所述目标决策树和所述目标语音模型对所述目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将所述目标推荐产品和所述推荐话术推送至目标客户,包括:获取所述目标客户信息,并通过所述目标决策树对所述目标客户信息进行分析处理,得到所述目标推荐产品;通过所述目标语音模型匹配所述目标推荐产品,输出所述推荐话术;将所述目标推荐产品和所述推荐话术推送至目标客户。8.一种基于随机森林的信息推荐装置,其特征在于,包括:样本数据集获取模块,用于获取样本数据集,其中,所述样本数据集包括产品信息、客户信息以及经纪人信息;子训练集生成模块,用于采用预设方式,对所述样本数据集进行抽取样本,得到多个子训练集;目标决策树训练模块,用于通过多个所述子训练集对决策树模型进行训练,得到目标决策树;声学特征提取模块,用于获取历史语音数据,并对所述历史语音数据进行声学特征提取,得到声学特征;目标语音模型生成模块,用于基于所述声学特征进行语音特征分析,得到分析结果,并通过预设模型对所述分析结果进行模式匹配,得到目标语音模型;信息推荐模块,用于获取目标客户信息,并基于所述目标决策树和所述目标语音模型对所述目标客户信息进行特征分析,得到目标推荐产品和推荐话术,并将所述目标推荐产品和所述推荐话术推送至目标客户。9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于随机森林的信息推荐方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于随机森林的信息推荐方法。
技术总结
本申请涉及人工智能技术领域,揭露一种基于随机森林的信息推荐方法、装置、设备及存储介质,其中方法包括获取样本数据集,并对样本数据集进行抽取样本,得到多个子训练集;通过多个子训练集对决策树模型进行训练,得到目标决策树;获取历史语音数据,并对历史语音数据进行声学特征提取,得到声学特征;基于声学特征进行分析,得到目标语音模型;获取目标客户信息,并基于目标决策树和目标语音模型对目标客户信息进行特征分析,并将得到的目标推荐产品和推荐话术推送至目标客户。本申请还涉及区块链技术,目标客户信息存储于区块链中。本申请精准分析客户对相应信息的偏好程度以及相匹配的推荐话术,有利于提高信息推荐的效率。有利于提高信息推荐的效率。有利于提高信息推荐的效率。
技术研发人员:赵俊杰
受保护的技术使用者:未鲲(上海)科技服务有限公司
技术研发日:2022.03.23
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-12934.html