1.本发明属于数据推荐算法技术领域,具体为一种适应不同购房者需求的推荐系统算法。
背景技术:
2.现在的时代买房成为了一种主流,但是在大多数情况下,自己所需求的楼盘与大多数情况下系统推荐的楼盘不一致,需要用户自己慢慢的观察细看,效率低下,推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西,目前应用推荐算法比较好的地方主要是网络,其中淘宝做的比较好。所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。
3.但是现有的推荐算法对于用户的匹配度不够精确,且效率低下,同时由于用户大多会在手机上浏览自己喜欢的房源或是户型。因此需要对数据推荐算法加以改进,同时提出一种适应不同购房者需求的推荐系统算法,便于更好的解决上述提出的问题。
技术实现要素:
4.本发明的目的在于:为了解决上述提出的问题,提供一种适应不同购房者需求的推荐系统算法。
5.本发明采用的技术方案如下:一种适应不同购房者需求的推荐系统算法,包括,所述适应不同购房者需求的推荐系统算法包括中心数据库、数据调取模块、数据分类模块、用户标签模块、数据匹配模块、数据排序模块,所述用户标签模块的输出端与数据调取模块的输入端连接,所述数据调取模块的输出端与数据分类模块的输入端连接,所述中心数据库的输出端与数据调取模块的输入端连接,所述数据分类模块的输出端与数据排序模块的输入端连接,所述数据排序模块的输出端与数据匹配模块的输入端连接,所述数据匹配模块将最终匹配的数据传输到用户观看数据中。
6.在一优选的实施方式中,所述用户标签模块即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。
7.在一优选的实施方式中,所述用户标签的建设方法如下:
①
确定用户画像基础;
②
根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度确定数据指标体系;
③
标签数据存储:标签相关数据可存储在hive、mysql、hbase、elasticsearch等数据库中,不同存储方式适用于不同的应用场景;
④
标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提
供接口服务等开发内容。
8.⑤
开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优;
⑥
作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来;
⑦
用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上,产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等;
⑧
用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、push消息的精准推送、客服针对用户的不同话术、针对高价值用户的高匹配度数据进行精确推送。
9.在一优选的实施方式中,所述数据调取模块是基于爬虫网络对用户长期浏览的数据进行搜索抓取,整个系统一般采用插件的形式,通过一个插件管理服务程序,遇到不同格式的网页采用不同的插件处理,这种方式的好处在于扩充性好,以后每发现一种新的类型,就可以把其处理方式做成一个插件补充到插件管理服务程序之中,一般来说,网络爬虫在更新网站内容的时候,不用把网站网页重新抓取一遍,对于大部分的网页,只需要判断网页的属性(主要是日期),把得到的属性和上次抓取的属性相比较,如果一样则不用更新。
10.在一优选的实施方式中,所述网络爬虫的数据调取方法如下:(1)利用爬虫系统程序,自动访问互联网,并沿着任何网页中的所有url爬到其它网页,重复这过程,并把爬过的所有网页收集回来;(2)由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息;(3)根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库,并将索引数据库并入中心数据库。
11.在一优选的实施方式中,所述数据分类模块主要使用贝叶斯网络,所述贝叶斯网络本身是一种不定性因果关联模型,贝叶斯网络与其他决策模型不同,它本身是将多元知识图解可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关系,进而加快数据分类的速度,提高检索效率。
12.在一优选的实施方式中,所述数据排序模块主要负责关键词排序,当输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,然后根据相关度、网页权重、网页体验度等进行排序,总分值越高,排名越靠前最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给数据匹配模块。
13.在一优选的实施方式中,所述数据匹配模块是数据之间按照某种内在关系进行配准,对表示地理实体的空间数据而言,包含两个方面的处理:一是实体之间在空间位置上相互联系所要求的处理,一是数据本身由于数据源不同,数据获取方式或时间不同所要求的处理,同时,将对各类数据分别对于高匹配度的用户进行全方位的数据推送。
14.综上所述,由于采用了上述技术方案,本发明的有益效果是:1、本发明中,用户标签模块即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌,便于自动匹配最接近的房源给客户选择,针对高价值用户的高匹配度数据进行精确推送。
15.2、本发明中,当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,然后根据相关度、网页权重、网页体验度等进行排序,总分值越高,排名越靠前最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给数据匹配模块,同时,将对各类数据分别对于高匹配度的用户进行全方位的数据推送,加快推送效率与推送深度。
附图说明
16.图1为本发明的系统结构示意图;图2为本发明中用户标签的建设流程图;图3为本发明中数据调取流程图。
具体实施方式
17.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
18.参照图1-3,一种适应不同购房者需求的推荐系统算法,适应不同购房者需求的推荐系统算法包括中心数据库、数据调取模块、数据分类模块、用户标签模块、数据匹配模块、数据排序模块,用户标签模块的输出端与数据调取模块的输入端连接,数据调取模块的输出端与数据分类模块的输入端连接,中心数据库的输出端与数据调取模块的输入端连接,数据分类模块的输出端与数据排序模块的输入端连接,数据排序模块的输出端与数据匹配模块的输入端连接,数据匹配模块将最终匹配的数据传输到用户观看数据中。
19.用户标签模块即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。
20.用户标签的建设方法如下:
①
确定用户画像基础;
②
根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度确定数据指标体系;
③
标签数据存储:标签相关数据可存储在hive、mysql、hbase、elasticsearch等数据库中,不同存储方式适用于不同的应用场景;
④
标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。
21.⑤
开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优;
⑥
作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来;
⑦
用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上,产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等;
⑧
用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、push消息的精准推送、客服针对用户的不同话术、针对高价值用户的高匹配度数据进行精确推送。
22.数据调取模块是基于爬虫网络对用户长期浏览的数据进行搜索抓取,整个系统一般采用插件的形式,通过一个插件管理服务程序,遇到不同格式的网页采用不同的插件处理,这种方式的好处在于扩充性好,以后每发现一种新的类型,就可以把其处理方式做成一个插件补充到插件管理服务程序之中,一般来说,网络爬虫在更新网站内容的时候,不用把网站网页重新抓取一遍,对于大部分的网页,只需要判断网页的属性(主要是日期),把得到的属性和上次抓取的属性相比较,如果一样则不用更新。
23.网络爬虫的数据调取方法如下:(1)利用爬虫系统程序,自动访问互联网,并沿着任何网页中的所有url爬到其它网页,重复这过程,并把爬过的所有网页收集回来;(2)由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息;(3)根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库,并将索引数据库并入中心数据库。
24.数据分类模块主要使用贝叶斯网络,贝叶斯网络本身是一种不定性因果关联模型,贝叶斯网络与其他决策模型不同,它本身是将多元知识图解可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关系,进而加快数据分类的速度,提高检索效率。
25.数据排序模块主要负责关键词排序,当输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,然后根据相关度、网页权重、网页体验度等进行排序,总分值越高,排名越靠前最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给数据匹配模块。
26.数据匹配模块是数据之间按照某种内在关系进行配准,对表示地理实体的空间数据而言,包含两个方面的处理:一是实体之间在空间位置上相互联系所要求的处理,一是数据本身由于数据源不同,数据获取方式或时间不同所要求的处理,同时,将对各类数据分别对于高匹配度的用户进行全方位的数据推送。
27.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种适应不同购房者需求的推荐系统算法,其特征在于:所述适应不同购房者需求的推荐系统算法包括中心数据库、数据调取模块、数据分类模块、用户标签模块、数据匹配模块、数据排序模块,所述用户标签模块的输出端与数据调取模块的输入端连接,所述数据调取模块的输出端与数据分类模块的输入端连接,所述中心数据库的输出端与数据调取模块的输入端连接,所述数据分类模块的输出端与数据排序模块的输入端连接,所述数据排序模块的输出端与数据匹配模块的输入端连接,所述数据匹配模块将最终匹配的数据传输到用户观看数据中。2.如权利要求1所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述用户标签模块即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。3.如权利要求2所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述用户标签的建设方法如下:
①
确定用户画像基础;
②
根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度确定数据指标体系;
③
标签数据存储:标签相关数据可存储在hive、mysql、hbase、elasticsearch等数据库中,不同存储方式适用于不同的应用场景;
④
标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容;
⑤
开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优;
⑥
作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来;
⑦
用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上,产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等;
⑧
用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、push消息的精准推送、客服针对用户的不同话术、针对高价值用户的高匹配度数据进行精确推送。4.如权利要求1所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述数据调取模块是基于爬虫网络对用户长期浏览的数据进行搜索抓取,整个系统一般采用插件的形式,通过一个插件管理服务程序,遇到不同格式的网页采用不同的插件处理,这种方式的好处在于扩充性好,以后每发现一种新的类型,就可以把其处理方式做成一个插件补充到插件管理服务程序之中,一般来说,网络爬虫在更新网站内容的时候,不用把网站网页重新抓取一遍,对于大部分的网页,只需要判断网页的属性(主要是日期),把得到的属性和上次抓取的属性相比较,如果一样则不用更新。5.如权利要求4所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述网络爬虫的数据调取方法如下:(1)利用爬虫系统程序,自动访问互联网,并沿着任何网页中的所有url爬到其它网页,
重复这过程,并把爬过的所有网页收集回来;(2)由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息;(3)根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库,并将索引数据库并入中心数据库。6.如权利要求1所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述数据分类模块主要使用贝叶斯网络,所述贝叶斯网络本身是一种不定性因果关联模型,贝叶斯网络与其他决策模型不同,它本身是将多元知识图解可视化的一种概率知识表达与推理模型,更为贴切地蕴含了网络节点变量之间的因果关系及条件相关关系,进而加快数据分类的速度,提高检索效率。7.如权利要求1所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述数据排序模块主要负责关键词排序,当输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,然后根据相关度、网页权重、网页体验度等进行排序,总分值越高,排名越靠前最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给数据匹配模块。8.如权利要求1所述的一种适应不同购房者需求的推荐系统算法,其特征在于:所述数据匹配模块是数据之间按照某种内在关系进行配准,对表示地理实体的空间数据而言,包含两个方面的处理:一是实体之间在空间位置上相互联系所要求的处理,一是数据本身由于数据源不同,数据获取方式或时间不同所要求的处理,同时,将对各类数据分别对于高匹配度的用户进行全方位的数据推送。
技术总结
本发明公开了一种适应不同购房者需求的推荐系统算法,所述适应不同购房者需求的推荐系统算法包括数据调取模块、数据分类模块、用户标签模块、数据匹配模块、数据排序模块,所述用户标签模块的输出端与数据调取模块的输入端连接,所述数据调取模块的输出端与数据分类模块的输入端连接,所述中心数据库的输出端与数据调取模块的输入端连接,所述数据分类模块的输出端与数据排序模块的输入端连接,所述数据排序模块的输出端与数据匹配模块的输入端连接,所述数据匹配模块将最终匹配的数据传输到用户观看数据中,本发明便于自动匹配最接近的房源给客户选择,针对用户的高匹配度数据进行精确推送,加快推送效率与推送深度。加快推送效率与推送深度。加快推送效率与推送深度。
技术研发人员:熊永汪
受保护的技术使用者:珠海横琴房馆信息科技有限公司
技术研发日:2020.11.23
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-21021.html