1.本发明涉及大数据处理技术领域,特别是一种全球外贸客户客户画像精准分析系统。
背景技术:
2.用户画像,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。
3.在全球贸易的大数据时代,各个渠道获得的用户数据数量巨大并且客户种类存在巨大差异,现阶段的用户画像分析系统适用性和推广范围较窄,对海外企业的信息采集、分析精度和效果一般,难以满足日益增长的全球客户客户画像数据的采集、分析、挖掘等操作,给全球外贸客户画像的企业和用户带来了困扰,为此提出一种全球外贸客户客户画像精准分析系统。
技术实现要素:
4.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
5.鉴于上述现有的客户画像大数据处理中存在的问题,提出了本发明。
6.因此,本发明其中的一个目的是提供一种全球外贸客户客户画像精准分析系统,其利用边缘计算、大数据处理和云端服务平台,其客户画像资源数据互通,可准确的对不同的资源种类进行数据划分和计算信息分配,分析效果佳,并改善了多个边缘计算节点的采集模块,提高采集数据的精准性和全面性。
7.为解决上述技术问题,本发明提供如下技术方案:本发明的一种全球外贸客户客户画像精准分析系统,包括:
8.边缘计算采集模块,用于获取实时产生的海外企业客户画像数据,海外企业客户画像数据包括与客户有关的数据;
9.大数据处理模块,用于对获取的客户画像数据进行分析,包括至少一个边缘数据处理器、计算信息分配单元、寻址转移器单元、大数据挖掘单元、共享数据单元、状态监控单元和大数据信息存储单元;
10.分析数据输出模块,用于输出经大数据处理模块处理后的客户画像数据;
11.其中,边缘计算采集模块将获取的海外企业客户画像数据生成客户画像模型,海外企业客户画像模型通过大数据挖掘单元,与国内外贸企业的目标客户模型进行匹配分析,依据数据关联的相关性评分高低进行排序,完成对全球外贸客户的客户画像精准分析;
12.云端服务平台,用于企业端和用户端之间的网络服务,为客户画像数据提供数据
传输,包括访问账号管理单元和功能使用单元;进一步的,计算信息分配单元通过对客户画像数据的数据聚类分析,并根据边缘计算的预设资源种类进行数据划分,将目标数据划分为至少一个数据块种类,获得数据集后装载子数据集,并创建共享空间分配至用户端,分配共享数据空间至云端服务平台。
13.计算信息分配单元用于划分海外企业客户画像数据至对应类别匹配块;
14.大数据挖掘单元用于对海外企业客户画像数据,在对应类别匹配块中进行关键词匹配和图片匹配,每命中一次关键词计数加1分,不同的文字出现的地方会有不同的权重,具体相对权重表如下:
15.序号类别权重1工商注册信息10%2网站title20%3网站keyword20%4网站description10%5网页文字10%6社交媒体发布信息8%7海关数据交易信息12%8产品细分关键词10%
16.大数据挖掘单元的关键词匹配计算公式(1),得到关键词文字匹配得分sk,
17.具体如下:
[0018][0019]
公式(1)中,ai表示对应类别中关键词匹配命中的次数,bi表示该类别对应的权重;
[0020]
图片匹配具体为通过机器学习的方法对国内出口商的产品图片及已经合作国外产品客户的图片进行特征值提取,然后对采集的国外采购商的产品图片随机挑选10张与特征库进行比对打分,其中每张图片最高1分,最低0分;
[0021]
大数据挖掘单元的图片匹配计算公式(2),得到图片匹配得分s
p
,具体如下:
[0022][0023]
公式(2)中,ci表示每张图片的匹配分值,
[0024]
国内外贸企业的目标客户模型具体为对关键词文字匹配得分sk和图片匹配得分s
p
打分并按照各50%的权重汇总如公式(3),得到匹配度总分s,具体如下:
[0025][0026]
大数据挖掘单元的对应类别匹配块包括工商注册信息匹配块、网站信息匹配块、社交媒体发布信息匹配块、财务信息匹配块、海关数据交易信息匹配块、业务经营信息匹配块、产品细分关键词信息匹配块和决策联系人信息匹配块。
[0027]
海外企业客户画像数据在云端服务平台中通过域名、邮箱或公司名称来深度挖掘当前企业信息,客户有关的数据包括公司简介、联系人邮箱、产品图片、采购信息、客户位置、类似客户和新闻舆情。
[0028]
边缘计算采集模块,设有多个边缘数据采集终端,多个边缘数据采集终端均配置web数据获取模块以及广播模块;
[0029]
边缘数据采集终端利用web数据获取模块实时获取在预设网站上的产生的客户有关的数据进行采集;
[0030]
相对应的边缘数据采集终端利用广播模块广播自身的位置信息,获取在预定范围内客户画像数据中的公司所在地信息。
[0031]
客户有关的数据选取web数据获取模块导入计算信息分配单元中对应类别匹配块,以及广播模块预设范围内获取的公司所在地信息,进行数据划分当前客户有关的数据信息至大数据挖掘单元中;
[0032]
公司信息及产品图片采用http的方式从公司网站及社交媒体公司主页采集;
[0033]
金融交易和财务信息从sec.org中采用api方式先获取xbrl文件格式数据,然后转换为标准化json,从年度和季度报告中提取财务报表,包括共同基金和etf的风险回报摘要产品、损益表、资产负债表和现金流量表完全标准化为json格式,然后加载到elasticsearch中获得。
[0034]
公司信息设为工商注册信息、网站信息、社交媒体发布信息、业务经营信息、产品细分关键词信息和决策联系人信息;
[0035]
公司信息还包括公司网站域名、公司邮箱、公司行业、公司规模人数、公司成立时间、以及公司现在地址和简要的介绍信息;
[0036]
金融交易设为海关数据交易信息。
[0037]
网站信息包括网站title、网站keyword、网站description和网页文字;
[0038]
社交媒体发布信息包括客户评价信息;
[0039]
云端服务平台还包括重点客户存储单元和邮箱列表管理单元;
[0040]
重点客户存储单元用于用户端存储重点客户的客户画像信息;
[0041]
邮箱列表管理单元用于用户端管理大数据挖掘单元中客户邮箱块输出的客户邮箱信息,包括邮箱筛选、导出邮箱和邮箱清空。
[0042]
云端服务平台中功能使用单元还包括邮箱验证单元和翻译工具单元;
[0043]
邮箱验证单元用于验证大数据处理模块中至少一个海外企业客户的邮箱经分配划分后对应的海外企业客户对应类别匹配邮箱,并导出当前验证结果至分析数据输出模块;
[0044]
翻译工具单元用于翻译客户画像精准分析系统中不同语言文本。
[0045]
寻址转移器单元接收访问调度体模块输入地址,根据虚拟内存地址进行解析,获得大数据处理模块内存物理地址,进行信息交互,根据数据地址访问共享数据单元中地址获取数据;
[0046]
共享数据单元用于在大数据处理模块中开设共享数据空间,利用共享数据空间与至少一个边缘数据处理器进行数据交互;
[0047]
状态监控单元用于动态监视任务数组中各任务运行状态,获取海外企业客户画像数据的异常数据;
[0048]
大数据信息存储单元用于存储获取边缘计算采集模块的客户有关的数据信息、大数据处理模块的处理信息以及分析数据输出模块的输出信息。
[0049]
本发明的有益效果:本发明全球外贸客户客户画像精准分析系统利用边缘计算、大数据处理和云端服务平台,此系统中客户画像资源数据互通,可准确的对不同的资源种类进行数据划分和计算信息分配,后进行精准挖掘匹配,满足了全球外贸客户的需求;同时分析挖掘范围广泛、效果佳,并改善了多个边缘计算节点的采集模块、信息交互共享数据功能、监控异常数据功能以及存储功能,提高采集数据的精准性、全面性、安全性和适用性,进而满足了全球外贸客户画像的企业和用户日益需求。
附图说明
[0050]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0051]
图1为本发明客户画像精准分析系统的模块化结构示意图;
[0052]
图2为本发明大数据挖掘单元的结构图。
具体实施方式
[0053]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
[0054]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0055]
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0056]
参照图1-图2,为本发明的一个实施例,该实施例提供了一种全球外贸客户客户画像精准分析系统,包括边缘计算采集模块,用于获取实时产生的海外企业客户画像数据,海外企业客户画像数据包括与客户有关的数据;大数据处理模块,用于对获取的客户画像数据进行分析,包括至少一个边缘数据处理器、计算信息分配单元、寻址转移器单元、大数据挖掘单元、共享数据单元、状态监控单元和大数据信息存储单元;分析数据输出模块,用于输出经大数据处理模块处理后的客户画像数据;其中,边缘计算采集模块将获取的海外企业客户画像数据生成客户画像模型,海外企业客户画像模型通过大数据挖掘单元,与国内外贸企业的目标客户模型进行匹配分析,依据数据关联的相关性评分高低进行排序,完成对全球外贸客户的客户画像精准分析;云端服务平台,用于企业端和用户端之间的网络服务,为客户画像数据提供数据传输,包括访问账号管理单元和功能使用单元;进一步的,计算信息分配单元通过对客户画像数据的数据聚类分析,并根据边缘计算的预设资源种类进行数据划分,将目标数据划分为至少一个数据块种类,获得数据集后装载子数据集,并创建共享空间分配至用户端,分配共享数据空间至云端服务平台。
[0057]
具体的,本实施例中
[0058]
计算信息分配单元用于划分海外企业客户画像数据至对应类别匹配块;
[0059]
大数据挖掘单元用于对海外企业客户画像数据,在对应类别匹配块中进行关键词匹配和图片匹配,大数据挖掘单元的关键词匹配计算公式(1),得到关键词文字匹配得分sk,具体如下:
[0060][0061]
公式(1)中,ai表示对应类别中关键词匹配命中的次数,bi表示该类别对应的权重;本实施例在实施时根据关键词进行文字匹配,每命中一次关键词计数加1分,但是不同的文字出现的地方会有不同的权重,具体相对权重表(1)如下:
[0062]
序号类别权重1工商注册信息10%2网站title20%3网站keyword20%4网站description10%5网页文字10%6社交媒体发布信息8%7海关数据交易信息12%8产品细分关键词10%
[0063]
图片匹配具体为通过机器学习的方法对国内出口商的产品图片及已经合作国外产品客户的图片进行特征值提取,然后对采集的国外采购商的产品图片随机挑选10张与特征库进行比对打分,其中每张图片最高1分,最低0分;
[0064]
大数据挖掘单元的图片匹配计算公式(2),得到图片匹配得分s
p
,具体如下:
[0065][0066]
公式(2)中,ci表示每张图片的匹配分值,
[0067]
国内外贸企业的目标客户模型具体为对关键词文字匹配得分sk和图片匹配得分s
p
打分并按照各50%的权重汇总如公式(3),得到匹配度总分s,具体如下:
[0068][0069]
上述大数据挖掘单元的对应类别匹配块包括工商注册信息匹配块、网站信息匹配块、社交媒体发布信息匹配块、财务信息匹配块、海关数据交易信息匹配块、业务经营信息匹配块、产品细分关键词信息匹配块和决策联系人信息匹配块通过这些信息生成客户画像模型,然后与国内外贸企业的目标客户模型进行匹配,依据相关性评分高低排序。
[0070]
进一步具体说明的,海外企业客户画像数据在云端服务平台中通过域名、邮箱或公司名称来深度挖掘当前企业信息,客户有关的数据包括公司简介、联系人邮箱、产品图片、采购信息、客户位置、类似客户和新闻舆情。
[0071]
需要说明的,寻址转移器单元接收访问调度体模块输入地址,根据虚拟内存地址进行解析,获得大数据处理模块内存物理地址,进行信息交互,根据数据地址访问共享数据单元中地址获取数据;共享数据单元用于在大数据处理模块中开设共享数据空间,利用共享数据空间与至少一个边缘数据处理器进行数据交互;状态监控单元用于动态监视任务数组中各任务运行状态,获取海外企业客户画像数据的异常数据;大数据信息存储单元用于
存储获取边缘计算采集模块的客户有关的数据信息、大数据处理模块的处理信息以及分析数据输出模块的输出信息。
[0072]
本实施例较佳的边缘计算采集模块设置,设有多个边缘数据采集终端,多个边缘数据采集终端均配置web数据获取模块以及广播模块;边缘数据采集终端利用web数据获取模块实时获取在预设网站上的产生的客户有关的数据进行采集;相对应的边缘数据采集终端利用广播模块广播自身的位置信息,获取在预定范围内客户画像数据中的公司所在地信息。。
[0073]
具体的,客户有关的数据选取web数据获取模块导入计算信息分配单元中对应类别匹配块,以及广播模块预设范围内获取的公司所在地信息,进行数据划分当前客户有关的数据信息至大数据挖掘单元中;公司信息及产品图片采用http的方式从公司网站及社交媒体公司主页采集;金融交易和财务信息从sec.org中采用api方式先获取xbrl文件格式数据,然后转换为标准化json,从年度和季度报告中提取财务报表,包括共同基金和etf的风险回报摘要产品、损益表、资产负债表和现金流量表完全标准化为json格式,然后加载到elasticsearch中获得。
[0074]
上述公司信息设为工商注册信息、网站信息、社交媒体发布信息、业务经营信息、产品细分关键词信息和决策联系人信息;公司信息还包括公司网站域名、公司邮箱、公司行业、公司规模人数、公司成立时间、以及公司现在地址和简要的介绍信息;金融交易设为海关数据交易信息。
[0075]
进一步的,网站信息包括网站title、网站keyword、网站description和网页文字;社交媒体发布信息包括客户评价信息;海关数据交易信息包括采购周期信息、采购规模信息和采购国家信息。
[0076]
需要说明的本实施例的云端服务平台还包括重点客户存储单元和邮箱列表管理单元;重点客户存储单元用于用户端存储重点客户的客户画像信息;邮箱列表管理单元用于用户端管理大数据挖掘单元中客户邮箱块输出的客户邮箱信息,包括邮箱筛选、导出邮箱和邮箱清空。
[0077]
本实施例云端服务平台优选的,还包括邮箱验证单元和翻译工具单元;邮箱验证单元用于验证大数据处理模块中至少一个海外企业客户的邮箱经分配划分后对应的海外企业客户对应类别匹配邮箱,并导出当前验证结果至分析数据输出模块;翻译工具单元用于翻译客户画像精准分析系统中不同语言文本。
[0078]
用户登录云端服务平台操作具体原理为:用户登录云端服务平台时可通过访问账号管理单元进行账号登录和账号注册,登录首页后可进行大数据挖掘功能,大数据挖掘单元包括查询域名功能块、邮箱查询功能块和客户画像详细信息查询功能块,进而可以进行名称或者域名的输入然后进行客户的搜索挖掘,进行域名查询、进行邮箱客户挖掘,可将客户保存到重点客户中以及导出邮箱,进行对应关键名称的词条的网站的域名的搜索,并且系统会自动在网络中进行自动的域名的匹配挖掘,可以进行其他相关的关键名称的延伸查看,用户在接界面中可以进行不同公司的查看,用户在界面中可以进行不同公司的浏览以及进行不同公司以及网站的选择;还可以进行网站邮箱的挖掘工作,用户在挖掘完成之后可以进行邮箱详情的查看,系统会自动收集邮箱的信息,然后用户可以进行详情的查看,点击邮箱后,即可进行邮箱的查看,可以进行公司的详细信息的查看,同时也可以进行点击进
行信息的切换,进行公司基本信息的查看,如网站、行业、规模人数以及成立时间,还有公司现在地址以及简要的介绍等信息,以及公司金融交易信息、公司产品图片信息的查看。上述查看工作均可保存到重点客户进行存储,同时可进行邮箱列表的管理,邮箱筛选、导出邮箱和清空操作,以及进行邮箱验证,对单个邮箱或批量邮箱的验证工作,用户输入邮箱点击验证之后,等待一段时间就可以进行验证结果的查看,同时导出当前验证结果,此外在云端服务平台操作时,可通过翻译工具单元对当前界面文字进行实时的翻译,以方便查阅。
[0079]
综上,本发明全球外贸客户客户画像精准分析系统利用边缘计算、大数据处理和云端服务平台,此系统中客户画像资源数据互通,可准确的对不同的资源种类进行数据划分和计算信息分配,用户可大数据挖掘客户画像的网站域名、邮箱、以及公司的详细信息,分析挖掘范围广泛、效果佳,并改善了多个边缘计算节点的采集模块、信息交互共享数据功能、监控异常数据功能以及存储功能,提高采集数据的精准性、全面性、安全性和适用性,进而满足了全球外贸客户画像的企业和用户日益需求。
[0080]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
转载请注明原文地址:https://tc.8miu.com/read-2200.html