1.本发明涉及产业链优企筛选相关领域,尤其涉及一种基于机器学习的产业链优企特征优化方法及系统。
背景技术:
2.企业评估是将企业作为一个有机整体,依据企业特征结合宏观经济环境及行业背景,对企业整体公允进行的综合性评估。在现有技术中,主要通过对所在产业链企业群体进行小批量样本的调研分析,从而获得不同特征用来归纳通用性或差异化指标,同时与原有人工标记定义的优质高价值企业特征指标进行手工核对,进而实现判断归纳不同产业链企业的发展健康度特征的规律。
3.但在实现本技术中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
4.现有技术存在不能对产业链中全量企业样本进行充分分析,效率低耗时长,且存在即使手动归纳优企阈值后随着产业链中企业的成长演化无法自动更新优企阈值,导致企业筛选不够准确的技术问题。
技术实现要素:
5.本技术通过提供一种基于机器学习的产业链优企特征优化方法及系统,解决了现有技术存在不能对产业链中全量企业样本进行充分分析,效率低耗时长,且存在即使手动归纳优企阈值后随着产业链中企业的成长演化无法自动更新优企阈值的技术问题,达到根据采集特征进行自动提取分析,提高分析样本的充分度,提高分析效率,自动更新优企阈值,提高企业筛选的准确性的技术效果。
6.鉴于上述问题,提出了本技术提供一种基于机器学习的产业链优企特征优化方法及系统。
7.第一方面,本技术提供了一种基于机器学习的产业链优企特征优化方法,所述方法包括:获得企业信息集合;对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。
8.另一方面,本技术还提供了一种基于机器学习的产业链优企特征优化系统,所述系统包括:第一获得单元,所述第一获得单元用于获得企业信息集合;第二获得单元,所述第二获得单元用于对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;第三获得单元,所述第三获得单元用于获得第一企业的
基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;第四获得单元,所述第四获得单元用于获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;第五获得单元,所述第五获得单元用于根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;第一标识单元,所述第一标识单元用于根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。
9.第三方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。
10.第四方面,本技术提供了一种计算机程序产品,包括计算机程序和/或指令,该计算机程序和/或指令被处理器执行时实现第一方面任一项所述方法的步骤。
11.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:
12.由于采用了获得企业信息集合,对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息并进行稳定性评估,获得所述第一企业的稳定性评估参数;获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。达到根据采集特征进行自动提取分析,提高分析样本的充分度,提高分析效率,自动更新优企阈值,提高企业筛选的准确性的技术效果。
13.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
14.图1为本技术一种基于机器学习的产业链优企特征优化方法的流程示意图;
15.图2为本技术一种基于机器学习的产业链优企特征优化方法的获得所述稳定性评估参数的流程示意图;
16.图3为本技术一种基于机器学习的产业链优企特征优化方法的获得所述第一企业的成长等级和风险等级的流程示意图;
17.图4为本技术一种基于机器学习的产业链优企特征优化方法的获得所述企业生命线参数的流程示意图;
18.图5为本技术一种基于机器学习的产业链优企特征优化系统的结构示意图;
19.图6为本技术一种电子设备的结构示意图。
20.附图标记说明:第一获得单元11,第二获得单元12,第三获得单元13,第四获得单元14,第五获得单元15,第一标识单元16,电子设备50,处理器51,存储器52,输入装置53,输出装置54。
具体实施方式
21.本技术通过提供一种基于机器学习的产业链优企特征优化方法及系统,解决了现有技术存在不能对产业链中全量企业样本进行充分分析,效率低耗时长,且存在即使手动归纳优企阈值后随着产业链中企业的成长演化无法自动更新优企阈值的技术问题,达到根据采集特征进行自动提取分析,提高分析样本的充分度,提高分析效率,自动更新优企阈值,提高企业筛选的准确性的技术效果。下面结合附图,对本技术的实施例进行描述。本领域普通技术人员可知,随着技术的发展和新场景的出现,本技术提供的技术方案对于类似的技术问题,同样适用。
22.本技术的说明书和权利要求书及上述附图中的术语“第一”、第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本技术的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
23.申请概述
24.现有技术一般通过对所在产业链企业群体进行小批量样本的调研分析,从而获得不同特征用来归纳通用性或差异化指标,同时与原有人工标记定义的优质高价值企业特征指标进行手工核对,进而实现判断归纳不同产业链企业的发展健康度特征的规律,存在不能对产业链中全量企业样本进行充分分析,效率低耗时长,且存在即使手动归纳优企阈值后随着产业链中企业的成长演化无法自动更新优企阈值,导致企业筛选不够准确的技术问题。
25.针对上述技术问题,本技术提供的技术方案总体思路如下:
26.本技术提供了一种基于机器学习的产业链优企特征优化方法,所述方法包括:获得企业信息集合;对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。
27.在介绍了本技术基本原理后,下面将结合说明书附图来具体介绍本技术的各种非限制性的实施方式。
28.实施例一
29.如图1所示,本技术提供了一种基于机器学习的产业链优企特征优化方法,所述方法包括:
30.步骤s100:获得企业信息集合;
31.步骤s200:对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;
32.具体而言,所述企业信息集合包括多个企业的相关信息,如:发展阶段、成长路径、
人机料法环、商业模式、知识产权、技术先进性、订单与交付、风险状况、行业分布、物流地域、产业链稳定性、质量品控状况、政策干扰性等维度全样本数据信息,将同行业的企业作为同一样本集合,根据不同的行业信息获得对应的企业信息集合。所述噪声处理的过程为进行企业信息中干扰信息的弱化或压制的过程。一般利用因子分析、回归分析、逻辑回归、决策树等技术方法,进一步使用随机森林来移除噪声变量样本,从而计算出首版同行业企业各指标的上层较优样本数据作为该行业的锚定阈值集合(包扩多个特征的阈值),同时根据同行业中企业群的各表现指标与该首版参考阈值中相符的指标数量,以及算法会持续分析同行业新增企业样本信息和原企业中新增指标动态信息,算法保持对最新状态下同行业企业指标参考阈值的自优化,并持续计算输出符合参考阈值的最新样本目标,从而达到不同产业链不同行业优企特征阈值智能优化且持续自动推荐高价值企业的目的。通过所述锚定阈值集合的获取,为后续进行准确的企业分析提供了数据支持。
33.步骤s300:获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;
34.步骤s400:获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;
35.具体而言,所述第一企业为进行评价的目标企业,对所述第一企业进行对应的基础信息采集,所述基础信息包括:企业的成立信息,法人的信誉和关联公司信息、出资比例信息,企业的注册地址及其真实性信息,经营范围内容和变动情况信息等。根据所述基础信息进行所述第一企业的稳定性的初步评估,根据评估结果获得所述第一企业的稳定性评估参数。所述第一数据采集结果中采集的信息包括企业基本信息变更、今日业务情况、人员变更情况、经营是否异常、经营范围、知识产权、团队、产品信息等。根据所述第一数据采集结果获得所述第一企业的成长等级和风险等级。
36.进一步的,通过大数据构建,同行业下的数据模型,所述数据模型为根据同行业的数据变化和标识成长等级和风险等级的标识结果归类构建而成的进行智能数据分析处理的模型。将所述第一数据采集结果输入所述数据模型,获得所述第一企业的成长等级和风险等级,通过所述数据模型的构建,使得所述第一企业的成长等级和风险等级的分析更加的准确快速,进而为后续进行准确的企业评估提供了数据支持。
37.步骤s500:根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;
38.步骤s600:根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。
39.具体而言,所述企业生命线参数从至少三个维度进行评估获得,包括基础价值特征、创造价值特征和经营价值特征。所述基础价值特征为根据企业的基础属性特征评估获得,如企业的经营地址、企业的经营范围、企业的法人信息等。根据上述基础属性特征评估获得所述第一企业的基础价值特征。所述创造价值特征为包括专利申报数量、高新技术申请、创新类型证书数量等维度评估获得的特征。所述经营价值特征为以法律风险、人员变动、业务的履行信息维度评估获得的特征。根据上述基础价值特征、创造价值特征和经营价值特征分析评估结果获得所述第一企业的企业生命线参数。根据所述稳定性评估参数、所述成长等级和风险等级,结合企业生命线参数按照预定占比进行权重分配,将权重分配结
果进行价值分数集合确定,根据价值分数集合确定的结果进行所述第一企业的标识,根据表述结果进行所述第一企业的筛选处理。达到根据采集特征进行自动提取分析,提高分析样本的充分度,提高分析效率,自动更新优企阈值,提高企业筛选的准确性的技术效果。
40.进一步而言,如图2所示,所述获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数,本技术步骤s300还包括:
41.步骤s310:根据所述基础信息获得所述第一企业的法人信息和关联公司信息,根据所述法人信息的信誉信息和所述关联公司信息获得第一维度评估参数;
42.步骤s320:根据所述基础信息获得所述第一企业的注册地址信息,根据所述注册地址信息获得第二维度评估参数;
43.步骤s330:根据所述基础信息获得所述第一企业的经营范围内容和变动情况,根据所述经营范围内容和变动情况获得第三维度评估参数;
44.步骤s340:根据所述第一维度评估参数、所述第二维度评估参数和所述第三维度评估参数获得所述稳定性评估参数。
45.具体而言,所述法人信息是指所述第一企业法人的信息,企业法人是指以盈利为目的,独立从事商品生产和经营社会活动的社会经济组织。根据企业法人的名誉信息和所述第一企业的关联公司信息,进行所述企业的稳定性的第一维度的评估,获得所述第一维度评估参数。根据所述基础信息获得所述第一企业的企业注册地址信息,并通过大数据对所述第一企业的注册地址的真实性进行校验,根据真实性的校验结果获得所述第一企业的第二维度评估参数。所述经营范围是指国家允许企业生产和经营的商品类别、品种及服务项目,反映企业业务活动的内容和生产经营方向,是企业业务活动范围的法律界限,体现企业民事权利能力和行为能力的核心内容。根据所述基础信息进行所述第一企业的经营范围内容进行获取,并针对企业经营范围的变动信息获得所述第三维度评估参数。通过至少上述三个维度的参数,获得所述第一企业的稳定性评估参数。通过三个维度参数进行所述第一企业的稳定性评估参数的获取,使得所述稳定性评估参数更加具有稳定性和适配性,进而为后续进行准确的企业评估提供了数据支持。
46.进一步而言,如图3所示,所述获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级,本技术步骤s400还包括:
47.步骤s410:对所述第一企业进行业务数据采集,获得所述第一企业的业务信息;
48.步骤s420:对所述第一企业进行人员变动数据采集,获得所述第一企业的人员变动信息;
49.步骤s430:对所述第一企业进行经营数据和产品数据采集,获得所述第一企业的经营数据信息和产品数据信息,根据所述业务信息、所述人员变动信息、所述经营数据信息和产品数据信息作为所述第一数据采集结果;
50.步骤s440:通过大数据构建所述数据模型,将所述第一数据采集结果输入所述数据模型,获得所述第一企业的成长等级和风险等级。
51.具体而言,所述业务数据采集是指对所述第一企业进行持续的业务情况的采集监督的过程,根据业务的监督情况作为所述第一企业的业务信息;所述经营数据是指对所述第一企业进行业务经营是否出现异常的数据采集结果,包括所述第一企业经营的业务是否
超过许可经营的业务范围。所述产品数据信息为所述第一企业的产品相关数据,如产品质量、产品生产数量、销售量等信息。根据所述业务信息、所述人员变动信息、所述经营数据信息和产品数据信息作为所述第一数据采集结果,通过同行业企业的大数据构建变动数据评估的数据模型,基于所述数据模型根据变化内容,即所述第一数据采集结果进行数据归类,根据数据归类结果模拟计算出所述第一企业的成长等级和风险等级。通过对所述第一企业的业务信息、产品数据信息、人员变动信息和经营数据信息进行所述第一企业的成长等级和风险等级的评估,使得所述成长等级和风险等级的评估结果更加的准确,进而为后续进行准确的进行企业的分类标识提供了数据支持。
52.进一步的,如图4所示,本技术步骤s500还包括:
53.步骤s510:根据所述基础信息获得所述第一企业的法人信息、经营地址信息和经营范围信息;
54.步骤s520:根据所述法人信息、所述经营地址信息和所述经营范围信息进行所述第一企业的基础评分,获得第一基础价值特征评估结果;
55.步骤s530:根据所述第一基础价值特征评估结果和所述锚定阈值集合获得第一特征差值,根据所述第一特征差值获得基础价值特征分值;
56.步骤s540:根据所述基础价值特征分值获得所述企业生命线参数。
57.具体而言,所述基础价值特征包括对企业的经营地址、法人信息、和经营范围的维度的评分。举例而言,当所述第一企业的经营地址在一线城市,则所述第一企业的基础价值特征分值会相对较高,当所述第一企业的经营地址为黑名单地址,如集群注册地址或是出现经营地址异常的情况则会提供较低的分值,甚至可能导致扣分。进一步来说,所述基础价值特征还包括企业的规模信息,所述规模以企业的在职人数、行业信息和注册资金等信息进行复合计算,企业的人员规模程度都会为企业带来不同的分数,在职人数的规模和注册资金息息相关,二者呈正比状况,会提供更高的价值分,成之比则会起到反效果,例如,如果一个企业注册资金很高,但是在职人数很少,那么注册资金并不会为这个企业提供很高的分数,只有注册资金和企业规模成正比时才会产生高价值分数,同理,企业的生产规模和营业收入也是相关联的,通常来说生产规模越大,营业收入越高,排除特殊情况,同一生产规模下,营业收入越高,提供的分值越大。所述基础价值特征中每个评估指标具有自己的积分占比,根据最终计算的基础价值特征的评分与所述锚定阈值集合中对应的基础价值特征的阈值进行比对,获得所述第一特征差值,根据所述第一特征差值获得基础价值特征分值。当所述基础价值特征的评分高于所述锚定阈值集合中对应的基础价值特征的阈值,此时所述基础价值特征分值计算方式为:50%基础价值分上限/均值*当前用户分值+50%基础价值分上限/(基础价值分上限-行业均值)*(企业基础分-行业均值),当所述基础价值特征的评分低于所述锚定阈值集合中对应的基础价值特征的阈值,此时所述基础价值特征分值计算方式为:50%基础价值分上限/均值*当前用户分值。通过所述基础价值特征分值的计算获取,为后续获得准确的企业生命线参数夯实了基础,进而为后续进行准确的企业标识提供了数据支持。
58.进一步的,本技术步骤s500还包括:
59.步骤s550:根据所述基础信息获得所述第一企业的专利申报信息、高新技术申请信息和创新类型证书信息;
60.步骤s560:根据所述专利申报信息、所述高新技术申请信息和所述创新类型证书信息进行所述第一企业的创新能力评分,获得第一创造价值特征评估结果;
61.步骤s570:根据所述第一创造价值特征评估结果和所述锚定阈值集合获得第二特征差值,根据所述第二特征差值获得创造价值特征分值;
62.步骤s580:根据所述基础价值特征分值和所述创造价值特征分值获得所述企业生命线参数。
63.具体而言,所述专利申报信息包括所述第一企业的申报的专利的数量信息、类型信息、通过情况等信息,所述高新技术申请信息为在《国家重点支持的高新技术领域》内,持续进行研究开发与技术成果转化,形成企业核心自主知识产权,并以此为基础开展经营活动申报的相关技术申请的信息。根据所述专利申报信息、高新技术申请信息和创新类型证书信息的价值评估结果,对同行业的创新进步的影响情况进行评估,基于评估结果获得第一创造价值特征评估结果;根据所述第一创造价值特征评估结果和所述锚定阈值集合获得第二特征差值,同样,所述根据所述第二特征差值获得创造价值特征分值;根据第一创造价值特征评估结果与所述锚定阈值集合的大小关系,计算方式同上:当所述创造价值特征的评分高于所述锚定阈值集合中对应的创造价值特征的阈值:50%创造价值分上限/均值*当前用户分值+50%创造价值分上限/(创造价值分上限-行业均值)*(企业创造分-行业均值),当所述创造价值特征的评分低于所述锚定阈值集合中对应的创造价值特征的阈值,此时所述创造价值特征分值计算方式为:50%创造价值分上限/均值*当前用户分值。根据所述基础价值特征分值和所述创造价值特征分值获得所述企业生命线参数。
64.进一步的,本技术步骤s500还包括:
65.步骤s591:根据所述基础信息获得所述第一企业的法律风险信息、人员变动信息和业务履行信息;
66.步骤s592:根据所述法律风险信息、所述人员变动信息和所述业务履行信息进行所述第一企业的经营能力评分,获得第一经营价值特征评估结果;
67.步骤s593:根据所述第一经营价值特征评估结果和所述锚定阈值集合获得第三特征差值,根据所述第三特征差值获得经营价值特征分值;
68.步骤s594:根据所述基础价值特征分值、所述创造价值特征分值和所述经营价值特征分值获得所述企业生命线参数。
69.具体而言,所述法律风险是指所述第一企业的合约在法律范围内无效而无法履行,或者合约订立不当等原因引起的风险。业务履行情况为所述第一企业在进行业务合作的过程中,进行业务履行的质量、完成度等信息。所述人员变动信息为所述第一企业的人员变动情况,包括人员的新增、替换、离职,对人员的变动数量、变动原因等信息进行记录,根据所述法律风险信息、所述人员变动信息和所述业务履行信息进行所述第一企业的经营能力评分,获得第一经营价值特征评估结果。根据所述第一经营价值特征评估结果和所述锚定阈值集合获得第三特征差值,根据所述第三特征差值获得经营价值特征分值;根据第一经营价值特征评估结果与所述锚定阈值集合的大小关系,计算方式同上:当所述经营价值特征的评分高于所述锚定阈值集合中对应的经营价值特征的阈值:50%经营价值分上限/均值*当前用户分值+50%价值分上限/(经营价值分上限-行业均值)*(企业经营分-行业均值),当所述经营价值特征的评分低于所述锚定阈值集合中对应的经营价值特征的阈值,此
时所述经营价值特征分值计算方式为:50%经营价值分上限/均值*当前用户分值。根据所述基础价值特征分值、所述创造价值特征分值和所述经营价值特征分值获得所述企业生命线参数。
70.进一步的,本技术步骤s600还包括:
71.步骤s610:构建第一关联特征集合;
72.步骤s620:通过所述第一关联特征集合进行所述企业生命线参数的修正,获得第一修正结果;
73.步骤s630:根据所述第一修正结果进行所述第一企业的标识处理。
74.具体而言,所述第一关联特征集合包括企业规模、在职人数、行业及注册资金的关联特征,生产规模和营业收入的关联特征等。举例而言,企业规模会根据企业的在职人数,所处的行业以及注册资金进行复合计算,企业的人员规模程度都会为企业带来不同的分数,在职人数的规模和注册资金息息相关,二者呈正比状况,会提供更高的价值分,成之比则会起到反效果,例如,如果所述第一企业注册资金很高,但是在职人数很少,那么注册资金并不会为所述第一企业提供很高的分数,只有注册资金和企业规模成正比时才会产生高价值分数,同理,企业的生产规模和营业收入也是相关联的,通常来说生产规模越大,营业收入越高,排除特殊情况,同一生产规模下,营业收入越高,提供的分值越大。通过所述第一关联特征集合进行所述企业生命线参数的修正,获得第一修正结果,基于所述第一修正结果进行所述第一企业的标识处理,使得后续获得的标识结果更加的准确。
75.综上所述,本技术所提供的一种基于机器学习的产业链优企特征优化方法及系统具有如下技术效果:
76.1、由于采用了获得企业信息集合,对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息并进行稳定性评估,获得所述第一企业的稳定性评估参数;获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。达到根据采集特征进行自动提取分析,提高分析样本的充分度,提高分析效率,自动更新优企阈值,提高企业筛选的准确性的技术效果。
77.2、由于采用了通过三个维度参数进行所述第一企业的稳定性评估参数的获取,使得所述稳定性评估参数更加具有稳定性和适配性,进而为后续进行准确的企业评估提供了数据支持。
78.3、通过对所述第一企业的业务信息、产品数据信息、人员变动信息和经营数据信息进行所述第一企业的成长等级和风险等级的评估,使得所述成长等级和风险等级的评估结果更加的准确,进而为后续进行准确的进行企业的分类标识提供了数据支持。
79.4、通过所述基础价值特征分值的计算获取,为后续获得准确的企业生命线参数夯实了基础,进而为后续进行准确的企业标识提供了数据支持。
80.实施例二
81.基于与前述实施例中一种基于机器学习的产业链优企特征优化方法同样发明构
思,本发明还提供了一种基于机器学习的产业链优企特征优化系统,如图5所示,所述系统包括:
82.第一获得单元11,所述第一获得单元11用于获得企业信息集合;
83.第二获得单元12,所述第二获得单元12用于对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;
84.第三获得单元13,所述第三获得单元13用于获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;
85.第四获得单元14,所述第四获得单元14用于获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;
86.第五获得单元15,所述第五获得单元15用于根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;
87.第一标识单元16,所述第一标识单元16用于根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。
88.进一步的,所述系统还包括:
89.第六获得单元,所述第六获得单元用于根据所述基础信息获得所述第一企业的法人信息和关联公司信息,根据所述法人信息的信誉信息和所述关联公司信息获得第一维度评估参数;
90.第七获得单元,所述第七获得单元用于根据所述基础信息获得所述第一企业的注册地址信息,根据所述注册地址信息获得第二维度评估参数;
91.第八获得单元,所述第八获得单元用于根据所述基础信息获得所述第一企业的经营范围内容和变动情况,根据所述经营范围内容和变动情况获得第三维度评估参数;
92.第九获得单元,所述第九获得单元用于根据所述第一维度评估参数、所述第二维度评估参数和所述第三维度评估参数获得所述稳定性评估参数。
93.进一步的,所述系统还包括:
94.第十获得单元,所述第十获得单元用于对所述第一企业进行业务数据采集,获得所述第一企业的业务信息;
95.第十一获得单元,所述第十一获得单元用于对所述第一企业进行人员变动数据采集,获得所述第一企业的人员变动信息;
96.第十二获得单元,所述第十二获得单元用于对所述第一企业进行经营数据和产品数据采集,获得所述第一企业的经营数据信息和产品数据信息,根据所述业务信息、所述人员变动信息、所述经营数据信息和产品数据信息作为所述第一数据采集结果;
97.第十三获得单元,所述第十三获得单元用于通过大数据构建所述数据模型,将所述第一数据采集结果输入所述数据模型,获得所述第一企业的成长等级和风险等级。
98.进一步的,所述系统还包括:
99.第十四获得单元,所述第十四获得单元用于根据所述基础信息获得所述第一企业的法人信息、经营地址信息和经营范围信息;
100.第十五获得单元,所述第十五获得单元用于根据所述法人信息、所述经营地址信息和所述经营范围信息进行所述第一企业的基础评分,获得第一基础价值特征评估结果;
101.第十六获得单元,所述第十六获得单元用于根据所述第一基础价值特征评估结果和所述锚定阈值集合获得第一特征差值,根据所述第一特征差值获得基础价值特征分值;
102.第十七获得单元,所述第十七获得单元用于根据所述基础价值特征分值获得所述企业生命线参数。
103.进一步的,所述系统还包括:
104.第十八获得单元,所述第十八获得单元用于根据所述基础信息获得所述第一企业的专利申报信息、高新技术申请信息和创新类型证书信息;
105.第十九获得单元,所述第十九获得单元用于根据所述专利申报信息、所述高新技术申请信息和所述创新类型证书信息进行所述第一企业的创新能力评分,获得第一创造价值特征评估结果;
106.第二十获得单元,所述第二十获得单元用于根据所述第一创造价值特征评估结果和所述锚定阈值集合获得第二特征差值,根据所述第二特征差值获得创造价值特征分值;
107.第二十一获得单元,所述第二十一获得单元用于根据所述基础价值特征分值和所述创造价值特征分值获得所述企业生命线参数。
108.进一步的,所述系统还包括:
109.第二十二获得单元,所述第二十二获得单元用于根据所述基础信息获得所述第一企业的法律风险信息、人员变动信息和业务履行信息;
110.第二十三获得单元,所述第二十三获得单元用于根据所述法律风险信息、所述人员变动信息和所述业务履行信息进行所述第一企业的经营能力评分,获得第一经营价值特征评估结果;
111.第二十四获得单元,所述第二十四获得单元用于根据所述第一经营价值特征评估结果和所述锚定阈值集合获得第三特征差值,根据所述第三特征差值获得经营价值特征分值;
112.第二十五获得单元,所述第二十五获得单元用于根据所述基础价值特征分值、所述创造价值特征分值和所述经营价值特征分值获得所述企业生命线参数。
113.进一步的,所述系统还包括:
114.第一构建单元,所述第一构建单元用于构建第一关联特征集合;
115.第二十六获得单元,所述第二十六获得单元用于通过所述第一关联特征集合进行所述企业生命线参数的修正,获得第一修正结果;
116.第二十七获得单元,所述第二十七获得单元用于根据所述第一修正结果进行所述第一企业的标识处理。
117.前述图1实施例一中的一种基于机器学习的产业链优企特征优化方法的各种变化方式和具体实例同样适用于本实施例的一种基于机器学习的产业链优企特征优化系统,通过前述对一种基于机器学习的产业链优企特征优化方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于机器学习的产业链优企特征优化系统的实施方法,所以为了说明书的简洁,在此不再详述。
118.示例性电子设备
119.下面参考图6来描述本技术的电子设备。
120.图6图示了根据本技术的电子设备的结构示意图。
121.基于与前述实施例中一种基于机器学习的产业链优企特征优化方法的发明构思,本发明还提供一种电子设备,下面,参考图6来描述根据本技术的电子设备。该电子设备可以是可移动设备本身,或与其独立的单机设备,其上存储有计算机程序,该程序被处理器执行时实现前文所述方法的任一方法的步骤。
122.如图6所示,电子设备50包括一个或多个处理器51和存储器52。
123.处理器51可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备50中的其他组件以执行期望的功能。
124.存储器52可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器51可以运行所述程序指令,以实现上文所述的本技术的各个实施例的方法以及/或者其他期望的功能。
125.在一个示例中,电子设备50还可以包括:输入装置53和输出装置54,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
126.本发明实施例提供的一种基于机器学习的产业链优企特征优化方法,所述方法包括:获得企业信息集合;对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。解决了现有技术存在不能对产业链中全量企业样本进行充分分析,效率低耗时长,且存在即使手动归纳优企阈值后随着产业链中企业的成长演化无法自动更新优企阈值的技术问题,达到根据采集特征进行自动提取分析,提高分析样本的充分度,提高分析效率,自动更新优企阈值,提高企业筛选的准确性的技术效果。
127.通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本技术可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用cpu、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本技术而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、u盘、移动硬盘、rom、ram、磁碟或者光盘等,包括若干指令用以使得一台计算机设备执行本技术各个实施例所述的方法。
128.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
129.所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计
算机程序指令时,全部或部分地产生按照本技术所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从计算机可读存储介质向另计算机可读存储介质传输,所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
130.应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本技术的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本技术的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术的实施过程构成任何限定。
131.另外,本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或,”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/,”一般表示前后关联对象是一种“或”的关系。
132.应理解,在本技术中,“与a相应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其它信息确定b。
133.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
134.总之,以上所述仅为本技术技术方案的较佳实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
技术特征:
1.一种基于机器学习的产业链优企特征优化方法,其特征在于,所述方法包括:获得企业信息集合;对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。2.如权利要求1所述的方法,其特征在于,所述获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数,所述方法包括:根据所述基础信息获得所述第一企业的法人信息和关联公司信息,根据所述法人信息的信誉信息和所述关联公司信息获得第一维度评估参数;根据所述基础信息获得所述第一企业的注册地址信息,根据所述注册地址信息获得第二维度评估参数;根据所述基础信息获得所述第一企业的经营范围内容和变动情况,根据所述经营范围内容和变动情况获得第三维度评估参数;根据所述第一维度评估参数、所述第二维度评估参数和所述第三维度评估参数获得所述稳定性评估参数。3.如权利要求1所述的方法,其特征在于,所述获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级,所述方法包括:对所述第一企业进行业务数据采集,获得所述第一企业的业务信息;对所述第一企业进行人员变动数据采集,获得所述第一企业的人员变动信息;对所述第一企业进行经营数据和产品数据采集,获得所述第一企业的经营数据信息和产品数据信息,根据所述业务信息、所述人员变动信息、所述经营数据信息和产品数据信息作为所述第一数据采集结果;通过大数据构建所述数据模型,将所述第一数据采集结果输入所述数据模型,获得所述第一企业的成长等级和风险等级。4.如权利要求1所述的方法,其特征在于,所述方法包括:根据所述基础信息获得所述第一企业的法人信息、经营地址信息和经营范围信息;根据所述法人信息、所述经营地址信息和所述经营范围信息进行所述第一企业的基础评分,获得第一基础价值特征评估结果;根据所述第一基础价值特征评估结果和所述锚定阈值集合获得第一特征差值,根据所述第一特征差值获得基础价值特征分值;根据所述基础价值特征分值获得所述企业生命线参数。
5.如权利要求4所述的方法,其特征在于,所述方法包括:根据所述基础信息获得所述第一企业的专利申报信息、高新技术申请信息和创新类型证书信息;根据所述专利申报信息、所述高新技术申请信息和所述创新类型证书信息进行所述第一企业的创新能力评分,获得第一创造价值特征评估结果;根据所述第一创造价值特征评估结果和所述锚定阈值集合获得第二特征差值,根据所述第二特征差值获得创造价值特征分值;根据所述基础价值特征分值和所述创造价值特征分值获得所述企业生命线参数。6.如权利要求5所述的方法,其特征在于,所述方法包括:根据所述基础信息获得所述第一企业的法律风险信息、人员变动信息和业务履行信息;根据所述法律风险信息、所述人员变动信息和所述业务履行信息进行所述第一企业的经营能力评分,获得第一经营价值特征评估结果;根据所述第一经营价值特征评估结果和所述锚定阈值集合获得第三特征差值,根据所述第三特征差值获得经营价值特征分值;根据所述基础价值特征分值、所述创造价值特征分值和所述经营价值特征分值获得所述企业生命线参数。7.如权利要求1所述的方法,其特征在于,所述方法包括:构建第一关联特征集合;通过所述第一关联特征集合进行所述企业生命线参数的修正,获得第一修正结果;根据所述第一修正结果进行所述第一企业的标识处理。8.一种基于机器学习的产业链优企特征优化系统,其特征在于,所述系统包括:第一获得单元,所述第一获得单元用于获得企业信息集合;第二获得单元,所述第二获得单元用于对所述企业信息集合进行企业信息的噪声处理,根据噪声处理结果通过机器学习算法获得锚定阈值集合;第三获得单元,所述第三获得单元用于获得第一企业的基础信息,根据所述基础信息进行稳定性评估,获得所述第一企业的稳定性评估参数;第四获得单元,所述第四获得单元用于获得所述第一企业的第一数据采集结果,将所述第一数据采集结果输入数据模型,获得所述第一企业的成长等级和风险等级;第五获得单元,所述第五获得单元用于根据所述基础信息和所述锚定阈值集合进行所述第一企业的基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;第一标识单元,所述第一标识单元用于根据所述稳定性评估参数、所述成长等级和风险等级、所述企业生命线参数进行所述第一企业的标识处理。9.一种电子设备,其特征在于,包括处理器和存储器;所述存储器,用于存储;所述处理器,用于通过调用,执行权利要求1至7中任一项所述的方法。10.一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
技术总结
本发明公开了一种基于机器学习的产业链优企特征优化方法及系统,获得企业信息集合;根据噪声处理结果通过机器学习算法获得锚定阈值集合;获得第一企业的基础信息进行稳定性评估,获得第一数据采集结果,将第一数据采集结果输入数据模型,获得成长等级和风险等级;根据基础信息和锚定阈值集合进行基础价值特征、创造价值特征和经营价值特征分析评估,根据分析评估结果获得企业生命线参数;根据稳定性评估参数、成长等级和风险等级、企业生命线参数进行第一企业的标识处理。解决了现有技术存在不能对产业链中全量企业样本进行充分分析,效率低耗时长,且存在即使手动归纳优企阈值后随着产业链中企业的成长演化无法自动更新优企阈值的技术问题。新优企阈值的技术问题。新优企阈值的技术问题。
技术研发人员:李琦 王瀚 郑猛
受保护的技术使用者:北京每日信动科技有限公司
技术研发日:2022.02.11
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-16433.html