本发明属于计算机,尤其涉及一种基于商务信息主题模型的电力物资供应商特征分析方法及系统。
背景技术:
1、随着数字化社会发展进程的推进,电力企业数字化转型不断发展,对企业的供应链管理水平提出了新要求。电力物资供应商管理作为供应链管理中的一个重要环节,与电网的安全性、可靠性密切相关,选择综合信誉、资质能力、业绩表现良好的物资供应商对电力企业的长期稳定发展有着重大影响。
2、目前,大部分电力企业已经逐渐将数字化和智能化手段融入供应商管理环节,这就需要电力企业进一步加强数据治理能力,完善供应商数据收集、处理、应用的信息管理模式。近几年,电力物资供应商的分析与评价方法主要集中于如何构建一个多准则决策模型,挖掘专家评分中的有效信息并输出评价结果,包括层次分析法(ahp)、模糊综合评价法、数据包络分析法(dea)、理想解法(topsis)等。但是,电力企业的物资供应商具有种类繁杂、数量众多等特点,传统的粗放式管理模式已不能满足供应链一体化、智能化的需求,需要通过新型信息技术手段优化传统供应链管理方法,在供应链上游实现产供融合的现代化管理方式。现有对电力物资供应商的特征分析与评价方法主要存在以下挑战:
3、1.不同信息系统间集成度低、数据难以互通共享,导致“信息孤岛”的出现;
4、2.供应商资质评价和绩效评价等业务环节过于依赖专家主观评价信息,缺少规范可靠的评价标准和科学高效的定量评价方法;
5、3.面对复杂的业务场景和种类多样的供应商,信息系统的智能化程度不高,仍存在大量依赖人力的业务场景。
6、总之,当前电力企业在物资供应商管理环节仍存在信息化程度不足、数据应用不充分、模块功能冗余等问题,这就需要进一步加强数据治理能力,完善物资供应商数据收集、处理、应用的信息管理模式。
技术实现思路
1、针对现有技术不足,本发明提出了一种基于商务信息主题模型(btm,businesstopic model)的电力物资供应商特征分析方法,能够充分提取现有系统中的各类数据对电力物资供应商的特征进行分析与评估。
2、为实现上述目的,本发明的技术方案为将供应商的非文本型数据嵌入狄利克雷分布的文档主题生成模型,并结合知识图谱进行语义消歧用于电力物资供应商的特征分析任务。
3、一种基于商务信息主题模型的电力物资供应商特征分析方法,其特征在于,包括,设计了电力物资供应商相关的知识图谱构建方法,基于电力物资供应领域相关的知识库,通过命名实体识别技术识别出电力物资供应领域相关知识库文本中的命名实体,包括供应实体,电力企业实体,物资实体,商务信息实体等,再将同物异名的实体进行链接,随后进行不同类别的实体之间的关系抽取,并在图数据库中创建实体节点以及实体间关系将实体链接,最终完成构建电力物资供应领域知识图谱;
4、采用增加了len_loss的bert-bilstm-crf模型对文档和数据库中的非文本信息进行命名实体识别,该模型自下而上分为三个模块:bert模块,bilstm(双向长短期记忆网络)模块和crf(条件随机场)模块;
5、将电力物资供应商的商务信息数据从业务逻辑上分为资质水平、运营能力、采购履约、质量管理、征信行为等,从数据结构上主要分为四类,即时间型数据、字符型数据、数值型数据和文本型数据;
6、如果供应商的数据集中除了文档型数据外还有时间型、字符型或数值型数据,而传统的主题模型只能处理文档型数据,无法处理非文档型数据,本发明提出了一种基于p-v(属性-值)对的非文本型数据处理方法,通过时间型、字符型和数值型数据嵌入来将供应商的所有商务数据转换成文档;
7、作为优选,在时间型信息嵌入处理中,由于供应商的数据记录可能在不同时间段或时间点,因此保留了其中的年份信息,同时使用了几个月和几天作为训练和预测的参数,但删除了更小的时分秒单位。随后将该供应商的所有数据记录放在时间轴上,并将最小单位从一天更改为n天,以便将相邻的n天表示为相同的时间特征。
8、作为优选,在字符型数据的嵌入处理中,将语义消歧之后的属性和值转换为可嵌入的文本,通过“p+v”的形式转换为单词。
9、作为优选,在数值型数据的嵌入处理中,将语义消歧之后的属性和值的单位转换为可嵌入的文本,通过“p+v”的形式转换为单词。
1.一种基于商务信息主题模型的电力物资供应商特征分析方法,其特征在于,包括,
2.根据权利要求1所述的基于商务信息主题模型的电力物资供应商特征分析方法,其特征在于,构建知识图谱时,包括
3.根据权利要求1所述的基于商务信息主题模型的电力物资供应商特征分析方法,其特征在于,
4.根据权利要求1所述的基于商务信息主题模型的电力物资供应商特征分析方法,其特征在于,抽取数据中台和业务系统的内部数据和外部全量数据时,具体包括
5.根据权利要求1所述的基于商务信息主题模型的电力物资供应商特征分析方法,其特征在于,三层贝叶斯模型包含了单词、主题和文档的三层基本结构,如下式所示,公式中的p(词|文档)是已知的,则可以通过迭代训练求出p(词|主题)和p(主题|文档),即整个文档集合中的每一篇文档和文档中的每一个词所对应的主题概率分布;
6.一种基于商务信息主题模型的电力物资供应商特征分析系统,其特征在于,包括,
7.根据权利要求1所述的系统,其特征在于,构建知识图谱时,包括
8.根据权利要求6所述的系统,其特征在于,
9.根据权利要求6所述的系统,其特征在于,抽取数据中台和业务系统的内部数据和外部全量数据时,具体包括
10.根据权利要求6所述的系统,其特征在于,三层贝叶斯模型包含了单词、主题和文档的三层基本结构,如下式所示,公式中的p(词|文档)是已知的,则可以通过迭代训练求出p(词|主题)和p(主题|文档),即整个文档集合中的每一篇文档和文档中的每一个词所对应的主题概率分布;