1.本技术涉及人工智能技术领域,特别是涉及一种用户数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
2.贷款是按一定利率和确定的期限带出货币资金的信用活动,是商业银行资产业务中最重要的项目。其中,贷款利润的高低与贷款价格有着直接的关系,具体地,贷款价格高,利润就高,但贷款的需求将因此减少。相反,贷款价格低,利润就低,但贷款需求将会增加。因此,需要为不同的借贷人制定相应的贷款利率。
3.在相关技术中,例如20世纪40年代,美国有些银行就开始尝试研究信用评分方法,用于快速处理大量信贷申请;1956年,工程师billfair和数学家earlisaac共同发明了著名的fico评分方法,该方法以逻辑回归方法为技术核心,是当前业界应用最成熟的信用风险评分模型;在20世纪60~80年代,随着信息技术的进步和业务的快速发展,信用评分模型在信用卡、消费信贷、住房抵押贷款和小企业贷款中得到了广泛应用。
4.但是,这些方法在数据爆炸的大数据时代存在很多限制,导致效率底下且评估结果不准确。
技术实现要素:
5.基于此,有必要针对上述技术问题,提供一种能够对待处理用户数据进行准确评估的用户数据处理方法、装置、计算机设备和存储介质。
6.第一方面,本技术提供了一种用户数据处理方法,该方法包括:
7.获取待处理用户数据,待处理用户数据包括不同时间点的初始用户数据;
8.对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱;
9.分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,静态特征用于表征融合静态知识图谱中各个节点特征的特征数据;
10.将各个时间点对应的静态特征串联得到动态特征;
11.根据动态特征得到待处理用户数据对应的目标特征数据。
12.在其中一个实施例中,上述对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱,包括:
13.对各个时间点的初始用户数据提取,得到三元组数据;
14.基于三元组数据进行图谱构建得到多个静态知识图谱。
15.在其中一个实施例中,上述基于三元组数据进行图谱构建得到多个静态知识图谱之后,包括:
16.当静态知识图谱中的节点存在标签缺失时,读取标签缺失节点所在的三元组数据,根据三元组数据的标签对标签缺失的节点进行补充。
17.在其中一个实施例中,上述分别对多个静态知识图谱进行特征提取得到多个静态
知识图谱对应的静态特征,包括:
18.根据多个静态知识图谱,得到多个静态知识图谱对应的特征矩阵;
19.将各个特征矩阵进行特征融合,得到多个静态知识图谱对应的静态特征。
20.在其中一个实施例中,上述根据动态特征得到待处理用户数据对应的目标特征数据,包括:
21.对动态特征进行特征提取,得到留存特征;
22.对留存特征进行更新得到更新特征;
23.根据更新特征计算得到目标特征数据。
24.在其中一个实施例中,上述分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征是通过预先训练的第一模型实现的;
25.根据动态特征得到待处理用户数据对应的目标特征数据是通过预先训练的第二模型实现的。
26.在其中一个实施例中,上述第一模型和第二模型的训练过程,包括:
27.获取样本数据,样本数据携带标注数据以及特征标签;
28.将样本数据输入至第一模型,以通过第一模型对样本数据进行提取,得到样本特征;
29.根据样本特征以及样本数据中的特征标签计算第一目标损失函数,第一损失函数用于优化第一模型,直至第一模型完成训练。
30.将样本特征输入至第二模型,以通过第二模型对样本特征进行预测,得到样本特征的样本目标特征;
31.根据样本目标特征和标注数据计算得到第二目标损失函数,第二损失函数用于优化第二模型,直至第二模型完成训练。
32.第二方面,本技术还提供了一种风险处理方法,该方法包括:
33.获取待预测用户对应的待处理用户数据;
34.根据上述任意一个实施例中的方法得到待处理用户数据对应的目标特征数据;
35.根据目标特征数据确定待预测用户的风险等级。
36.在其中一个实施例中,上述根据目标特征数据确定待预测用户的风险等级,包括:
37.获取预先设置的评价等级;
38.根据目标特征数据和评价等级得到待预测用户的风险等级。
39.第三方面,本技术还提供了一种风险评定装置,该装置包括:
40.数据获取模块,用于获取待处理用户数据,待处理用户数据包括不同时间点的初始用户数据;
41.图谱构建模块,用于对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱;
42.特征提取模块,用于分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,静态特征用于表征融合静态知识图谱中各个节点特征的特征数据;
43.特征处理模块,用于将各个时间点对应的静态特征串联得到动态特征;
44.目标特征计算模块,用于根据动态特征得到待处理用户数据对应的目标特征数据。
45.第四方法,本技术还提供了一种风险处理装置,该装置包括:
46.待处理用户数据获取模块,用于获取待预测用户对应的待处理用户数据;
47.风险预测模块,用于根据上述任意一个实施例中的装置得到待处理用户数据对应的目标特征数据;
48.风险等级判断模块,用于根据目标特征数据确定待预测用户的风险等级。
49.第五方面,本技术还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任意一个实施例中的方法的步骤。
50.第六方面,本技术还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。
51.第七方面,本技术还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。
52.上述用户数据处理方法、装置、计算机设备和存储介质,首先获取待处理用户数据,其中待处理用户数据包括不同时间点的初始用户数据,然后对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱,这样就可以保存大量的数据并且能够便于对数据的提取。其次,由于对各个时间点的初始用户数据都建立相应的静态知识图谱,这样就可以得到融入时序信息的动态知识图谱,这样可以分析图谱结构随时间的变化和趋势,从而掌握到关键信息,然后分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,这样即使图谱中存在缺失,也可以利用特征提取后的静态特征进行补全,然后将各个时间点对应的静态特征串联得到动态特征,并基于动态特征进行预测得到目标特征数据,这样就可以根据各个时点的初始用户数据对下一个时间进行精准预测得到目标特征数据。
附图说明
53.图1为一个实施例中用户数据处理方法的应用环境图;
54.图2为一个实施例中用户数据处理方法的流程示意图;
55.图3为一个实施例中的三元组数据示意图;
56.图4为一个实施例中通过第一模型进行特征融合的示意图;
57.图5为另一个实施例中忘记门操作示意图;
58.图6为一个实施例中更新门操作示意图;
59.图7为一个实施例中风险处理方法的流程示意图;
60.图8为一个实施例中风险等级评定示意图;
61.图9为一个实施例中个人信用风险等级评定模型的训练和预测示意图;
62.图10为一个实施例中用户数据处理装置的结构示意图;
63.图11为一个实施例中风险处理装置的结构示意图;
64.图12为一个实施例中计算机设备的内部结构图。
具体实施方式
65.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
66.本技术实施例提供的用户数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。首先获取待处理用户数据,其中待处理用户数据包括了不同时间点的初始用户数据,然后对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱,即一个时间点对应一个静态知识图谱,分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,其中静态用于表征融合静态知识图谱中各个节点特征的特征数据,将各个时间对应的静态特征串联得到动态特征,最后根据动态特征得到待处理用户数据对应的目标特征数据,以实现待处理用户数据的准确评估。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
67.在一个实施例中,如图2所示,提供了一种用户数据处理方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
68.s202,获取待处理用户数据,待处理用户数据包括不同时间点的初始用户数据。
69.其中,待处理用户数据是指需要进行评估的数据,其可以是需要进行贷款评估的用户的数据,也可以是其他需要进行信任评估、风险评估的数据。例如,待处理用户数据是一个需要进行贷款评估的用户,那么待处理用户数据中包括该用户的性别、年龄、资产、从事行业等数据。其中待处理用户数据中可以包括多条初始用户数据记录,所有的初始用户数据记录按照时间顺序进行排列。
70.其中,初始数据是指未经过任何处理的原始数据,其可以是从数据库中直接导出的数据。
71.具体地,服务器首先获取不同时间点的初始用户数据,其中一个时间点可以对应一条初始数据,在其他实施例中,一个时间点可以对应多条初始数据,不在此作具体限定。然后,服务器将获取的不同时间点的初始数据进行归纳汇总得到待处理用户数据,其中可选地,可以对不同时间点的初始用户数据进行结构化处理得到待处理用户数据,在其他实施例中,还可以对不同时间的初始用户数据进行过滤,将无效信息进行滤除,得到待处理用户数据。
72.s204,对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱。
73.其中,静态知识图谱是根据各个时间点的初始用户数据构建的知识图谱,例如一个时间点对应一个知识图谱,其中知识图谱是指根据用户数据构建的图,其中图中的点表示一个实体,边表示实体与实体之间的关系,具体结合图3所示,图3为一个实施例中的三元组数据示意图,其中“李安”和“少年派的奇幻漂流”为实体,“导演”表示实体之间的关系,标签表示实体的属性,其中“李安”的标签可以是“人物”和“导演”等,“少年派的奇幻漂流”的标签可以是“电影”。
74.具体地,服务器分别对各个时间的初始用户数据处理进行图谱构建,其中可选地,对初始用户数据进行实体以及关系等进行区分,然后根据实体、关系以及标签进行图谱构建,在其他实施例中,可以首先对初始用户数据进行分词操作后,按照预设的规则进行图谱构建得到多个静态知识图谱,即一个时间点对应一个静态知识图谱。通过不同时间点对应的静态知识图谱,可以得到图谱的结构变化。
75.在一个实施例中,静态知识图谱中的节点有标签缺失时,可以读取标签缺失节点所在的三元组数据,然后根据标签缺失节点所在三元组数据对该节点进行标签补充。继续结合图3所示,若“少年派的奇幻漂流”的标签缺失,那么可以通过“李安”的标签进行推导。
76.在一个实施例中,服务器按照访问频率和/或信息重要程度将初始用户数据进行分组,并将访问频率大于等于第一阈值的初始用户数据放在静态知识图谱中,将访问频率小于第一阈值的,或者信息重要程度不满足要求的放在传统的关系型数据库中。具体地,可以把常用的信息存放在静态知识图谱中,把那些访问频率不高,对关系分析无关紧要的信息放在传统的关系型数据库中。另外,还可以从静态知识图谱中找出强连通图,并标记出来,强连通图意味着每一个节点都可以通过某种路径达到其他的点,也就说明这些节点之间有很强的关系,因此可以根据强联通图作更一步的处理。
77.在一个实施例中,一个时点可以从不同的维度建立多个静态知识图谱,具体地,若建立与金融相关的静态知识图谱,服务器需要获取客户的初始用户数据,例如身份信息、财产状况、持卡信息、交易信息、放款信息、还款信息、申请贷款信息、贷款记录、贷记卡记录、准贷记卡记录、特殊交易记录和查询记录等相关数据。除了金融领域的信息,客户社交网络的信息起着关键的作用。这是由于现代交易越来越多是在线上而不是线下当面完成,因此如何掌握客户兴趣和客户情绪,越来越需要分析客户行为数据来完成。通过把客户的文本类数据,例如客服反馈信息、社交媒体上的客户评价、客户调查反馈等,解析文本语义内涵,打上客户标签,建立相应的客户关系图谱,以获得更好的客户洞察。
78.s206,分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,静态特征用于表征融合静态知识图谱中各个节点特征的特征数据。
79.其中静态特征是指对一个时间点对应的静态知识图谱进行特征提取后的特征,该特征用于表征融合静态知识图谱中各个节点特征的特征数据。
80.具体地,服务器分别对多个静态知识图谱进行特征提取,其中可选地,可以采用预先训练的机器学习模型对静态知识图谱进行特征提取,得到对静态知识图谱中各个节点融合后的静态特征,在其他实施例中,可以首先根据静态知识图谱得到对应的特征矩阵,然后对特征矩阵进行处理,例如将特征矩阵输入至预先训练的机器学习模型中,得到特征融合后的静态特征。在其中一个实施例中,静态图谱中存储的客户特征为x,通过特征提取后,该客户的特征变成了z。
81.s208,将各个时间点对应的静态特征串联得到动态特征。
82.其中,动态特征是指包括时序信息的特征,是根据时间顺序将静态特征进行串联起来的。
83.具体地,服务器得到多个静态知识图谱对应的静态特征按照时间的先后循序进行串联,得到动态特征。
84.在一个实施例中,若同一时点包括多个静态知识图谱,例如在第一时间点包括用
户-贷款产品图以及用户-用户关系图时,在分别对这两图进行特征提取后,得到两张图对应的静态特征,然后将这两个静态特征进行拼接后,并在下一个时间点,按照同样的方法对静态特征进行拼接,再根据时间点顺序将静态特征进行串联,得到动态特征。
85.在一个实施例中,若同一时点包括多个静态知识图谱,可以先将多个静态知识图谱中按照构建图谱的方式,即“实体-关系-实体”的方式将多个静态知识图谱进行拼接,即拼接成一个静态知识图谱之后,进行特征提取,得到静态特征,再根据时间的先后顺序将静态特征进行串联,得到动态特征。
86.在一个实施例中,若同一时间点包括多个静态知识图谱,可以分别对同一时间的多个静态知识图谱进行特征提取,得到该时点的多个静态特征,然后再按时间出现的先后顺序,将每一时点对应的多个静态特征进行串联得到动态特征。
87.s210,根据动态特征得到待处理用户数据对应的目标特征数据。
88.其中,目标特征数据是指对待处理用户数据进行处理后,用于表征待处理用户数据的预测结果。
89.具体地,服务器根据动态特征对待处理用户数据进行预测,得到待处理用户数据对应的目标特征数据,其中可选地,可以将动态特征输入至预先训练的机器学习模型中,该机器学习模型可以根据动态特征预测下一时点的特征,也就目标特征数据。
90.在一个实施例中,如果是对个人信用风险等级进行预测,那么可以根据用户数据进行图谱构建,得到多个静态知识图谱,并对多个静态知识图谱进行特征提取,得到静态特征,然后按照时间顺序将静态特征进行串联得到动态特征,最后根据动态特征预测得到目标特征数据,即对该用户预测得到的风险得分,再结合贷款产品的特性,就可以针对该客户制定相应的贷款利率。同时对该客户进行后续的调查反馈,实时更新图谱信息,以优化对个人信用风险等级的预测。
91.上述用户数据处理方法中,首先获取待处理用户数据,其中待处理用户数据包括不同时间点的初始用户数据,然后对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱,这样就可以保存大量的数据并且能够便于对数据的提取。其次,由于对各个时间点的初始用户数据都建立相应的静态知识图谱,这样就可以得到融入时序信息的动态知识图谱,这样可以分析图谱结构随时间的变化和趋势,从而掌握到关键信息,然后分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,这样即使图谱中存在缺失,也可以利用特征提取后的静态特征进行补全,然后将各个时间点对应的静态特征串联得到动态特征,并基于动态特征进行预测得到目标特征数据,这样就可以根据各个时点的初始用户数据对下一个时间进行精准预测得到目标特征数据。
92.在一个实施例中,上述对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱,包括:对各个时间点的初始用户数据提取,得到三元组数据;基于三元组数据进行图谱构建得到多个静态知识图谱。
93.其中,三元组数据是指用于构建静态知识图谱的数据组,其中至少包括两个实体和实体间的关系信息,其中可选地,实体可以对用户数据进行分词处理后获得。
94.具体地,对各个时间的初始用户数据进行提取,得到多个三元组数据,其中可选地,可以对初始用户数据进行分词处理后得到各个分词数据,并根据预设的实体信息表、关系信息表以及标签系信息表确定各个分词是实体,还是关系以及实体的标签,并按照一定
的方向对实体-关系-实体进行连接得到三元组数据。
95.具体地,将得到的多个三元组数据依旧按照实体-关系-实体将多个三元组数据进行连接,得到一个静态知识图谱。
96.在一个实施例中,服务器可以按时间顺序分别对各个时间的初始用户数据进行提取,得到多个三元组数据,并基于三元组数据进行图谱构建得到多个与各个时点对应的静态知识图谱。
97.在一个实施例中,服务器有多个线程,多个线程同时不同时点的初始用户数据进行提取,得到多个三元组数据,并基于三元组数据进行图谱构建,同时得到多个与各个时点对应的静态知识图谱。
98.在上述实施例中,服务器分别对各时间点的初始用户数据提取,得到三元组数据,并基于三元组数据进行图谱构建得到多个静态知识图谱,这样就可以对多个静态知识图谱进行分析,从未对待处理用户数据进行预测得到目标特征数据。
99.在一个实施例中,上述基于三元组数据进行图谱构建得到多个静态知识图谱之后,包括:当静态知识图谱中的节点存在标签缺失时,读取标签缺失节点所在的三元组数据,根据三元组数据的标签对标签缺失的节点进行补充。
100.其中,标签是指用于表征静态知识图谱中节点属性的,例如实体为“李安”,那么该实体的标签可以是“人物”、“导演”等,这样根据实体-关系-实体这样的结构,又可以得到标签-关系-标签这样结构,以便于进行更深层次的分析,其中需要说明的一点,一个实体对应的标签可以是一个,也可以是多个。
101.具体地,当静态知识图谱中的任意一个节点存在标签缺失时,可以读取标签缺失节点所在的三元组数据,那么可以根据标签缺失节点所在的三元组数据对该节点的标签进行补充。例如,a与b是一个三元组数据,a的标签缺失,那么可以将b的标签作为a的标签。
102.在一个实施例中,与标签缺失的实体相关的三元组数据有多个时,可以根据多个三元组数据的标签进行补充,例如对多个三元组数据的标签进行特征融合或者关键特征提取等手段,得到标签缺失节点的标签。
103.在上述实施例中,通过利用有标签节点和标签缺失节点之间的关系对标签缺失节点的标签进行推断并进行补充,这样可以使数据更加完善,使后续对待处理用户数据的预测更加准确。
104.在一个实施例中,上述分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,包括:根据多个静态知识图谱,得到多个静态知识图谱对应的特征矩阵;将各个特征矩阵进行特征融合,得到多个静态知识图谱对应的静态特征。
105.其中,特征矩阵是指根据静态知识图谱进行得到的矩阵,例如在一个静态知识图谱中有n个节点,每个节点都有自己的特征,这些节点的特征就可以组成一个n
×
d维的特征矩阵x,其中d标识特征的维度值。
106.具体地,服务器首先对多个静态知识图谱进行提取,得到多个静态是指图谱对应的特征矩阵,然后将各个特征矩阵进行特征融合,得到多个静态知识图谱对应的静态特征,其中可选地,可以通过预先训练的机器学习模型对特征矩阵进行特征融合,得到多个静态知识图谱对应的静态特征。
107.在一个实施例中,可以采用图卷积神经网络(一种神经网络模型,gcn)进行训练得
到能够对特征矩阵进行特征融合的第一模型,具体地,在一个静态知识图谱中有n个节点,这些节点的特征就可以组成一个n
×
d维的特征矩阵x以及各个节点之间的关系组成了一个n x n的邻接矩阵a,然后将特征矩阵x和邻接矩阵a输入至第一模型中,其中网络层与层之间的传播方式如下:
[0108][0109]
其中,in是单位矩阵。是的度矩阵,的度矩阵,是第l层的特征,h
(0)
=x。w
(l)
是每一层的参数。σ是非线性激活函数。
[0110]
在图4中,图4为一个实施例中通过第一模型进行特征融合的示意图,该图中存储的客户特征为x,通过若干层图神经网络,每个客户的特征变成了z。在实施例中,第一模型采用了两层的图卷积神经网络,激活函数分别采用了relu函数和softmax函数,则整体正向的传播公式为
[0111][0112]
z=∑iexp(xi)
[0113]
针对所有带标签的节点计算cross entropy损失函数:
[0114][0115]
其中y
l
是有标签节点的集合。网络参数w
(0)
和w
(1)
的训练采用了梯度下降的方法。
[0116]
在一个实施例中,可以采用图神经网络(一种神经网络模型,gnn)进行训练得到能够对特征矩阵进行特征融合的第一模型。
[0117]
在上述实施例中,通过特征融合能够利用节点、边上的信息对静态知识图谱中缺失的数据进行补全。
[0118]
在一个实施例中,上述根据动态特征得到待处理用户数据对应的目标特征数据,包括:对动态特征进行特征提取,得到留存特征;对留存特征进行更新得到更新特征;根据更新特征计算得到目标特征数据。
[0119]
其中,留存特征是指对动态特征进行特征提取后的特征,其可以通过预先设置的掩码来决定哪些信息可以留下,也可以通过预先训练的预测模型中的遗忘函数(忘记门)来决定哪些信息需要被“遗忘”,即那些信息需要留下那些信息需要被“丢弃”;更新特征是指基于留存特征的基础进行更新后得到的特征。
[0120]
具体地,服务器获取动态特征后,首先对动态特征进行特征提取,得到留存特征,然后基于留存特征进行更新得到更新特征,其中可选地,可以通过预先训练的预测模型的更新门对留存特征进行更新,得到更新特征,最后根据更新特征计算目标特征数据,其中可选地,可以通过上一时刻的状态和当前时刻的输入进行计算,得到目标特征数据。
[0121]
在一个实施例中,可以通过预先训练的预测模型对动态特征得到目标特征数据。具体地,将动态特征,即不同时刻图谱节点结构和内部结构作为预先训练的预测模型的输入。预先训练的预测模型的第一步是通过忘记门层决定需要丢弃的信息,该门会读取h
t-1
和x
t
,输出一个在0和1之间的数值给每个模块状态c
t-1
中的数字。1表示“完全保留”,0表示“完全舍弃”。具体结合图5所示,图5为一个实施例中忘记门操作示意图,其操作如下:
[0122]ft
=σ(wf·
[h
t-1
,x
t
] bf)
[0123]
其中,h
t-1
表示t-1时刻的状态,x
t
表示t时刻的输入,f
t
表示t时刻的遗忘门,bf表示忘记门的常数项,wf表示忘记门的权重参数。
[0124]
预先训练的预测模型下一步是确定哪些新的信息被存放在模块中。这里包含两部分,sigmiod层,即“输入门层”,决定哪些参数值需要更新和tanh层,创建一个新的候选值向量加入到状态中。
[0125]it
=σ(wi·
[h
t-1
,x
t
] bi)
[0126][0127]
其中i
t
表示t时刻的更新门,bi表示更新门的常数项,bc表示候选值向量的常数项,wi表示更新门的权重参数,wc表示候选值向量的权重参数。
[0128]
此时,c
t-1
更新为c
t
。然后把旧状态与f
t
相乘,丢弃掉需要丢弃的信息。再加上就得到新的候选值,具体结合图6所示,图6为一个实施例中的更新门操作示意图,其操作如下:
[0129][0130]
其中,c
t
表示当前时刻记忆的状态,也是更新后记忆细胞的状态。
[0131]
最后,确定输出值h
t
。
[0132]ot
=σ(wo[h
t-1
,x
t
] bo)
[0133]ht
=o
t
*tanh(c
t
)
[0134]
其中,o
t
表示t时刻的输出门,bo表示输出门的常数项,wo表示输出门的权重参数。
[0135]
此时,就完成了对动态特征的预测。
[0136]
在上述实施例中,通过对动态特征进行特征提取,得到留存特征,并对留存特征进行更新得到更新特征,最后根据更新特征进行计算可以准确得到目标特征数据。
[0137]
在一个实施例中,上述分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征是通过预先训练的第一模型实现的;根据动态特征得到待处理用户数据对应的目标特征数据是通过预先训练的第二模型实现的;其中第一模型和第二模型的训练过程,包括:获取样本数据,样本数据携带标注数据以及特征标签;将样本数据输入至第一模型,第一模型对样本数据进行提取,得到样本特征;将样本特征输入至第二模型,第二模型对样本特征进行预测,得到样本特征的样本目标特征。
[0138]
其中,第一模型是指对静态知识图谱进行特征提取得到静态特征的机器学习模型,其可以是基于任意一个可以对图进行处理的机器学习模型进行训练得到,例如gcn、gnn等;其中第二模型是指对通过第一模型得到的静态特征进行预测的机器学习模型进行训练得到的,例如rnn、lstm、gru等。
[0139]
其中,样本数据是指用与训练第一模型和第二模型的训练数据,其可以是从预先设置的数据库表中抓取的,也可以是从网上公开、抓取的数据,并根据上述数据建立的多个静态知识图谱,其中特征标签是指样本数据中节点的标签,即多个静态知识图谱中节点的标签,其可以用于计算第一模型的损失函数,即第一损失函数;标注数据是指预先对样本数据进行标注的样本数据的真实标签,其可以用于计算第二模型的损失函数,即第二损失函
数,以指导模型进行优化;样本目标特征是指第二模型基于样本数据预测得到的数据。
[0140]
具体地,首先获取样本数据,样本数据携带标注数据,标注数据是预先对样本数据进行标注的,例如要预测用户的个人信用风险等级,那么标注数据就是对客户的评分,在其他实施例中,标注数据根据实际的使用场景进行标注;然后,将样本数据输入至第一模型中,其中可选地,在样本数据输入至第一模型中之前还需要根据样本数据构建多张静态知识图谱,因为基于知识图谱可以更清楚的观察到数据的变化,并且基于知识图谱也更有益于对数据的分析预测。然后将多张静态知识图谱输入至第一模型中,优选地,第一模型为图卷积神经网络,图卷积神经网络是一种专门用于处理图结构数据的神经网络模型,它利用深度神经网络中不同的神经元对图数据中的拓扑信息和属性特征信息分别学习,再进行整合,进而可以得到更精细的节点或子结构的特征表示,即获得特征提取后的样本特征。
[0141]
具体地,获取样本特征之后,将样本特征输入至第二模型中,其中可选地,再将样本特征输入第二模型之前需要按照时间顺序将多个静态知识图谱对应的特征向量进行串联,得到动态样本特征,并将动态样本特征输入至第二模型之中,第二模型根据样本特征进行预测,得到样本特征的样本目标特征,示例性的,输入t至t 3时点的样本特征,经第二模型进行预测得到t 4时点的样本目标特征。
[0142]
在一个实施例中,第一模型根据样本特征以及样本数据中的特征标签计算第一目标损失函数,第一目标损失函数指导优化第一模型,直至第一模型完成训练,第二模型样本目标特征和标注数据对更新特征模型分支计算得到第二目标损失函数,第二损失函数用于指导优化更新特征模型分支,直至更新特征模型分支完成训练。
[0143]
在一个实施例中,在将样本数据输入至第一模型中之前,还可以对样本数据中的节点所缺失的特征标签进行补充,具体地,可以读取特征标签缺失节点所在的三元组数据,并根据三元组数据的标签对特征标签缺失的节点进行补充。
[0144]
在上述实施例中,通过对第一模型和第二模型进行训练,可得到能够对静态知识图谱中数据特征进行特征提取的第一模型,以及将经过第一模型特征提取后的特征进行预测的第二模型。
[0145]
在一个实施例中,上述将样本数据输入至第一模型,第一模型对样本数据进行提取,得到样本特征之后,还包括:根据样本特征以及样本数据中的特征标签计算第一目标损失函数,第一目标损失函数用于指导优化第一模型,直至第一模型完成训练;将样本特征输入至第二模型,第二模型对样本特征进行预测,得到样本特征的样本目标特征之后,还包括:根据样本目标特征和标注数据对更新特征模型分支计算得到第二目标损失函数,第二损失函数用于指导优化更新特征模型分支,直至更新特征模型分支完成训练。
[0146]
其中,第一损失函数是指用于指导第一模型中的参数进行优化的函数,其可以根据真实值与预测值计算得到,即样本数据中的特征标签以及样本特征计算得到;第二损失函数是指用于指导第二模型中的参数进行优化的函数,其可以根据表述数据与样本目标特征计算得到。
[0147]
具体地,第一模型根据特征提取后的样本特征以及样本数据中的特征标签,即静态知识图谱中节点所携带的标签进行计算得到第一目标损失函数,其中可选地,可以根据样本特征、样本数据中的特征标签以及cross entropy损失函数计算第一目标损失函数,需要说明一点的是,在其他实施例中可以根据样本特征、样本数据中的特征标签以及任意一
个损失函数计算第一目标损失函数。
[0148]
具体地,第二模型根据标注数据以及样本目标特征进行计算得到第二目标损失函数,其中可选地,可以根据标注数据、样本目标特征以及categorical_crossentropy函数计算第二目标损失函数,需要说明一点的是,在其他实施例中可以根据标注数据、样本目标特征以及任意一个损失函数计算第二目标损失函数。在其他实施例中,如果需要训练一个个人信用风险等级评定模型,那么样本数据的标注数据为真实的信用评分,因此可以采用样本数据的标注数据以及样本目标特征计算得到第二目标损失函数。
[0149]
在上述实施例中,通过计算第一目标损失函数个第二损失函数可分别优化第一模型和第二模型,使训练完成的第一模型和第二模型的参数更加精确在一个实施例中,如图7所示,提供了一种风险处理方法,包括以下步骤:
[0150]
s702,获取待预测用户对应的待处理用户数据。
[0151]
其中,待预测用户是指需要进行信任评估的客户,待处理用户数据是指待预测用户的对应的基本信息,例如身份信息、财产状况、持卡信息、交易信息、放款信息、还款信息、申请贷款信息贷款记录、贷记卡记录、准贷记卡记录、特殊交易记录和查询记录等相关数据以及客户的行为数据,因为除了金融领域的信息,客户社交网络的信息起着关键的作用。
[0152]
具体地,服务器可以从客户信息库数据库抓取获取待预测用户对应的待处理用户数据,并根据待预测用户对应的待处理用户数据建立多个静态知识图谱。
[0153]
s704,根据上述任意一个实施例中的方法得到待处理用户数据对应的目标特征数据。
[0154]
其中,目标特征数据是在信贷场景下客户的信用评分,根据信用评分可以进一步得到客户的信用等级,其中可选地,可以通过预先设置的评价等级以及目标特征数据来确定待预测用户的信用等级。具体地,可以根据上述任意一个实施中的方法,基于待预测用户对应的多个静态知识图谱得到待处理用户数据对应的目标特征数据。
[0155]
在一个实施例中,将待预测用户对应的多个静态知识图谱输入至预先训练的个人信用风险等级评定模型中,其中预先训练的个人信用风险等级评定模型包括第一模型和第二模型,具体训练过程可参照上述任意一个实施例,在此不再重复赘述,经过个人信用风险等级评定模型的预测可得到待预测客户的信用评分。
[0156]
s706,根据目标特征数据确定待预测用户的风险等级。
[0157]
其中,风险等级是指判断客户风险的量化标准,例如风险等级可以是信任安全用户、信用可信用户、信用可疑用户以及信用不可信用户等。
[0158]
具体地,获得待处理用户数据对应的目标特征数据后,服务器根据目标特征数据确定待预测用户的风险等级,其中可选地,可以通过预先设置的评价等级以及目标特征数据来确定待预测用户的信用等级。
[0159]
在一个实施例中,具体结合图8所示,图8为一个实施例中风险等级评定示意图,首先收集客户信息,然后根据客户信息建立多个静态知识图谱,即动态知识图谱,静态知识图谱中包括两类图,分别是用户-贷款关系图以及用户-用户关系图,这是因为现代交易越来越多是在线上而不是线下当面完成,因此如何掌握客户兴趣和客户情绪,越来越需要分析客户行为数据来完成,因此在建立用户-贷款关系图的同时需要建立用户-用户关系图,以便于获得更好的客户洞察。然后动态知识图谱经过第一模型可得到静态特征,也就是每个
时刻t图谱中节点的结果和内部特征得到node embedding,然后将静态特征进行串联得到动态特征,并将动态特征输入至第二模型,动态特征经过第二模型得到目标特征数据,此时完成个人风险等级模型的预测。其中,模型训练的过程与模型使用的过程类似,只是样本数据的标注数据是已知的,并且需要目标损失函数优化模型分支,也就是说需要第一目标损失函数优化第一模型以及第二目标损失函数优化第二模型,直至第一模型和第二模型完成训练,此时完成个人信用风险等级模型的训练。
[0160]
在其中一个实施例中,可以将预测得到的预测用户的目标特征数据放入预选设置的数据表中,进行数据的更新。
[0161]
在上述实施例中,可以根据待预测用户对应的待处理用户数据进行预测,可以准确得到其风险等级,以便根据风险等级制定贷款利率,对银行来说,可以大大降低客户信贷违约带来的风险。
[0162]
在其中一个实施例中,上述根据目标特征数据确定待预测用户的风险等级,包括:获取预先设置的评价等级;根据目标特征数据和评价等级得到待预测用户的风险等级。
[0163]
其中,评价等级是指用于衡量待预测用户信用程度的量化标准,其可以根据实际的使用场景进行设置。
[0164]
具体地,服务器首先获取预先设置的评价等级,该评价等级中详细包括了各个信用等分对应的信用等级,然后根据目标特征数据和评价等级得到预测用户的风险等级,在一个是实施例中,预先设置的评价等级为85-100为信任安全用户,目标特征数据为92,则该用户的风险等级为信任安全用户。
[0165]
在上述实施例中,通过预先设置的评价等级进而获得待预测用户的风险等级,这样能够根据风险等级结合贷款产品的特性,就可以针对该客户制定相应的贷款利率。
[0166]
在一个实施例中,结合图9,图9为一个实施例中个人信用风险等级评定模型的训练和预测示意图,包括以下几个步骤:
[0167]
步骤一:构建基于动态知识图谱的客户信息库。获取客户的基本信息,例如身份信息、财产状况、持卡信息、交易信息、放款信息、还款信息、申请贷款信息、贷款记录、贷记卡记录、准贷记卡记录、特殊交易记录和查询记录等相关数据。除了金融领域的信息,客户社交网络的信息起着关键的作用。现代交易越来越多是在线上而不是线下当面完成,因此如何掌握客户兴趣和客户情绪,越来越需要分析客户行为数据来完成。通过把客户的文本类数据,例如客服反馈信息、社交媒体上的客户评价、客户调查反馈等,解析文本语义内涵,打上客户标签,建立用户画像。同时,结合知识图谱技术,通过建立客户关系图谱,以获得更好的客户洞察。这包括客户兴趣洞察,即对贷款产品的兴趣,以进行个性化产品推荐、精准营销等,以及客户态度洞察,即对公司和服务满意度、改进意见等,以快速响应客户问题,改善客户体验,加强客户联系,提高客户忠诚度。以上分析都是基于静态的关系图谱,没有考虑图谱的结构是随着时间变化的,但是这些变化本身跟风险是有所关联的。所以在构建知识图谱的时候需要加入时序信息,构建一个动态知识图谱。知识图谱的主要作用还是在于分析关系,尤其是深度关系。
[0168]
步骤二:基于图卷积神经网络和循环神经的特征提取。将步骤一中得到的动态知识图谱拆解为两部分进行处理。首先,对静态知识图谱进行特征提取。然后,将得到的不同时刻的节点结构和内部特征串联起来学习动态特性。
[0169]
静态知识图谱作为一种图结构,可以通过第一模型来进行特征提取,在本实施例中第一模型为gcn。首先,将步骤一中得到的动态知识图谱作为图卷积神经网络的输入,该图谱的图结构中有n个节点,每个节点都有自己的特征,这些节点的特征组成一个n x d维的矩阵x,各个节点之间的关系组成了一个n x n的矩阵a,也成为邻接矩阵。矩阵x和矩阵a就是模型的输入。通过第一模型可以得到多个静态知识图谱对应的静态特征,并将静态特征进行串联得到动态特征。
[0170]
通过上述图卷积神经网络可以得到每个时刻t图谱节点的结构和内部特征,变将动态特征输入至第二模型中。对于时序信息的处理,lstm是一个很好的选择,因此在本实施例中第二模型为lstm。lstm的输入不仅包含当前的信息,还包括以前的信息,也就是说可以用来连接先前的信息到当前的任务上,例如使用过去的信息来推测对当前信息的理解。除此之外,lstm相对于基础的rnn来说,解决了长期依赖的问题。长期依赖的问题是由于间隔不断增大,rnn丧失学习到连接如此远的信息的能力导致的。通过lstm模型可预测得到目标特征数据。
[0171]
步骤三:个人信用风险等级评定模型的训练。将步骤二中得到的客户特征作为卷积神经网络的输入,客户的个人信用风险等级作为标注数据,对模型进行训练,得到个人信用风险等级评定模型。
[0172]
步骤四:个人信用风险等级评定模型的预测。在办理个人贷款业务时,首先需要了解该客户的个人信用风险等级,这时只需要将该客户对应的动态知识图谱送入模型中,就可以预测得到该客户的个人信用风险等级。
[0173]
步骤五:智能利率定价。在个人贷款业务中,当客户选择某款贷款产品时,利用步骤四中得到的客户的个人信用风险等级,结合贷款产品的特性,就可以针对该客户制定相应的贷款利率。同时对该客户进行后续的调查反馈,实时更新图谱信息,对模型做进一步的优化。
[0174]
在上述实施例中,在对客户信息进行关键特征提取时融入时序信息,利用不同时刻知识图谱中的信息对该客户的个人信用风险等级进行评定。对于动态知识图谱的处理主要采用将图卷积神经网络技术和循环神经网络技术。融合了时序信息并通过图卷积神经网络和lstm处理后的特征能大大提高个人信用风险等级评定的准确率,进而提升贷款智能利率定价的精准度,对银行来说,可以大大降低客户信贷违约带来的风险。另外,对不同客群的差异化定价还可以提升新客申请意愿、唤醒激活沉睡客户、促进存量客户复贷,加强产品精细化客户管理能力、提高了客户综合营业贡献;此外,针对金融数据的存储和处理无法满足当前需求的问题,通过构建多个时点对应的静态知识图谱,即动态知识图谱图谱将客户不同时刻的信息进行存储,融入时序信息的图谱对于后续个人信用风险等级评定以及贷款智能利率定价的精度起到了提升的作用。另外,在对该客户制定相应的贷款利率后,通过后续的信息跟踪,实时把该客户的数据更新到图谱中,进一步优化提升模型效果;第三,将gcn网络和lstm网络结合起来作为特征提取器,不仅可以准确快速地提取图结构的特征,还可以将时序信息融入进来,以便于进行分析。
[0175]
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而
且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0176]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的用户数据处理方法的用户数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个用户数据处理装置实施例中的具体限定可以参见上文中对于用户数据处理方法的限定,在此不再赘述。
[0177]
在一个实施例中,如图10所示,提供了一种用户数据处理装置,包括:数据获取模块100、图谱构建模块200、特征提取模块300、特征处理模块400和目标特征计算模块500,其中:
[0178]
数据获取模块100,用于获取待处理用户数据,待处理用户数据包括不同时间点的初始用户数据。
[0179]
图谱构建模块200,用于对各个时间点的初始用户数据进行图谱构建得到多个静态知识图谱。
[0180]
特征提取模块300,用于分别对多个静态知识图谱进行特征提取得到多个静态知识图谱对应的静态特征,静态特征用于表征融合静态知识图谱中各个节点特征的特征数据。
[0181]
特征处理模块400,用于将各个时间点对应的静态特征串联得到动态特征。
[0182]
目标特征计算模块500,用于根据动态特征得到待处理用户数据对应的目标特征数据。
[0183]
在一个实施例中,上述图谱构建模块200,包括:
[0184]
三元组提取单元,用于对各个时间点的初始用户数据提取,得到三元组数据。
[0185]
静态图谱构建单元,用于基于三元组数据进行图谱构建得到多个静态知识图谱。
[0186]
在一个实施例中,上述图谱构建模块200,还包括:
[0187]
标签补充单元,用于当静态知识图谱中的节点存在标签缺失时,读取标签缺失节点所在的三元组数据,根据三元组数据的标签对标签缺失的节点进行补充。
[0188]
在一个实施例中,上述特征提取模块300,包括:
[0189]
特征矩阵提取单元,用于根据多个静态知识图谱,得到多个静态知识图谱对应的特征矩阵。
[0190]
静态特征提起单元,用于将各个特征矩阵进行特征融合,得到多个静态知识图谱对应的静态特征。
[0191]
在一个实施例中,上述特征处理模块400,包括:
[0192]
留存特征提取单元,用于对动态特征进行特征提取,得到留存特征。
[0193]
更新特征提取单元,用于对留存特征进行更新得到更新特征;
[0194]
特征计算单元,用于根据更新特征计算得到目标特征数据。
[0195]
在一个实施例中,上述装置还包括:
[0196]
样本获取模块,用于获取样本数据,样本数据携带标注数据以及特征标签。
[0197]
样本特征获取模块,用于将样本数据输入至第一模型,第一模型对样本数据进行
提取,得到样本特征。
[0198]
第一模型优化模块,用于根据样本特征以及特征标签计算第一目标损失函数,第一目标损失函数用于优化第一模型,直至第一模型完成训练。
[0199]
样本目标特征计算模块,用于将样本特征输入至第二模型,第二模型对样本特征进行预测,得到样本特征的样本目标特征。
[0200]
第二模型优化模块,用于根据样本目标特征和标注数据计算得到第二目标损失函数,第二损失函数用于优化第二模型,直至第二模型完成训练。
[0201]
在一个实施例中,如图11所示,提供了一种风险处理装置,包括:待处理用户数据获取模块600、风险预测模块700和风险等级判断模块800,其中:
[0202]
待处理用户数据获取模块600,用于获取待预测用户对应的待处理用户数据。
[0203]
风险预测模块700,用于根据上述任意一个实施例中的装置得到待处理用户数据对应的目标特征数据。
[0204]
风险等级判断模块800,用于根据目标特征数据确定待预测用户的风险等级。
[0205]
在一个实施例中,上述风险等级判断模块800,包括:
[0206]
评价等级获取单元,用于获取预先设置的评价等级。
[0207]
等级判断单元,用于根据目标特征数据和评价等级得到待预测用户的风险等级。
[0208]
上述用户数据处理装置和风险处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0209]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待处理用户数据和待预测用户对应的待处理用户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户数据处理方法和风险处理方法。
[0210]
本领域技术人员可以理解,图12中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0211]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0212]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0213]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0214]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机
可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0215]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0216]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
技术特征:
1.一种用户数据处理方法,其特征在于,所述方法包括:获取待处理用户数据,所述待处理用户数据包括不同时间点的初始用户数据;对各个所述时间点的初始用户数据进行图谱构建得到多个静态知识图谱;分别对多个所述静态知识图谱进行特征提取得到多个所述静态知识图谱对应的静态特征,所述静态特征用于表征融合所述静态知识图谱中各个节点特征的特征数据;将各个所述时间点对应的静态特征串联得到动态特征;根据所述动态特征得到所述待处理用户数据对应的目标特征数据。2.根据权利要求1所述的方法,其特征在于,所述对各个所述时间点的初始用户数据进行图谱构建得到多个静态知识图谱,包括:对各个所述时间点的初始用户数据提取,得到三元组数据;基于所述三元组数据进行图谱构建得到多个所述静态知识图谱。3.根据权利要求2所述的方法,其特征在于,所述基于所述三元组数据进行图谱构建得到多个静态知识图谱之后,包括:当所述静态知识图谱中的节点存在标签缺失时,读取标签缺失节点所在的三元组数据,根据所述三元组数据的标签对所述标签缺失的节点进行补充。4.根据权利要求1所述的方法,其特征在于,所述分别对多个所述静态知识图谱进行特征提取得到多个所述静态知识图谱对应的静态特征,包括:根据多个所述静态知识图谱,得到多个所述静态知识图谱对应的特征矩阵;将各个所述特征矩阵进行特征融合,得到多个所述静态知识图谱对应的静态特征。5.根据权利要求1所述的方法,其特征在于,所述根据所述动态特征得到所述待处理用户数据对应的目标特征数据,包括:对所述动态特征进行特征提取,得到所述留存特征;对所述留存特征进行更新得到更新特征;根据所述更新特征计算得到所述目标特征数据。6.根据权利要求1所述的方法,其特征在于,所述分别对多个所述静态知识图谱进行特征提取得到多个所述静态知识图谱对应的静态特征是通过预先训练的第一模型实现的;所述根据所述动态特征得到所述待处理用户数据对应的目标特征数据是通过预先训练的第二模型实现的。7.根据权利要求6所述的方法,其特征在于,所述第一模型和所述第二模型的训练过程,包括:获取样本数据,所述样本数据携带标注数据以及特征标签;将所述样本数据输入至第一模型,以通过所述第一模型对所述样本数据进行提取,得到样本特征;根据所述样本特征以及所述特征标签计算第一目标损失函数,所述第一目标损失函数用于优化所述第一模型,直至所述第一模型完成训练;将所述样本特征输入至第二模型,以通过所述第二模型对所述样本特征进行预测,得到所述样本特征的样本目标特征;根据所述样本目标特征和所述标注数据计算得到第二目标损失函数,所述第二损失函数用于优化所述第二模型,直至所述第二模型完成训练。
8.一种风险处理方法,其特征在于,所述方法包括:获取待预测用户对应的待处理用户数据;根据权利要求1-7中任意一项所述的方法得到所述待处理用户数据对应的目标特征数据;根据所述目标特征数据确定所述待预测用户的风险等级。9.根据权利要求8所述的方法,其特征在于,所述根据所述目标特征数据确定所述待预测用户的风险等级,包括:获取预先设置的评价等级;根据所述目标特征数据和所述评价等级得到所述待预测用户的风险等级。10.一种风险评定装置,其特征在于,所述装置包括:数据获取模块,用于获取待处理用户数据,所述待处理用户数据包括不同时间点的初始用户数据;图谱构建模块,用于对各个所述时间点的初始用户数据进行图谱构建得到多个静态知识图谱;特征提取模块,用于分别对多个所述静态知识图谱进行特征提取得到多个所述静态知识图谱对应的静态特征,所述静态特征用于表征融合所述静态知识图谱中各个节点特征的特征数据;特征处理模块,用于将各个所述时间点对应的静态特征串联得到动态特征;目标特征计算模块,用于根据所述动态特征得到所述待处理用户数据对应的目标特征数据。11.一种风险处理装置,其特征在于,所述装置包括:待处理用户数据获取模块,用于获取待预测用户对应的待处理用户数据;风险预测模块,用于根据权利要求10所述的装置得到所述待处理用户数据对应的目标特征数据;风险等级判断模块,用于根据所述目标特征数据确定所述待预测用户的风险等级。12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
技术总结
本申请涉及人工智能技术领域,特别涉及一种用户数据处理方法、装置、计算机设备和存储介质。所述方法包括:获取待处理用户数据,所述待处理用户数据包括不同时间点的初始用户数据;对各个所述时间点的初始用户数据进行图谱构建得到多个静态知识图谱;分别对多个所述静态知识图谱进行特征提取得到多个所述静态知识图谱对应的静态特征,所述静态特征用于表征融合所述静态知识图谱中各个节点特征的特征数据;将各个所述时间点对应的静态特征串联得到动态特征;根据所述动态特征得到所述待处理用户数据对应的目标特征数据。采用本方法能够对待处理用户数据进行准确评估。对待处理用户数据进行准确评估。对待处理用户数据进行准确评估。
技术研发人员:薛雨杉
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2022.02.18
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-7681.html