一种识别模型的确定方法和相关装置与流程

专利查询2023-01-13 143

1.本技术涉及数据处理技术领域，特别是涉及一种识别模型的确定方法和相关装置。

背景技术：

2.在各个行业如广告、零售、电商、出行都有相应的反作弊需求，例如，在广告行业的曝光点击、游戏行业的下载激活、短视频的刷播放浏览刷赞等行为均属于作弊行为，若不能及时识别，均可能给平台方造成大量损失。
3.相关技术中，采用用于节点分类的图神经网络模型识别作弊行为，图神经网络模型如图采样和聚合(graph sample and aggrgate,graphsage)模型、图注意力网络(graph attention network，gat)模型等，图神经网络模型通过图结构可以充分利用图中节点特征和节点间显性或隐性的关系进行作弊行为识别，在正负样本标签丰富的场景，识别准确率较高。
4.但是，在正负样本标签较少的场景，训练得到的图神经网络算法容易出现过拟合，导致对作弊行为的识别准确率较低。

技术实现要素：

5.为了解决上述技术问题，本技术提供了一种识别模型的确定方法和相关装置，用于提高对作弊行为的识别准确率。
6.本技术实施例公开了如下技术方案：
7.一方面，本技术实施例提供一种识别模型的确定方法，所述方法包括：
8.根据对象对产品产生的历史交互行为确定样本二部图，所述样本二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述产品的产品节点，所述关联关系用于体现所述对象与所述产品基于所述历史交互行为的关联；
9.根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量；
10.根据所述关联关系和所述初始节点向量确定第一损失函数；其中，针对所述样本二部图中的目标图节点，所述第一损失函数用于标识所述目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及所述图节点的初始节点向量与非关联节点的初始节点向量的区别度差异，所述关联节点为所述样本二部图中与所述目标图节点的关联关系满足关联阈值、且与所述目标图节点具有不同节点类型的图节点，所述非关联节点为所述样本二部图中与所述目标图节点的关联关系不满足所述关联阈值、且与所述目标图节点具有不同节点类型的图节点；
11.通过所述第一损失函数，基于最小化所述相似度差异、最大化所述区别度差异的训练方向对所述初始编码子模型进行无监督训练，得到编码子模型；
12.根据所述编码子模型确定所述样本二部图中具有样本标签的对象产品对的对向量，所述样本标签用于标识所述对象产品对中的对象和产品间的关联关系是否具有交互风
险；
13.根据所述对向量，通过初始预测子模型确定所述对象产品对的风险预测结果，并基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型；
14.根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。
15.另一方面，本技术实施例提供一种识别模型的确定装置，所述装置包括：第一确定单元、第二确定单元、第三确定单元、无监督训练单元、第四确定单元、监督训练单元和第五确定单元；
16.所述第一确定单元，用于根据对象对产品产生的历史交互行为确定样本二部图，所述样本二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述产品的产品节点，所述关联关系用于体现所述对象与所述产品基于所述历史交互行为的关联；
17.所述第二确定单元，用于根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量；
18.所述第三确定单元，用于根据所述关联关系和所述初始节点向量确定第一损失函数；其中，针对所述样本二部图中的目标图节点，所述第一损失函数用于标识所述目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及所述图节点的初始节点向量与非关联节点的初始节点向量的区别度差异，所述关联节点为所述样本二部图中与所述目标图节点的关联关系满足关联阈值、且与所述目标图节点具有不同节点类型的图节点，所述非关联节点为所述样本二部图中与所述目标图节点的关联关系不满足所述关联阈值、且与所述目标图节点具有不同节点类型的图节点；
19.所述无监督训练单元，用于通过所述第一损失函数，基于最小化所述相似度差异、最大化所述区别度差异的训练方向对所述初始编码子模型进行无监督训练，得到编码子模型；
20.所述第四确定单元，用于根据所述编码子模型确定所述样本二部图中具有样本标签的对象产品对的对向量，所述样本标签用于标识所述对象产品对中的对象和产品间的关联关系是否具有交互风险；
21.所述监督训练单元，用于根据所述对向量，通过初始预测子模型确定所述对象产品对的风险预测结果，并基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型；
22.所述第五确定单元，用于根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。
23.另一方面，本技术实施例提供一种计算机设备，所述设备包括处理器以及存储器：
24.所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；
25.所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。
26.另一方面，本技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述方面所述的方法。
27.另一方面，本技术实施例提供了一种计算机程序产品或计算机程序，该计算机程
序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面所述的方法。
28.由上述技术方案可以看出，在基于对象对产品产生的历史交互行为确定的样本二部图中，包括对象节点、产品节点，以及对象和产品间体现的关联关系。通过初始编码子模型得到表征图节点的初始节点向量，并根据图节点在样本二部图中的关联关系和初始节点向量确定用于对初始编码子模型进行无监督训练的第一损失函数；通过第一损失函数的无监督训练得到的编码子模型可以在确定节点向量时尽量降低高关联的图节点的向量间差异，并尽量提升低关联图节点的向量间区别。样本二部图中包括具有样本标签的对象产品对，样本标签标识所对应对象产品对中的对象和产品间的关联关系是否具有交互风险，基于该编码子模型和初始预测子模型，对样本二部图中具有样本标签的对象产品对进行监督训练，得到的预测子模型和前述编码子模型可以确定出用于交互风险识别的识别模型。
29.基于先对编码子模型的无监督训练，再对预测子模型的监督训练的多阶段训练方式，形成了类似半监督的训练过程，充分利用样本二部图中不具有样本标签的大量交互行为数据，有效的提升识别模型的泛化能力；而且通过将风险识别聚焦在交互行为上，充分利用了交互行为的多样性所带来的对象、产品组合来扩充样本标签，提升了监督训练时可用有标签样本的数量，结合前述无监督训练在样本标签量较少的情况下降低识别模型过拟合的可能，提升了识别模型对交互行为的风险识别精度。
附图说明
30.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
31.图1为本技术实施例提供的识别模型的确定方法的应用场景示意图；
32.图2为本技术实施例提供的一种识别模型的确定方法的流程示意图；
33.图3为本技术实施例提供的一种识别模型的示意图；
34.图4为本技术实施例提供的一种识别模型的确定方法的流程图；
35.图5为本技术实施例提供的一种识别模型的确定装置的示意图；
36.图6为本技术实施例提供的服务器的结构示意图；
37.图7为本技术实施例提供的终端设备的结构示意图。
具体实施方式
38.下面结合附图，对本技术的实施例进行描述。
39.鉴于相关技术中，为了识别作弊行为，对正负样本标签的数量要求较高，若在正负样本标签较少的场景，训练得到的模型易出现过拟合，导致作弊行为的识别准确率较低，使其无法扩展至正负样本标签数量较少的应用场景，基于此，本技术实施例提供一种识别模型的确定方法和相关装置，用于提高对作弊行为的识别准确率。
40.本技术实施例提供的识别模型的确定方法是基于人工智能实现的。人工智能
(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
41.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
42.在本技术实施例中，主要涉及的人工智能技术包括上述机器学习/深度学习等方向。
43.本技术提供的识别模型的确定方法可以应用于具有确定用于识别作弊行为的识别模型功能的确定设备，如终端设备、服务器。其中，终端设备具体可以为手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电等，但并不局限于此；服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本技术在此不做限制。
44.该确定设备还可以具备机器学习能力。机器学习(machine learning,ml)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
45.在本技术实施例提供的识别模型的确定方法中，采用的人工智能模型主要涉及对机器学习的应用，通过无监督训练和有监督训练的结合，在无需提高样本数量的同时，提高识别模型的泛化性，从而提高识别作弊行为的准确率。
46.为了便于理解本技术的技术方案，下面结合实际应用场景，对本技术实施例提供的识别模型的确定方法进行介绍。
47.参见图1，该图为本技术实施例提供的识别模型的确定方法的应用场景示意图。在图1所示的应用场景中，前述的确定设备为服务器100，通过历史交互行为训练得到识别模型，以便通过识别模型识别待处理交互行为是否存在风险。
48.需要说明的是，对象是执行交互行为的主体，如执行应用程序(application，app)下载激活、短视频点赞等行为的用户、设备、账号等。产品为对象执行交互行为的受体，如app、短视频等。历史交互行为中一部分交互行为具有样本标签，通过样本标签标识对象和产品间的关联关系是否具有交互风险，如用户下载激活app的交互行为具有风险、用户点赞短视频的行为不具有交互风险等。
49.服务器100根据对象对产品产生的历史交互行为确定样本二部图。其中，样本二部图包括图节点和关联关系，如图1所示，图节点的节点类型包括如顶点u所示的对象节点和
如顶点v所示的产品节点，顶点u与顶点v之间的连线为对象与产品基于历史交互行为体现的关联关系。
50.服务器100根据样本二部图先通过无监督训练得到编码子模型，再通过有监督训练得到预测子模型，进而得到包括编码子模型和预测子模型的识别模型，下面分别进行说明。
51.无监督训练：根据样本二部图，通过初始编码子模型得到图节点的初始节点向量，并根据关联关系和初始节点向量确定第一损失函数，进而通过最小化相似度差异、最大化区别度差异的训练方向对初始编码子模型进行无监督训练，从而得到编码子模型。相比于样本标签，历史交互行为的数量更多，从而基于历史交互行为训练得到的编码子模型的泛化性更强，通过编码子模型编码得到的节点向量表征节点的准确性更高。
52.有监督训练：根据编码子模型，确定样本二部图中具有样本标签的对象产品对的对向量。根据对向量，通过初始预测子模型确定对象产品对的风险预测结果，基于风险预测结果和样本标签(用于标识对象产品对间的关联关系是否存在交互风险)的差异对初始预测子模型进行监督训练，得到预测子模型。通过准确性更高的对向量训练预测子模型，预测子模型得到的风险预测结果准确性更高。
53.服务器100根据编码子模型和预测子模型得到识别模型，通过识别模型可以对待处理交互行为进行交互风险识别，得到交互风险识别结果，如待处理交互行为存在交互风险或不存在交互风险。
54.由此，基于先对编码子模型的无监督训练，再对预测子模型的监督训练的多阶段训练方式，形成了类似半监督的训练过程，充分利用样本二部图中不具有样本标签的大量交互行为数据，有效的提升识别模型的泛化能力。而且通过将风险识别聚焦在交互行为上，充分利用了交互行为的多样性所带来的对象、产品组合来扩充样本标签，提升了监督训练时可用有标签样本的数量，结合前述无监督训练在样本标签量较少的情况下降低识别模型过拟合的可能，提升了识别模型对交互行为的风险识别精度。
55.下面结合附图，以前述所述的确定设备为服务器为例，对本技术实施例提供的一种识别模型的确定方法进行介绍。
56.参见图2，该图为本技术实施例提供的一种识别模型的确定方法的流程示意图。如图2所示，该识别模型的确定方法包括s201-s207。
57.s201：根据对象对产品产生的历史交互行为确定样本二部图。
58.样本二部图包括图节点和关联关系。其中，图节点是对象节点和产品节点的统称，对象节点用于标识对象，产品节点用于标识产品。样本二部图中，对象节点与产品节点之间的连线称为对象与产品基于历史交互行为体现的关联关系，且一部分关联关系具有样本标签。样本标签用于标识其对应的关联关系是否具有交互风险，具备样本标签的关联关系连接的对象和产品成为对象产品对。
59.本技术提供的识别模型的确定方法，通过无监督训练得到编码子模型，通过有监督训练得到预测子模型，从而根据编码子模型和预测子模型得到识别模型。下面通过s202-s204对无监督训练得到编码子模型进行说明，通过s205-s206对有监督训练得到预测子模型进行说明。
60.s202：根据样本二部图，通过初始编码子模型得到图节点的初始节点向量。
61.相关技术中，通过随机森林、梯度提升决策树(gradient boosting decision tree，gbdt)等树模型，长短期记忆(long short-term memory,lstm)、孤立森林(isolation forest，iforest)等异常检测模型仅从个体维度看待对象的风险性，如某个账号是黑产账号，忽略了对象与产品间的交互行为，使得树模型和异常检测模型无法直接判定对象某次行为的风险性。而在刷量反作弊场景中，正常对象可能无意中会点击刷量视频或者下载刷量的app，异常对象也会点击正常视频或下载正常app，导致作弊行为的识别准确率较低。
62.基于此，本技术根据样本二部图，通过初始编码子模型得到图节点的初始节点向量，初始节点向量的类型包括用于表征对象节点的对象节点向量和用于表征产品的产品节点向量。由于样本二部图中不仅包括对象节点和产品节点，还包括对象节点和产品节点间的关联关系，故初始编码子模型能够考虑对象与产品间的交互行为，充分利用样本二部图中不具有样本标签的大量交互行为数据，有效的提升编码子模型的泛化能力，使得节点向量对节点表征的更为准确，以便提升识别模型对交互行为的风险识别精度。
63.s203：根据关联关系和初始节点向量确定第一损失函数。
64.第一损失函数用于标识目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及图节点的初始节点向量与非关联节点的初始节点向量的区别度差异。
65.其中，目标图节点是样本二部图中的一个图节点，可以是对象节点，也可以是产品节点。关联节点为样本二部图中与目标图节点的关联关系满足关联阈值、且与目标图节点具有不同节点类型的图节点。非关联节点为样本二部图中与目标图节点的关联关系不满足关联阈值、且与目标图节点具有不同节点类型的图节点。例如，若目标图节点的类型是对象节点，则关联节点是与目标图节点满足关联阈值的产品节点，非关联节点是与目标图节点不满足关联阈值的产品节点。本技术实施例不具体限定关联阈值的大小，本领域技术人员可以根据实际需要进行设置。
66.作为一种可能的实现方式，以样本二部图中一个对象节点作为目标图节点(为了方便说明，后续称为目标对象节点)为例进行说明。第一损失函数用于标识目标对象节点的初始节点向量与关联产品节点的初始节点向量之间的相似度差异、关联产品节点的初始节点向量与非关联对象节点的初始节点向量之间的区别度差异，以及目标对象节点的初始节点向量与非关联产品节点的初始节点向量之间的区别度差异。
67.其中，关联产品节点为样本二部图中与目标对象节点的步长小于预设步长的产品节点中的一个或多个；非关联对象节点为样本二部图中关联产品节点的负对象节点，负对象节点为样本二部图中与关联产品节点没有关联关系的对象节点；非关联产品节点为样本二部图中目标对象节点的负产品节点，负产品节点为样本二部图中与目标对象节点没有关联关系的产品节点。其中，一步的步长是指通过一条关联关系，从一个类型的图节点到另一个类型的图节点。本技术实施例不具体限定预设步长的大小，本领域技术人员可以根据实际需要进行设置。
68.例如，第一损失函数可以参见公式(1)：
[0069][0070]
其中，l
unsup
为第一损失函数的值，m为样本二部图的数量，σ为sigmoid函数，tanh为tanh激活函数，为从第k个样本二部图获取的目标对象节点uk的初始节点向量，为关联产品节点ik的初始节点向量，pn为一个负采样分布，q表示负采样的数量，e为期望，为非关联对象节点u
kn
的初始节点向量，为非关联产品节点i
kn
的初始节点向量，v与ws是无监督训练所需调整的模型参数。
[0071]
需要说明的是，关联产品节点ik可以通过在第k个样本二部图中，从目标对象节点uk出发，以固定步长随机游走获得。
[0072]
s204：通过第一损失函数，基于最小化相似度差异、最大化区别度差异的训练方向对初始编码子模型进行无监督训练，得到编码子模型。
[0073]
在对初始编码子模型进行无监督训练的过程中，通过最小化第一损失函数中目标图节点与关联节点的初始节点向量的相似度差异，最大化第一损失函数中图节点与非关联节点的初始节点向量的区别度差异，得到编码子模型。例如，不断调整如v、ws等模型参数，使得l
unsup
最小，将l
unsup
最小时对应的模型参数确定为初始编码子模型的模型参数，从而得到编码子模型。
[0074]
由此，通过第一损失函数的无监督训练得到的编码子模型，可以在确定节点向量时尽量降低高关联的图节点的向量间差异，并尽量提升低关联图节点的向量间区别，使得节点向量对节点表征的更为准确。此外，通过无监督训练，对样本标签的数量要求不高，可以在保证识别准确性的同时，扩展识别模型的应用场景。
[0075]
s205：根据编码子模型确定样本二部图中具有样本标签的对象产品对的对向量。
[0076]
由前述可知，样本二部图中对象节点与产品节点的关联关系中的一部分具有样本标签，用于标识该关联关系是否具有交互风险，具备样本标签的关联关系连接的对象和产品成为对象产品对。
[0077]
根据编码子模型能够确定具有样本标签的对象产品对的对向量。例如，将对象产品对输入至编码子模型中，分别获得对象节点向量和产品节点向量，通过拼接方式获得对象产品对对应的对向量。
[0078]
s206：根据对象产品对的对向量，通过初始预测子模型确定对象产品对的风险预测结果，并基于风险预测结果与样本标签的差异对初始预测子模型进行监督训练，得到预测子模型。
[0079]
将对向量输入至初始预测子模型，通过初始预测子模型得到风险预测结果，基于风险预测结果与样本标签的差异调整初始预测子模型的模型参数，即对初始预测子模型进行监督训练，得到预测子模型。由此，通过将风险识别聚焦在交互行为上，充分利用了交互行为的多样性所带来的对象、产品组合来扩充样本标签，提升了监督训练时可用有标签样本的数量，降低在样本标签量较少的情况下识别模型过拟合的情况出现的可能性，进而提
高识别模型的识别的准确性。
[0080]
s207：根据编码子模型和预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。
[0081]
通过无监督训练得到的编码子模型和通过监督训练的预测子模型，得到识别模型，该识别模型能够用于识别待处理交互行为是否存在交互风险。
[0082]
由上述技术方案可以看出，在基于对象对产品产生的历史交互行为确定的样本二部图中，包括对象节点、产品节点，以及对象和产品间体现的关联关系。通过初始编码子模型得到表征图节点的初始节点向量，并根据图节点在样本二部图中的关联关系和初始节点向量确定用于对初始编码子模型进行无监督训练的第一损失函数；通过第一损失函数的无监督训练得到的编码子模型可以在确定节点向量时尽量降低高关联的图节点的向量间差异，并尽量提升低关联图节点的向量间区别。样本二部图中包括具有样本标签的对象产品对，样本标签标识所对应对象产品对中的对象和产品间的关联关系是否具有交互风险，基于该编码子模型和初始预测子模型，对样本二部图中具有样本标签的对象产品对进行监督训练，得到的预测子模型和前述编码子模型可以确定出用于交互风险识别的识别模型。
[0083]
基于先对编码子模型的无监督训练，再对预测子模型的监督训练的多阶段训练方式，形成了类似半监督的训练过程，充分利用样本二部图中不具有样本标签的大量交互行为数据，有效的提升识别模型的泛化能力；而且通过将风险识别聚焦在交互行为上，充分利用了交互行为的多样性所带来的对象、产品组合来扩充样本标签，提升了监督训练时可用有标签样本的数量，结合前述无监督训练在样本标签量较少的情况下降低识别模型过拟合的可能，提升了识别模型对交互行为的风险识别精度。
[0084]
在一种可能的实现方式中，对象对产品执行的作弊行为在时间上具有割裂性。例如，用户a今天针对短视频a进行点赞刷量作弊行为，用户a明天针对短视频b进行点赞刷量作弊行为。而且，随着历史交互行为的数量增多，样本二部图中一个图节点所连接的关联关系也逐渐增多，为了提升表征图节点的节点向量的准确性，可以根据时间构建多个样本二部图。下面通过s301-s308具体进行介绍。
[0085]
s301：按照固定时长将历史交互行为划分为m个子历史交互行为。
[0086]
由于作弊行为在时间上存在割裂性，故可以按照固定时长将历史交互行为划分为多个，如划分为m个子历史交互行为。本技术实施例不具体限定固定时长，本领域技术人员可以根据实际需要进行设置，如固定时长为24小时。
[0087]
s302：确定与m个子历史交互行为一一对应的m个样本二部图。
[0088]
得到m个子历史交互行为后，根据每一个子历史交互行为一一确定出对应的样本二部图，得到m个样本二部图。样本二部图可以表示为g
train
＝[g1,g2,
…
,gm]，gm＝(u,i,e)。其中，u为对象节点，表示为u＝{u1,u2,
…
,ud}，i为产品节点，表示为i＝{i1,i2,
…
,ic}，e为关联关系，表示为e＝{e1,e2,
…
,ef}，ef＝(ud,ic)。
[0089]
作为一种可能的实现方式，可以对历史交互行为按照固定时长去重，将去重的历史交互行为划分为m个子历史交互行为。例如，将历史交互行为按天去重，将去重的历史交互行为按天划分为m个子历史交互行为，以便根据每一个历史交互行为确定一一对应的m个样本二部图，每一个样本二部图用于表征一天内对象与产品间的历史交互行为。
[0090]
s303：m个样本二部图分别输入至一一对应的m个初始编码子模型，得到m个样本二
部图的图节点的初始节点向量。
[0091]
每一个样本二部图一一对应于一个初始编码子模型，将每一个样本二部图分别输入至对应的初始编码子模型中，得到该样本二部图的图节点的初始节点向量。
[0092]
由此，依据历史交互行为在时间上具有割裂性的特点，按照固定时长构造多个样本二部图，每个样本二部图在时间上互不影响，通过其对应的初始编码子模型，得到的初始节点向量更能够表征对应的节点。例如，对象a今天主要对视频a不断进行播放刷量作弊行为，对象a在明天主要对视频b不断进行播放刷量作弊行为，今天的对象a与明天的对象a的特点不同，今天的对象a与明天的对象a分别对应的节点向量应该不同，将其分开表征，得到的节点向量更为准确。
[0093]
此外，将历史交互行为拆分为多个子历史交互行为，能够在有限的历史交互行为中得到更多有效的历史交互行为。例如，对象a每天均对产品b产生交互行为，若仅有一个样本二部图，虽然有多次历史交互行为，但是在该样本二部图中仅有一条关联关系，若将其按天拆分构建多个样本二部图，可以在每一个样本二部图中均存在一条关联关系，使得历史交互行为更为有效，增加编码子模型的泛化性。
[0094]
s304：通过无监督训练得到m个编码子模型。
[0095]
无监督训练过程为：根据关联关系和初始节点向量确定第一损失函数，通过第一损失函数，基于最小化相似度差异、最大化区别度差异的训练方向对初始编码子模型进行无监督训练，得到编码子模型。相关之处可以参照前述s203和s204，在此不再赘述。
[0096]
s305：固定编码子模型的模型参数。
[0097]
s306：根据编码子模型确定样本二部图中具有样本标签的对象产品对的对向量。
[0098]
在得到编码子模型后，固定编码子模型的模型参数，即通过训练好的编码子模型得到对向量，该对向量的准确性较高。
[0099]
s307：根据对向量，通过初始预测子模型确定对象产品对的风险预测结果，并基于风险预测结果与样本标签的差异对初始预测子模型进行监督训练，得到预测子模型。
[0100]
s308：根据m个编码子模型和预测子模型，确定识别模型。
[0101]
由此，通过划分历史交互行为构建多个样本二部图，可以训练得到多个编码子模型，从而得到包括多个编码子模型和一个预测子模型的识别模型。
[0102]
本技术实施例不具体限定根据m个编码子模型和预测子模型得到识别模型的方式，本领域技术人员可以根据实际需要进行设置。例如，通过m个编码子模型共享模型参数，使得m个编码子模型的模型参数相同，识别模型包括m个编码子模型中的一个和预测子模型，在实际应用时，获取对象对产品产生的待处理交互行为，将待处理交互行为输入至识别模型中，确定待处理交互行为是否具有交互风险。
[0103]
作为一种可能的实现方式，可以通过第二损失函数进行监督训练，第二损失函数用于标识风险预测结果与所述样本标签的差异，第二损失函数可以参见公式(2)：
[0104][0105]
其中，l
sup
为第二损失函数的值，nk为第k个样本二部图中具有样本标签的对象产品对的数量，为对象节点uk与产品节点ik构成的对象产品对的样本标签，为对象节点uk与产品节点ik间关联关系ek的风险标签，为关联关系ek的风险概率，可以如公
式(3)所示：
[0106][0107]
其中，mlp是多层感知器(multilayer perceptron)的英文缩写，属于一种预测子模型，为关联关系ek是否具有标签，可以为公式(4)所示：
[0108][0109]
需要说明的是，在对初始预测子模型进行监督训练的过程中，可以一直固定编码子模型的模型参数，仅对初始预测子模型进行调整。作为一种可能的实现方式，还可以在对初始预测子模型进行监督训练的过程中，一并调整编码子模型的模型参数。具体地，基于联合损失函数调整编码子模型和预测子模型，得到调整后的编码子模型和预测子模型，根据调整后的编码子模型和预测子模型，确定识别模型。
[0110]
其中，联合损失函数是根据第一损失函数和第二损失函数确定的。例如，联合损失函数可以如公式(5)所示：
[0111]
l＝l
unsup
+λl
sup
ꢀꢀꢀ
公式(5)
[0112]
其中，l为联合损失函数的值，l
unsup
为第一损失函数，l
sup
为第二损失函数，λ为学习率。作为一种可能的实现方式，可以保证学习率足够小，从而可以在重点调节预测子模型的同时，微调编码子模型。通过联合训练的方式，使得识别模型能够兼顾整体，提高识别的准确率。
[0113]
由于相关技术中，树模型和异常检测模型等识别方式仅从个体维度看待对象的风险性，忽略了对象与产品间的交互行为，无法直接判定对象某次行为的风险性。而在刷量反作弊场景中，正常对象可能无意中会点击刷量视频或者下载刷量的app，异常对象也会点击正常视频或下载正常app，导致作弊行为的识别准确率较低。基于此，为了降低误判的可能性，本技术实施例提供了一种确定对象与产品交互行为的样本标签的方式，具体如下：
[0114]
a1：获取历史交互行为中的对象标签和产品标签。
[0115]
其中，对象标签用于标识对象是否异常，产品标签用于标识产品是否异常。作为一种可能的实现方式，可以通过0和1表示是否异常，由此可以得到对象标签yu∈{0,1}和产品标签yi∈{0,1}，0表示负样本标签(正常)，1表示正样本标签(异常)。
[0116]
a2：根据对象标签和产品标签确定对象产品对的样本标签。
[0117]
对象与产品的关联关系对应的样本标签可以表示为ye,ye∈{0,1}，0表示负样本标签(正常)，1表示正样本标签(异常)。
[0118]
其中，针对对象标签所对应对象和产品标签所对应产品构成的目标对象产品对，对象标签和产品标签均为正常时，目标对象产品对的样本标签为不具有交互风险，对象标签和产品标签均为异常时，目标对象产品对的样本标签为具有交互风险。
[0119]
由此，通过对象与产品间的交互行为确定样本标签，在后续可以判定对象某次交互行为的风险性。而且，通过将对象标签为正常的对象与产品标签为正常的产品的关联关系标记为正常，将对象标签为异常的对象与产品标签为异常的产品的关联关系标记为异常的方式，能够降低对正常用户可能无意中会点击刷量视频、或者异常用户也会点击正常视
频误判的可能性，提高了交互风险识别的准确性。
[0120]
进一步的，本技术实施例提供一种对象标签和产品标签的确定方式，下面通过b1-b4进行说明。
[0121]
b1：获取历史交互行为中的对象标签。
[0122]
本技术不具体限定对象标签的确定方式，本领域技术人员可以根据实际需要进行设置。
[0123]
例如，在历史交互行为中，若对象被超过4个以上弱专家规则或2个以上强专家规则命中，则该对象对应的对象标签为异常。若对象未被任何专家规则命中且在对象白名单库中，则该对象对应的对象标签为正常。此外，其他未被标识为异常或正常的对象没有标签。
[0124]
需要说明的是，专家规则是根据业务场景，利用账号、设备或互联网络协议(internet protocol，ip)地址，以及用户操作的频率、操作的路径等制定的反作弊策略，可以根据对作弊行为的影响程度分为强专家规则和弱专家规则。
[0125]
b2：根据对象标签确定历史交互行为中被标识为正常的第一对象和被标识为异常的第二对象。
[0126]
由前述可知，对象可以被分为三种类型，对象标签为正常的第一对象、对象标签为异常的第二对象，以及没有标签的对象。
[0127]
b3：确定历史交互行为中产品所关联的对象集合。
[0128]
产品可以与一个或多个对象产生交互，故产品所关联的对象集合中可以包括至少一个对象，每一个产品均可以确定出其所关联的对象集合。
[0129]
b4：根据对象集合中的第一对象和第二对象，确定产品对应的产品标签。
[0130]
本技术实施例不具体限定根据对象标签确定产品标签的具体方式，本领域技术人员可以根据实际需要进行设置。
[0131]
例如，若对象集合中的第一对象的数量满足第一预设条件，则该产品对应的产品标签为正常，若对象集合中的第二对象的数量满足第二预设条件，则该产品对应的产品标签为异常。例如，若产品所关联的对象集合中第二对象的数量超过1000且第二对象占对象集合的比例超过10％，则该产品的产品标签为异常。若产品所关联的对象集合中仅包括第一对象，不包括第二对象，则该产品的产品标签为正常。作为一种可能的实现方式，若与产品产生交互的对象未被任何专家规则命中，该产品也可以被标识为正常。
[0132]
相关技术中，标签传播算法(label propagation algorithm,lpa)等社区发现算法在模型的构造过程中，忽略了图节点的属性，如未能充分利用账号、设备的特征属性和已有的风险画像和标签等，导致识别作弊行为的准确性较低。基于此，本技术实施例提供一种s202，即根据样本二部图，通过初始编码子模型得到图节点的初始节点向量的具体实施方式，具体如下：
[0133]
s2021：根据样本二部图中对象节点在历史交互行为中对应的对象交互参数，确定对象节点的对象特征；根据样本二部图中产品节点在历史交互行为中对应的产品响应参数，确定产品节点的产品特征。
[0134]
作为一种可能的实现方式，对象交互参数包括同属于互联网协议(ip)的固定网络段中对象的总数、对象与产品产生的交互行为的总次数、对象的历史交互行为中按照不同
产品分桶的最大下载次数中的至少一种。产品响应参数包括产品的历史交互行为中按照不同对象分桶的最大下载次数、产品的历史交互行为中按照不同互联网协议的固定网络段分桶的最大下载次数、产品的曝光下载比率、产品的下载安装比率中的至少一种。
[0135]
以用户下载app的刷量场景为例，若样本二部图是按天划分得到的，则对象交互参数可以为当天同c类ip地址的用户数量、当天用户下载app的总下载次数、当天用户下载app中按app分桶的最大下载次数中的一种或多种组合，还可以包括当天总ip数量、ip按照app分桶的最大数量、下载同一个app的最大搜索词数量、当天用户对应的应用市场版本数量、当天app总曝光下载比率、当天总下载安装比率、当天下载行为按小时分桶最大下载时段等。产品响应参数可以为当天app的下载行为中按照用户分桶的最大下载次数、当天app的下载行为中按照c类ip地址分桶的最大下载次数、当天app的曝光下载比率中的一种或多种组合，还可以包括当天app的下载行为中按照设备屏幕尺寸分桶的最大下载次数、当天app的下载行为中按照设备品牌分桶的最大下载次数、当天app的下载行为中按照小时分桶的最大下载次数、当天app的下载安装比率等。
[0136]
s2022：根据对象节点的对象特征和产品节点的产品特征，通过初始编码子模型得到图节点的初始节点向量。
[0137]
由此，在本实施例中，通过充分利用图节点的属性生成对象特征和产品特征，再通过初始编码子模型对对象特征和产品特征进行优化，即尽量降低高关联的图节点的向量间差异，并尽量提升低关联图节点的向量间区别，得到初始节点向量，从而提高初始节点向量对图节点表征的准确性，进一步提高识别模型的准确性。
[0138]
作为一种可能的实现方式，本技术实施例提供一种s207，即根据编码子模型和预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型的具体实施方式，具体如下：
[0139]
s2071：获取对应历史交互行为的测试集。
[0140]
前述所述的、用于确定样本二部图的历史交互行为可以构成训练集，测试集所包括待测试交互行为涉及的第一时间区间与训练集所包括的历史交互行为涉及的第二时间区间相邻，且第一时间区间晚于第二时间区间。
[0141]
作为一种可能的实现方式，可以获取1月-4月期间对象对产品产生的交互行为作为历史交互行为，构成训练集，将5月期间对象对产品产生的交互行为作为测试交互行为，构成测试集。
[0142]
s2072：根据编码子模型和预测子模型，确定待测试识别模型。
[0143]
s2073：基于测试集对待测试识别模型进行风险识别评估测试后，根据测试结果确定识别模型。
[0144]
可以确定测试集所包括的测试交互行为对应的对象标签、产品标签以及关联关系对应的样本标签，按照固定时长去重，并按照固定时长构建测试样本二部图，可以表示为g
test
＝[g1,g2,
…
,g
t
]，t表示测试样本二部图的数量。
[0145]
需要说明的是，对于测试集的相关处理可以参照训练集，在此不再赘述。
[0146]
本技术实施例不具体限定根据测试结果确定识别模型的具体方式，本领域技术人员可以根据实际需要进行设置。例如，若测试结果表征待测试识别模型的准确性达到准确性阈值，则将待测试识别模型作为识别模型。
[0147]
由此，在本实施例中，可以通过发生时间较晚的、时间上相邻的、且与训练集同属于一个应用场景的测试集，对待测试识别模型进行测试，能够更好的测试待测试识别模型的准确性，从而保证识别模型的准确性。
[0148]
作为一种可能的实现方式，在s207，即根据编码子模型和预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型之后，本技术实施例还提供一种识别模型的使用方式，具体如下：
[0149]
s208：获取对象对产品产生的待处理交互行为。
[0150]
s209：将待处理交互行为输入至识别模型中，确定待处理交互行为是否具有交互风险。
[0151]
由此，在本实施例中，在得到识别模型后，将需要进行交互风险识别的交互行为作为待处理交互行为，输入至识别模型，通过识别模型确定待处理交互行为是否具有交互风险。
[0152]
作为一种可能的实现方式，在s207，即根据编码子模型和预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型之后，本技术实施例还提供一种识别模型的更新方式，具体如下：
[0153]
s210：获取对象对产品产生的待更新交互行为。
[0154]
待更新交互行为所涉及的第三时间区间晚于训练集所包括的历史交互行为涉及的第二时间区间。
[0155]
s211：根据待更新交互行为确定更新的样本二部图。
[0156]
s212：根据更新的样本二部图更新识别模型的模型参数。
[0157]
由此，在本实施例中，通过不断更新的训练识别模型所需的交互行为，不断更新识别模型的模型参数，实现识别模型的定期自动更新，提高交互行为识别的准确性，提升刷量反作弊场景中黑产的作弊门槛。
[0158]
需要说明的是，本技术实施例提供的识别模型可以应用到各种对产品刷量的反作弊场景中，例如，手机应用市场中搜索排名刷量、视频播放刷量等。接下来，将结合图3和图4，以用户下载app刷量的作弊场景为例进行说明。
[0159]
参见图3，该图为本技术实施例提供的一种识别模型的示意图。
[0160]
如图3所示，识别模型包括编码层、拼接层、全连接层和调整层。通过s301和s302所述的方式可以得到m个样本二部图，如图3所示的样本二部图区域。
[0161]
样本二部图区域与编码层连接，编码层包括m个初始编码子模型，将样本二部图区域中包括的m个样本二部图分别输入至一一对应的m个初始编码子模型中，通过如s202-s204的方式无监督训练得到m个编码子模型。
[0162]
根据编码子模型确定样本二部图中具有样本标签的对象产品对对应的对象节点向量和产品节点向量，将对象节点向量和产品节点向量输入至拼接层，通过拼接层得到对向量。
[0163]
将对向量输入至全连接层，该全连接层包括前述所述的初始预测子模型，通过如s205-s206的方式进行监督训练，得到预测子模型。通过预测子模型可以得到风险预测结果。
[0164]
将风险预测结果输入至调整层，如通过sigmoid函数将风险预测结果调整为风险
概率值。例如，利用训练好的识别模型，预测测试集的风险标签和风险概率值p∈[0，1]。由于负样本比例远大于正样本，需要对风险概率p进行调整，同时将风险概率值转换成风险分score∈[0，100]。
[0165]
参见图4，该图为本技术实施例提供的一种识别模型的确定方法的流程图。
[0166]
s401：根据交互行为确定样本标签。
[0167]
获取1月-5月期间用户下载app的交互行为，并按照前述b1-b4以及a1-2的方式确定样本标签。
[0168]
s402：按照时间顺序划分交互行为，得到训练集和测试集。
[0169]
将1月-4月期间用户下载app的交互行为确定为训练集，将5月期间用户下载app的交互行为确定为测试集。
[0170]
s403：根据训练集按天构造样本二部图。
[0171]
可以通过如s301-s302所述的方式得到训练所需的样本二部图。
[0172]
s404：通过无监督训练得到编码子模型。
[0173]
可以通过如s202-s204的方式得到编码子模型。
[0174]
s405：通过监督训练得到预测子模型。
[0175]
可以通过如s205-s206的方式得到预测子模型。
[0176]
s406：联合微调训练编码子模型和预测子模型。
[0177]
可以以前述所述的联合损失函数为训练目标，联合微调编码子模型和预测子模型。
[0178]
s407：根据测试集按天构造测试样本二部图。
[0179]
可以通过如s301-s302所述的方式得到测试所需的测试样本二部图。
[0180]
s408：得到识别模型。
[0181]
可以通过s2072-s2073的方式得到识别模型。
[0182]
本实施例得到的测试结果与其他方式的测试结果的对比如表1所示。
[0183]
表1
[0184][0185][0186]
由此，在用户下载app刷量的作弊场景中，相比于gbdt模型、兆高密子图挖掘的d-cube算法(dense-block detection in terabyte-scale tensors，d-cube)模型、基于二分图的图采样和聚合(bipartite graphsage)模型、基于图神经网络的归纳矩阵补全算法(inductive matrix completion based on graph neural networks，igmc)模型，在只有少量的样本标签的情况下，本技术实施例的识别模型的效果较好，证明了识别模型的有效
性。
[0187]
针对上述实施例提供的识别模型的确定方法，本技术实施例还提供了一种识别模型的确定装置。
[0188]
参见图5，该图为本技术实施例提供的一种识别模型的确定装置的示意图。如图5所示，该识别模型的确定装置500包括：第一确定单元501、第二确定单元502、第三确定单元503、无监督训练单元504、第四确定单元505、监督训练单元506和第五确定单元507；
[0189]
所述第一确定单元501，用于根据对象对产品产生的历史交互行为确定样本二部图，所述样本二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述产品的产品节点，所述关联关系用于体现所述对象与所述产品基于所述历史交互行为的关联；
[0190]
所述第二确定单元502，用于根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量；
[0191]
所述第三确定单元503，用于根据所述关联关系和所述初始节点向量确定第一损失函数；其中，针对所述样本二部图中的目标图节点，所述第一损失函数用于标识所述目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及所述图节点的初始节点向量与非关联节点的初始节点向量的区别度差异，所述关联节点为所述样本二部图中与所述目标图节点的关联关系满足关联阈值、且与所述目标图节点具有不同节点类型的图节点，所述非关联节点为所述样本二部图中与所述目标图节点的关联关系不满足所述关联阈值、且与所述目标图节点具有不同节点类型的图节点；
[0192]
所述无监督训练单元504，用于通过所述第一损失函数，基于最小化所述相似度差异、最大化所述区别度差异的训练方向对所述初始编码子模型进行无监督训练，得到编码子模型；
[0193]
所述第四确定单元505，用于根据所述编码子模型确定所述样本二部图中具有样本标签的对象产品对的对向量，所述样本标签用于标识所述对象产品对中的对象和产品间的关联关系是否具有交互风险；
[0194]
所述监督训练单元506，用于根据所述对向量，通过初始预测子模型确定所述对象产品对的风险预测结果，并基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型；
[0195]
所述第五确定单元507，用于根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。
[0196]
作为一种可能的实现方式，所述第一确定单元501，用于：
[0197]
按照固定时长将所述历史交互行为划分为m个子历史交互行为；
[0198]
确定与所述m个子历史交互行为一一对应的m个样本二部图；
[0199]
所述第二确定单元502，用于：
[0200]
将所述m个样本二部图分别输入至一一对应的m个初始编码子模型，得到所述m个样本二部图的图节点的初始节点向量；
[0201]
所述第五确定单元507，用于：
[0202]
根据m个编码子模型和所述预测子模型，确定所述识别模型，所述m个编码子模型是所述m个初始编码子模型分别通过所述无监督训练得到的。
[0203]
作为一种可能的实现方式，所述识别模型的确定装置500还包括标签确定单元，用于：
[0204]
获取所述历史交互行为中的对象标签和产品标签，所述对象标签用于标识所述对象是否异常，所述产品标签用于标识所述产品是否异常；
[0205]
根据所述对象标签和所述产品标签确定所述对象产品对的样本标签；其中，针对所述对象标签所对应对象和所述产品标签所对应产品构成的目标对象产品对；所述对象标签和所述产品标签均为正常时，所述目标对象产品对的样本标签为不具有交互风险，所述对象标签和所述产品标签均为异常时，所述目标对象产品对的样本标签为具有交互风险。
[0206]
作为一种可能的实现方式，所述识别模型的确定装置500还包括标签确定单元，用于：
[0207]
获取所述历史交互行为中的对象标签；
[0208]
根据所述对象标签确定所述历史交互行为中被标识为正常的第一对象和被标识为异常的第二对象；
[0209]
确定所述历史交互行为中所述产品所关联的对象集合；
[0210]
根据所述对象集合中的所述第一对象和所述第二对象，确定所述产品对应的所述产品标签。
[0211]
作为一种可能的实现方式，所述第二确定单元502，用于：
[0212]
根据所述样本二部图中对象节点在所述历史交互行为中对应的对象交互参数，确定所述对象节点的对象特征；根据所述样本二部图中产品节点在所述历史交互行为中对应的产品响应参数，确定所述产品节点的产品特征；
[0213]
根据所述对象特征和所述产品特征，通过所述初始编码子模型得到所述图节点的初始节点向量。
[0214]
作为一种可能的实现方式，所述对象交互参数包括同属于互联网协议的固定网络段中对象的总数、所述对象与产品产生的交互行为的总次数、所述对象的历史交互行为中按照不同产品分桶的最大下载次数中的至少一种；
[0215]
所述产品响应参数包括产品的历史交互行为中按照不同对象分桶的最大下载次数、所述产品的历史交互行为中按照不同互联网协议的固定网络段分桶的最大下载次数、所述产品的曝光下载比率、所述产品的下载安装比率中的至少一种。
[0216]
作为一种可能的实现方式，在所述基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型的过程中，所述识别模型的确定装置500还包括固定单元，用于：
[0217]
固定所述编码子模型的模型参数。
[0218]
作为一种可能的实现方式，所述监督训练单元506，用于：
[0219]
基于联合损失函数调整所述编码子模型和所述预测子模型，得到调整后的所述编码子模型和所述预测子模型；所述联合损失函数是根据所述第一损失函数和第二损失函数确定的，所述第二损失函数用于标识所述风险预测结果与所述样本标签的差异；
[0220]
所述第五确定单元507，用于：
[0221]
根据调整后的所述编码子模型和所述预测子模型，确定所述识别模型。
[0222]
作为一种可能的实现方式，所述识别模型的确定装置500还包括获取单元，用于：
[0223]
获取对应所述历史交互行为的测试集，所述测试集所包括待测试交互行为涉及的第一时间区间与所述历史交互行为涉及的第二时间区间相邻，且所述第一时间区间晚于所述第二时间区间；
[0224]
所述第五确定单元507，用于：
[0225]
根据所述编码子模型和所述预测子模型，确定待测试识别模型；
[0226]
基于所述测试集对所述待测试识别模型进行风险识别评估测试后，根据测试结果确定所述识别模型。
[0227]
作为一种可能的实现方式，所述识别模型的确定装置500还包括应用单元，用于：
[0228]
获取所述对象对所述产品产生的待处理交互行为；
[0229]
将所述待处理交互行为输入至所述识别模型中，确定所述待处理交互行为是否具有交互风险。
[0230]
作为一种可能的实现方式，所述识别模型的确定装置500还包括更新单元，用于：
[0231]
获取所述对象对所述产品产生的待更新交互行为，所述待更新交互行为涉及的第三时间区间晚于所述历史交互行为涉及的第二时间区间；
[0232]
根据所述待更新交互行为确定更新的样本二部图；
[0233]
根据所述更新的样本二部图更新所述识别模型的模型参数。
[0234]
由上述技术方案可以看出，在基于对象对产品产生的历史交互行为确定的样本二部图中，包括对象节点、产品节点，以及对象和产品间体现的关联关系。通过初始编码子模型得到表征图节点的初始节点向量，并根据图节点在样本二部图中的关联关系和初始节点向量确定用于对初始编码子模型进行无监督训练的第一损失函数，通过第一损失函数的无监督训练得到的编码子模型可以在确定节点向量时尽量降低高关联的图节点的向量间差异，并尽量提升低关联图节点的向量间区别。样本二部图中包括具有样本标签的对象产品对，样本标签标识所对应对象产品对中的对象和产品间的关联关系是否具有交互风险，基于该编码子模型和初始预测子模型，对样本二部图中具有样本标签的对象产品对进行监督训练，得到的预测子模型和前述编码子模型可以确定出用于交互风险识别的识别模型。
[0235]
基于先对编码子模型的无监督训练，再对预测子模型的监督训练的多阶段训练方式，形成了类似半监督的训练过程，充分利用样本二部图中不具有样本标签的大量交互行为数据，有效的提升识别模型的泛化能力，而且通过将风险识别聚焦在交互行为上，充分利用了交互行为的多样性所带来的对象、产品组合来扩充样本标签，提升了监督训练时可用有标签样本的数量，结合前述无监督训练在样本标签量较少的情况下降低识别模型过拟合的可能，提升了识别模型对交互行为的风险识别精度。
[0236]
本技术实施例还提供了一种计算机设备，该计算机设备为前述介绍的计算机设备，该计算机设备可以为服务器或者终端设备，前述所述的识别模型的确定装置可以内置于服务器或终端设备中，下面将从硬件实体化的角度对本技术实施例提供的计算机设备进行介绍。其中，图6所示为服务器的结构示意图，图7所示为终端设备的结构示意图。
[0237]
参见图6，该图为本技术实施例提供的一种服务器结构示意图，该服务器1400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，cpu)1422和存储器1432，一个或一个以上应用程序1442或数据1444的存储介质1430(例如一个或一个以上海量存储设备)。其中，存储器1432和存储介质1430可
以是短暂存储或持久存储。存储在存储介质1430的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，cpu 1422可以设置为与存储介质1430通信，在服务器1400上执行存储介质1430中的一系列指令操作。
[0238]
服务器1400还可以包括一个或一个以上电源1426，一个或一个以上有线或无线网络接口1450，一个或一个以上输入输出接口1458，和/或，一个或一个以上操作系统1441，例如windows server
tm
，mac os x
tm
，unix
tm
,linux
tm
，freebsd
tm
等等。
[0239]
上述实施例中由服务器所执行的步骤可以基于该图6所示的服务器结构。
[0240]
其中，cpu 1422用于执行如下步骤：
[0241]
根对象对产品产生的历史交互行为确定样本二部图，所述样本二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述产品的产品节点，所述关联关系用于体现所述对象与所述产品基于所述历史交互行为的关联；
[0242]
根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量；
[0243]
根据所述关联关系和所述初始节点向量确定第一损失函数；其中，针对所述样本二部图中的目标图节点，所述第一损失函数用于标识所述目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及所述图节点的初始节点向量与非关联节点的初始节点向量的区别度差异，所述关联节点为所述样本二部图中与所述目标图节点的关联关系满足关联阈值、且与所述目标图节点具有不同节点类型的图节点，所述非关联节点为所述样本二部图中与所述目标图节点的关联关系不满足所述关联阈值、且与所述目标图节点具有不同节点类型的图节点；
[0244]
通过所述第一损失函数，基于最小化所述相似度差异、最大化所述区别度差异的训练方向对所述初始编码子模型进行无监督训练，得到编码子模型；
[0245]
根据所述编码子模型确定所述样本二部图中具有样本标签的对象产品对的对向量，所述样本标签用于标识所述对象产品对中的对象和产品间的关联关系是否具有交互风险；
[0246]
根据所述对向量，通过初始预测子模型确定所述对象产品对的风险预测结果，并基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型；
[0247]
根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。
[0248]
可选的，cpu 1422还可以执行本技术实施例中识别模型的确定方法任一具体实现方式的方法步骤。
[0249]
参见图7，该图为为本技术实施例提供的一种终端设备的结构示意图。图7示出的是与本技术实施例提供的终端设备相关的智能手机的部分结构的框图，该智能手机包括：射频(radio frequency，简称rf)电路1510、存储器1520、输入单元1530、显示单元1540、传感器1550、音频电路1560、无线保真(简称wifi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解，图7中示出的智能手机结构并不构成对智能手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
[0250]
下面结合图7对智能手机的各个构成部件进行具体的介绍：
[0251]
rf电路1510可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的
下行信息接收后，给处理器1580处理；另外，将设计上行的数据发送给基站。
[0252]
存储器1520可用于存储软件程序以及模块，处理器1580通过运行存储在存储器1520的软件程序以及模块，从而实现智能手机的各种功能应用以及数据处理。
[0253]
输入单元1530可用于接收输入的数字或字符信息，以及产生与智能手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1530可包括触控面板1531以及其他输入设备1532。触控面板1531，也称为触摸屏，可收集用户在其上或附近的触摸操作，并根据预先设定的程式驱动相应的连接装置。除了触控面板1531，输入单元1530还可以包括其他输入设备1532。具体地，其他输入设备1532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0254]
显示单元1540可用于显示由用户输入的信息或提供给用户的信息以及智能手机的各种菜单。显示单元1540可包括显示面板1541，可选的，可以采用液晶显示器(liquid crystal display，简称lcd)、有机发光二极管(organic light-emitting diode，简称oled)等形式来配置显示面板1541。
[0255]
智能手机还可包括至少一种传感器1550，比如光传感器、运动传感器以及其他传感器。至于智能手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。
[0256]
音频电路1560、扬声器1561，传声器1562可提供用户与智能手机之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号，传输到扬声器1561，由扬声器1561转换为声音信号输出；另一方面，传声器1562将收集的声音信号转换为电信号，由音频电路1560接收后转换为音频数据，再将音频数据输出处理器1580处理后，经rf电路1510以发送给比如另一智能手机，或者将音频数据输出至存储器1520以便进一步处理。
[0257]
处理器1580是智能手机的控制中心，利用各种接口和线路连接整个智能手机的各个部分，通过运行或执行存储在存储器1520内的软件程序和/或模块，以及调用存储在存储器1520内的数据，执行智能手机的各种功能和处理数据。可选的，处理器1580可包括一个或多个处理单元。
[0258]
智能手机还包括给各个部件供电的电源1590(比如电池)，优选的，电源可以通过电源管理系统与处理器1580逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0259]
尽管未示出，智能手机还可以包括摄像头、蓝牙模块等，在此不再赘述。
[0260]
在本技术实施例中，该智能手机所包括的存储器1520可以存储程序代码，并将所述程序代码传输给所述处理器。
[0261]
该智能手机所包括的处理器1580可以根据所述程序代码中的指令执行上述实施例提供的识别模型的确定方法。
[0262]
本技术实施例还提供一种计算机可读存储介质，用于存储计算机程序，该计算机程序用于执行上述实施例提供的识别模型的确定方法。
[0263]
本技术实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的识别模型的确定方法。
[0264]
本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质可以是下述介质中的至少一种：只读存储器(英文：read-only memory，缩写：rom)、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0265]
需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备及系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
[0266]
以上所述，仅为本技术的一种具体实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本技术的保护范围之内。本技术在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。因此，本技术的保护范围应该以权利要求的保护范围为准。

技术特征：
1.一种识别模型的确定方法，其特征在于，所述方法包括：根据对象对产品产生的历史交互行为确定样本二部图，所述样本二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述产品的产品节点，所述关联关系用于体现所述对象与所述产品基于所述历史交互行为的关联；根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量；根据所述关联关系和所述初始节点向量确定第一损失函数；其中，针对所述样本二部图中的目标图节点，所述第一损失函数用于标识所述目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及所述图节点的初始节点向量与非关联节点的初始节点向量的区别度差异；所述关联节点为所述样本二部图中与所述目标图节点的关联关系满足关联阈值、且与所述目标图节点具有不同节点类型的图节点，所述非关联节点为所述样本二部图中与所述目标图节点的关联关系不满足所述关联阈值、且与所述目标图节点具有不同节点类型的图节点；通过所述第一损失函数，基于最小化所述相似度差异、最大化所述区别度差异的训练方向对所述初始编码子模型进行无监督训练，得到编码子模型；根据所述编码子模型确定所述样本二部图中具有样本标签的对象产品对的对向量，所述样本标签用于标识所述对象产品对中的对象和产品间的关联关系是否具有交互风险；根据所述对向量，通过初始预测子模型确定所述对象产品对的风险预测结果，并基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型；根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。2.根据权利要求1所述的方法，其特征在于，所述根据对象对产品产生的历史交互行为确定样本二部图，包括：按照固定时长将所述历史交互行为划分为m个子历史交互行为；确定与所述m个子历史交互行为一一对应的m个样本二部图；所述根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量，包括：将所述m个样本二部图分别输入至一一对应的m个初始编码子模型，得到所述m个样本二部图的图节点的初始节点向量；所述根据编码子模型和所述预测子模型，确定用于待处理交互行为进行交互风险识别的识别模型，包括：根据m个编码子模型和所述预测子模型，确定所述识别模型，所述m个编码子模型是所述m个初始编码子模型分别通过所述无监督训练得到的。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述历史交互行为中的对象标签和产品标签，所述对象标签用于标识所述对象是否异常，所述产品标签用于标识所述产品是否异常；根据所述对象标签和所述产品标签确定所述对象产品对的样本标签；其中，针对所述对象标签所对应对象和所述产品标签所对应产品构成的目标对象产品对；所述对象标签和所述产品标签均为正常时，所述目标对象产品对的样本标签为不具有交互风险，所述对象标签和所述产品标签均为异常时，所述目标对象产品对的样本标签为具有交互风险。
4.根据权利要求3所述的方法，其特征在于，所述获取所述历史交互行为中的对象标签和所述产品标签，包括：获取所述历史交互行为中的对象标签；根据所述对象标签确定所述历史交互行为中被标识为正常的第一对象和被标识为异常的第二对象；确定所述历史交互行为中所述产品所关联的对象集合；根据所述对象集合中的所述第一对象和所述第二对象，确定所述产品对应的所述产品标签。5.根据权利要求1所述的方法，其特征在于，所述根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量，包括：根据所述样本二部图中对象节点在所述历史交互行为中对应的对象交互参数，确定所述对象节点的对象特征；根据所述样本二部图中产品节点在所述历史交互行为中对应的产品响应参数，确定所述产品节点的产品特征；根据所述对象特征和所述产品特征，通过所述初始编码子模型得到所述图节点的初始节点向量。6.根据权利要求5所述的方法，其特征在于，所述对象交互参数包括同属于互联网协议的固定网络段中对象的总数、所述对象与产品产生的交互行为的总次数、所述对象的历史交互行为中按照不同产品分桶的最大下载次数中的至少一种；所述产品响应参数包括产品的历史交互行为中按照不同对象分桶的最大下载次数、所述产品的历史交互行为中按照不同互联网协议的固定网络段分桶的最大下载次数、所述产品的曝光下载比率、所述产品的下载安装比率中的至少一种。7.根据权利要求1所述的方法，其特征在于，在所述基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型的过程中，所述方法还包括：固定所述编码子模型的模型参数。8.根据权利要求1所述的方法，其特征在于，所述基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型，包括：基于联合损失函数调整所述编码子模型和所述预测子模型，得到调整后的所述编码子模型和所述预测子模型；所述联合损失函数是根据所述第一损失函数和第二损失函数确定的，所述第二损失函数用于标识所述风险预测结果与所述样本标签的差异；所述根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型，包括：根据调整后的所述编码子模型和所述预测子模型，确定所述识别模型。9.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取对应所述历史交互行为的测试集，所述测试集所包括待测试交互行为涉及的第一时间区间与所述历史交互行为涉及的第二时间区间相邻，且所述第一时间区间晚于所述第二时间区间；所述根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型，包括：
根据所述编码子模型和所述预测子模型，确定待测试识别模型；基于所述测试集对所述待测试识别模型进行风险识别评估测试后，根据测试结果确定所述识别模型。10.根据权利要求1-9任意一项所述的方法，其特征在于，所述方法还包括：获取所述对象对所述产品产生的待处理交互行为；将所述待处理交互行为输入至所述识别模型中，确定所述待处理交互行为是否具有交互风险。11.根据权利要求1-9任意一项所述的方法，其特征在于，所述方法还包括：获取所述对象对所述产品产生的待更新交互行为，所述待更新交互行为涉及的第三时间区间晚于所述历史交互行为涉及的第二时间区间；根据所述待更新交互行为确定更新的样本二部图；根据所述更新的样本二部图更新所述识别模型的模型参数。12.一种识别模型的确定装置，其特征在于，所述装置包括：第一确定单元、第二确定单元、第三确定单元、无监督训练单元、第四确定单元、监督训练单元和第五确定单元；所述第一确定单元，用于根据对象对产品产生的历史交互行为确定样本二部图，所述样本二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述产品的产品节点，所述关联关系用于体现所述对象与所述产品基于所述历史交互行为的关联；所述第二确定单元，用于根据所述样本二部图，通过初始编码子模型得到所述图节点的初始节点向量；所述第三确定单元，用于根据所述关联关系和所述初始节点向量确定第一损失函数；其中，针对所述样本二部图中的目标图节点，所述第一损失函数用于标识所述目标图节点的初始节点向量与关联节点的初始节点向量的相似度差异，以及所述图节点的初始节点向量与非关联节点的初始节点向量的区别度差异，所述关联节点为所述样本二部图中与所述目标图节点的关联关系满足关联阈值、且与所述目标图节点具有不同节点类型的图节点，所述非关联节点为所述样本二部图中与所述目标图节点的关联关系不满足所述关联阈值、且与所述目标图节点具有不同节点类型的图节点；所述无监督训练单元，用于通过所述第一损失函数，基于最小化所述相似度差异、最大化所述区别度差异的训练方向对所述初始编码子模型进行无监督训练，得到编码子模型；所述第四确定单元，用于根据所述编码子模型确定所述样本二部图中具有样本标签的对象产品对的对向量，所述样本标签用于标识所述对象产品对中的对象和产品间的关联关系是否具有交互风险；所述监督训练单元，用于根据所述对向量，通过初始预测子模型确定所述对象产品对的风险预测结果，并基于所述风险预测结果与所述样本标签的差异对所述初始预测子模型进行监督训练，得到预测子模型；所述第五确定单元，用于根据所述编码子模型和所述预测子模型，确定用于对待处理交互行为进行交互风险识别的识别模型。13.一种计算机设备，其特征在于，所述设备包括处理器以及存储器：所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；
所述处理器用于根据所述程序代码中的指令执行权利要求1-11任意一项所述的方法。14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1-11任意一项所述的方法。15.一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行权利要求1-11任意一项所述的方法。

技术总结
本申请实施例公开了一种识别模型的确定方法和相关装置，至少涉及人工智能中的机器学习，基于对象对产品产生的历史交互行为确定的样本二部图中，通过初始编码子模型得到表征图节点的初始节点向量，通过第一损失函数的无监督训练得到的编码子模型可以在确定节点向量时尽量降低高关联的图节点的向量间差异，并尽量提升低关联图节点的向量间区别。样本二部图中包括具有样本标签的对象产品对，样本标签标识所对应对象产品对中的对象和产品间的关联关系是否具有交互风险，基于该编码子模型和初始预测子模型，对样本二部图中具有样本标签的对象产品对进行监督训练，得到的预测子模型和前述编码子模型可以确定出用于交互风险识别的识别模型。的识别模型。的识别模型。

技术研发人员：龙贺兆
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2022.03.17
技术公布日：2022/5/25

转载请注明原文地址:https://tc.8miu.com/read-14824.html

专利

最新回复(0)