一种信息审核方法、装置、电子设备及计算机可读介质与流程

    专利查询2024-01-18  98



    1.本技术涉及计算机技术领域,尤其涉及一种信息审核方法、装置、电子设备及计算机可读介质。


    背景技术:

    2.伴随着互联网行业的快速发展,电子商务作为一种先进的商业模式在我国快速兴起。消费者选择电商平台网络购物难免会产生各种各样的交易纠纷。在网购过程中,消费者基于自身在购物中的问题与商家沟通无法得到满意的解决方案的情况下,消费者往往向电商平台申请纠纷,让电商平台作为第三方机构保护其合理的权益。电商平台在解决网络购物中消费者与商家产生的纠纷时,对纠纷审核的结果往往不准确。
    3.在实现本技术过程中,发明人发现现有技术中至少存在如下问题:
    4.电商平台在解决网络购物中消费者与商家产生的纠纷时,对纠纷审核的结果往往不准确。


    技术实现要素:

    5.有鉴于此,本技术实施例提供一种信息审核方法、装置、电子设备及计算机可读介质,能够解决现有的电商平台在解决网络购物中消费者与商家产生的纠纷时,对纠纷审核的结果往往不准确的问题。
    6.为实现上述目的,根据本技术实施例的一个方面,提供了一种信息审核方法,包括:
    7.接收信息审核请求,获取对应的待审核信息和信息维度标识;
    8.调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征;
    9.对各特征进行特征组合,生成对应预设维度的组合特征;
    10.基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。
    11.可选地,在调用审核模型之前,方法还包括:
    12.获取初始神经网络模型;
    13.获取已标注的样本数据,样本数据包括已审核信息的预设数量维度下的预设数量特征以及对应标注的审核通过概率;
    14.将预设数量维度下的预设数量特征作为初始神经网络模型的输入,将对应标注的审核通过概率作为初始神经网络模型的期望输出,对初始神经网络模型进行训练,得到中间神经网络模型;
    15.获取未标注的样本数据和对应的准确审核通过概率,将未标注的样本数据输入至中间神经网络模型,输出对应的预测审核通过概率,将预测审核通过概率与准确审核通过概率进行匹配,将匹配得到的预测审核通过概率对应的未标注样本数据和对应的预测审核通过概率加入已标注的样本数据,并更新已标注的样本数据;
    16.响应于达到模型训练终止条件,结束模型训练,以生成审核模型。
    17.可选地,基于审核通过概率确定对待审核信息的审核结果,包括:
    18.将审核通过概率与动态阈值进行比较,响应于审核通过概率大于动态阈值,确定对待审核信息的审核通过,响应于审核通过概率小于动态阈值,将信息审核请求发送至预设线下审核节点进行审核;
    19.响应于预设线下审核节点对信息审核请求对应的待审核信息的审核不通过,生成审核意见发送至客服节点,以使客服节点基于审核意见更新信息审核请求;
    20.响应于预设线下审核节点对信息审核请求对应的待审核信息的审核通过,接收客服评价分数,基于客服评价分数更新审核模型的模型参数。
    21.可选地,基于客服评价分数更新审核模型的模型参数,包括:
    22.将客服评价分数进行非线性变换,得到非线性变换值;
    23.基于非线性变换值和审核模型修正前的输出概率,生成审核模型修正后的输出概率;
    24.基于修正后的输出概率和修正前的输出概率,对审核模型的模型参数进行调整,进而更新调整后的审核模型的模型参数。
    25.可选地,生成审核模型修正后的输出概率,包括:
    26.将非线性变换值与审核模型修正前的输出概率的乘积确定为审核模型修正后的输出概率。
    27.可选地,述对各特征进行特征组合,生成对应预设维度的组合特征,包括:
    28.基于各信息维度标识,调用对应的嵌入编码转换方法,以生成对应维度的特征向量;
    29.将各特征向量沿着预设维度进行叉乘,以生成对应预设维度的组合特征。
    30.可选地,将特征向量沿着预设维度进行叉乘,包括:
    31.确定特征向量中的显式特征对应的显式特征向量和隐式特征对应的隐式特征向量;
    32.将显式特征向量和隐式特征向量沿着预设维度进行叉乘。
    33.另外,本技术还提供了一种信息审核装置,包括:
    34.接收单元,被配置成接收信息审核请求,获取对应的待审核信息和信息维度标识;
    35.提取单元,被配置成调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征;
    36.组合特征生成单元,被配置成对各特征进行特征组合,生成对应预设维度的组合特征;
    37.信息审核单元,被配置成基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。
    38.可选地,装置还包括训练单元,被配置成:
    39.获取初始神经网络模型;
    40.获取已标注的样本数据,样本数据包括已审核信息的预设数量维度下的预设数量特征以及对应标注的审核通过概率;
    41.将预设数量维度下的预设数量特征作为初始神经网络模型的输入,将对应标注的
    审核通过概率作为初始神经网络模型的期望输出,对初始神经网络模型进行训练,得到中间神经网络模型;
    42.获取未标注的样本数据和对应的准确审核通过概率,将未标注的样本数据输入至中间神经网络模型,输出对应的预测审核通过概率,将预测审核通过概率与准确审核通过概率进行匹配,将匹配得到的预测审核通过概率对应的未标注样本数据和对应的预测审核通过概率加入已标注的样本数据,并更新已标注的样本数据;
    43.响应于达到模型训练终止条件,结束模型训练,以生成审核模型。
    44.可选地,信息审核单元进一步被配置成:
    45.将审核通过概率与动态阈值进行比较,响应于审核通过概率大于动态阈值,确定对待审核信息的审核通过,响应于审核通过概率小于动态阈值,将信息审核请求发送至预设线下审核节点进行审核;
    46.响应于预设线下审核节点对信息审核请求对应的待审核信息的审核不通过,生成审核意见发送至客服节点,以使客服节点基于审核意见更新信息审核请求;
    47.响应于预设线下审核节点对信息审核请求对应的待审核信息的审核通过,接收客服评价分数,基于客服评价分数更新审核模型的模型参数。
    48.可选地,信息审核单元进一步被配置成:
    49.将客服评价分数进行非线性变换,得到非线性变换值;
    50.基于非线性变换值和审核模型修正前的输出概率,生成审核模型修正后的输出概率;
    51.基于修正后的输出概率和修正前的输出概率,对审核模型的模型参数进行调整,进而更新调整后的审核模型的模型参数。
    52.可选地,信息审核单元进一步被配置成:
    53.将非线性变换值与审核模型修正前的输出概率的乘积确定为审核模型修正后的输出概率。
    54.可选地,组合特征生成单元进一步被配置成:
    55.基于各信息维度标识,调用对应的嵌入编码转换方法,以生成对应维度的特征向量;
    56.将各特征向量沿着预设维度进行叉乘,以生成对应预设维度的组合特征。
    57.可选地,组合特征生成单元进一步被配置成:
    58.确定特征向量中的显式特征对应的显式特征向量和隐式特征对应的隐式特征向量;
    59.将显式特征向量和隐式特征向量沿着预设维度进行叉乘。
    60.另外,本技术还提供了一种信息审核电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述的信息审核方法。
    61.另外,本技术还提供了一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现如上述的信息审核方法。
    62.上述发明中的一个实施例具有如下优点或有益效果:本技术通过接收信息审核请求,获取对应的待审核信息和信息维度标识;调用审核模型,以基于信息维度标识,从待审
    核信息中提取对应的特征;对各特征进行特征组合,生成对应预设维度的组合特征;基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。从而可以实现准确地对消费者提交的纠纷信息进行审核,改善消费者购物体验。
    63.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
    附图说明
    64.附图用于更好地理解本技术,不构成对本技术的不当限定。其中:
    65.图1是根据本技术第一实施例的信息审核方法的主要流程的示意图;
    66.图2是根据本技术第二实施例的信息审核方法的主要流程的示意图;
    67.图3是根据本技术第三实施例的信息审核方法的应用场景示意图;
    68.图4为本技术实施例的信息审核方法的审核模型整体架构示意图;
    69.图5为本技术实施例的信息审核方法的弱监督学习流程示意图;
    70.图6是根据本技术实施例的信息审核装置的主要单元的示意图;
    71.图7是本技术实施例可以应用于其中的示例性系统架构图;
    72.图8是适于用来实现本技术实施例的终端设备或服务器的计算机系统的结构示意图。
    具体实施方式
    73.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
    74.图1是根据本技术第一实施例的信息审核方法的主要流程的示意图,如图1所示,信息审核方法包括:
    75.步骤s101,接收信息审核请求,获取对应的待审核信息和信息维度标识。
    76.本实施例中,信息审核方法的执行主体(例如,可以是服务器)可以通过有线连接或无线连接的方式,接收信息审核请求。该信息审核请求具体可以是审核消费者与商家的纠纷的请求。执行主体可以根据接收的信息审核请求中携带的信息获取地址获取对应的待审核信息。并且,执行主体还可以获取信息审核请求中携带的信息维度标识。其中,待审核信息可以是用户(即消费者)填写的与商家的纠纷信息,例如可以包括用户自身信息、售后信息、纠纷记录、商品信息、物流信息等,本技术实施例对待审核信息所包含的具体内容不做限定。信息维度,例如可以包括用户自身信息维度、售后信息维度、纠纷记录信息维度、商品信息维度、物流信息维度等。相应的,信息维度标识可以是对应上述各信息维度的标识,例如,yhzs、sh、jfjl、sp、wl等,分别对应的是信息维度,例如可以包括用户自身信息维度、售后信息维度、纠纷记录信息维度、商品信息维度、物流信息维度。本技术实施例对信息维度标识的具体内容不做限定。
    77.步骤s102,调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征。
    78.具体地,在调用审核模型之前,方法还包括:
    79.获取初始神经网络模型;
    80.获取已标注的样本数据,样本数据包括已审核信息的预设数量维度下的预设数量特征以及对应标注的审核通过概率;
    81.将预设数量维度下的预设数量特征作为初始神经网络模型的输入,将对应标注的审核通过概率作为初始神经网络模型的期望输出,对初始神经网络模型进行训练,得到中间神经网络模型;
    82.获取未标注的样本数据和对应的准确审核通过概率,将未标注的样本数据输入至中间神经网络模型,输出对应的预测审核通过概率,将预测审核通过概率与准确审核通过概率进行匹配,将匹配得到的预测审核通过概率对应的未标注样本数据和对应的预测审核通过概率加入已标注的样本数据,并更新已标注的样本数据;
    83.响应于达到模型训练终止条件,结束模型训练,以生成审核模型。
    84.示例的,如图5所示,基于弱监督学习方法得到审核模型,以实现基于少量训练样本训练初始神经网络模型,以得到审核模型。具体训练过程可以为:首先获取已标注的少量样本数据,用以训练初始神经网络模型,然后将训练完成的初始神经网络模型预测大量未标注的数据,并将预测结果中置信度较高的样本数据标记为信任数据,然后与已标注的样本数据进行混合,构成新的混合样本数据,用新的混合样本数据再次训练由初始神经网络模型经过训练得到的中间神经网络模型,进而基于再次训练得到的模型参数更新初始神经网络模型的模型参数,重复该过程,直至模型参数不再变化,也就表明模型性能不再提升,表示弱监督学习过程完成,最终得到审核模型。使用弱监督学习方法训练模型,可以大量节省标注这一繁琐、低效的过程,仍可以得到较为理想的审核模型来处理纠纷业务,是一种有效的模型训练方法。
    85.关于得到的审核模型,具体地,审核模型用于实现接收到的信息审核请求对应的纠纷审核单的概率预测。为了进一步提高模型预测的效果,采用隐式和显式两种特征交互方式,自动、高效构造特征,丰富特征的维度和信息。这一特征交互工作是在审核模型里面的特征交互模块中实现的,不再需要人为低效的构造特征;同时,为改变数据量少造成的模型学习不充分的情况,采用弱监督学习方案,从而达到改善模型的性能的目的。具体地,审核模型整体架构如图4所示,该审核模型的输入数据包括了多个维度下的多个特征,例如离散特征(sparse_feature)、密集特征(dense_feature)、文本特征(text_feature)和多值离散特征(seq_feature)。分别通过离散嵌入(sparse_embedding)、密集嵌入(dense_embedding)、文本嵌入(text_embedding)、多值离散特征嵌入(seq_embedding)将特征嵌入到模型中,实现特征的高效交叉,提取更多维度下丰富的相关信息。其中,deeplayer:指全连接神经网络,这里是3层,是全连接神经网络在模型整体不同位置的习惯性叫法。textcnn:是一个中文本模型,在这里实现的是模型特征的提取,将文本输出32维度的向量。reduce_mean:按某一特定维度求平均。具体地,通过引入特征自动筛选senet网络模型,动态地学习各个特征的重要性,给予重要特征更大的权重,即对于重要性高的特征会给予更高的权重,反之,不重要的特征权重会很小,以实现对特征的选择。离散特征交叉主要发生在图4中的bilinearinteraction的双线性部分,该部分改变以往的内积或者哈达玛积特征交互的方式,结合两者优点共同维护一组矩阵实现特征交互。特征交互层
    (interactinglayer)的self-attention部分主要是实现特征在多个不同子空间下进行特征交互,关注不同子空间下特征的信息,丰富特征信息的多样性。最后,在concat层将根据特征嵌入、特征自动筛选、离散特征交叉得到的特征向量沿着预设维度进行拼接,并通过显式交叉模块cin模型实现特征的显式交互,从另一角度实现特征交叉,进一步增加了特征的多样性,使得模型学习的信息更加丰富,从而提高了模型效果。并且将经过特征交互层(interactinglayer)得到的特征向量输入至3层全连接神经网络(deepplayer),进而将输出的结果与显式交叉模块cin模型输出的结果一起输入多个全连接神经网络(dense)进行概率预测。当然,本技术实施例还在模型输出结果的基础上,引入了修正系数,主要是对输出概率乘上修正系数,作为最终的审核模型预测概率。
    86.具体地,图4中的dense:是多个全连接神经网络,这里是两次神经网络,是在deeplayer和cin的输出输入到dense后,经过两层神经网络输出纠纷单通过的概率。bilinearinteraction:是通过双线性实现离散特征的交叉,从而得到高阶复杂特征。cin:以向量级别实现特征的显式交叉模块。self-attention:通过自注意力的机制实现特征交互,这样就可以得到模型特征之间的相互影响以及特征重要性对特征的较好表达。text_embedding:是textcnn模型的输出32维度的向量。concat:实现特征向量沿着某一维度实现拼接。senet:这是一种注意力方式实现特征的自动筛选,对于重要性高的特征会给予更高的权重,反之,不重要的特征权重会很小。
    87.步骤s103,对各特征进行特征组合,生成对应预设维度的组合特征。
    88.在审核模型中,调用concat层以对各输入的特征沿着预设维度进行拼接,生成对应预设维度的组合特征。具体地,通过对显式和隐式的高维特征的交叉,高效合理的构建模型特征,以提升模型效果,降低特征还发难度。具体地,显式和隐式的高维特征是修饰语,修饰的是模型,这种模型组件可以实现特征的显式和隐式的交叉。显式是指模型使用了cin特征交叉的方式,以向量维度实现特征的交互。而隐式特征交叉主要是指模型在进行特征交互的时候,是以向量元素维度进行交互,主要是指模型里的各种dnn模块。本实施例中高维特征(generalization)主要是从数据中发现之前很少出现的或者没有出现的特征组合,体现出新颖性。低维特征(memorization)主要是从数据中,发现物体item和特征之间的直接相关性,体现准确性。
    89.步骤s104,基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。
    90.执行主体可以调用审核模型中的多个全连接神经网络(dense)以基于组合特征,确定待审核信息的审核通过概率。
    91.具体地,基于审核通过概率确定对待审核信息的审核结果,包括:
    92.将审核通过概率与动态阈值进行比较,响应于审核通过概率大于动态阈值,确定对待审核信息的审核通过,响应于审核通过概率小于动态阈值,将信息审核请求发送至预设线下审核节点进行审核;响应于预设线下审核节点对信息审核请求对应的待审核信息的审核不通过,生成审核意见发送至客服节点,以使客服节点基于审核意见更新信息审核请求;响应于预设线下审核节点对信息审核请求对应的待审核信息的审核通过,接收客服评价分数,基于客服评价分数更新审核模型的模型参数。
    93.具体地,动态阈值,是实时的、动态设置的阈值,具体可以通过具体情况而定,本申
    请实施例对动态阈值的具体数值不做限定。当审核通过概率大于动态阈值时,审核通过,当审核通过概率小于动态阈值时,审核不通过,可以驳回到线下的人工审核节点继续进行审核。进行线下的人工审核后,由客服对该类型的信息审核请求进行评价打分,并将打分结果记录到存储系统作为特征反馈到模型。另外,该评价打分也将作为审核模型的修正系数实现审核模型的修正。这样,整个纠纷审核系统就实现了自纠正与闭环的能力,既高效快速的处理了纠纷审核问题,又使得消费者的购物体验得到改善。
    94.具体地,基于客服评价分数更新审核模型的模型参数,包括:
    95.将客服评价分数进行非线性变换,得到非线性变换值;
    96.基于非线性变换值和审核模型修正前的输出概率,生成审核模型修正后的输出概率;
    97.基于修正后的输出概率和修正前的输出概率,对审核模型的模型参数进行调整,进而更新调整后的审核模型的模型参数。
    98.示例的,将客服的打分,例如是10分制,经过y=log(1+x)/3非线性变换后,将输出值y乘以模型的输出概率p得到就是模型修正后的输出值,这样客服的反馈就可以实现对模型输出的干扰和反馈,形成闭环。
    99.具体地,生成审核模型修正后的输出概率,包括:
    100.将非线性变换值与审核模型修正前的输出概率的乘积确定为审核模型修正后的输出概率。
    101.本实施例通过接收信息审核请求,获取对应的待审核信息和信息维度标识;调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征;对各特征进行特征组合,生成对应预设维度的组合特征;基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。从而可以实现准确地对消费者提交的纠纷信息进行审核,改善消费者购物体验。
    102.图2是根据本技术第二实施例的信息审核方法的主要流程示意图,如图2所示,信息审核方法包括:
    103.步骤s201,接收信息审核请求,获取对应的待审核信息和信息维度标识。
    104.步骤s202,调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征。
    105.步骤s203,基于各信息维度标识,调用对应的嵌入编码转换方法,以生成对应维度的特征向量。
    106.步骤s204,将各特征向量沿着预设维度进行叉乘,以生成对应预设维度的组合特征。
    107.具体地,将特征向量沿着预设维度进行叉乘,包括:
    108.确定特征向量中的显式特征对应的显式特征向量和隐式特征对应的隐式特征向量;
    109.将显式特征向量和隐式特征向量沿着预设维度进行叉乘。
    110.具体地,显式特征和隐式特征是修饰语,修饰的是模型,指的是模型组件可以实现特征的显式和隐式的交叉。显式特征向量是指模型使用了cin特征交叉的方式,以向量维度存在的特征向量。而隐式特征向量主要是指模型在进行特征交互的时候,是以向量元素维
    度存在的特征向量,主要是指模型里的各种dnn模块中的特征向量。即显式特征向量,指的是以向量维度存在的特征向量。隐式特征向量,指的是以向量元素维度存在的特征向量。向量元素是向量的组成元素,以更细微的形式存在。示例的,向量为(1,2,3,4,5),向量元素可以是该向量中的1或2或3或4或5。可以将一个向量比作10盒糖果,其中的3盒糖果,可以是3个向量元素。在得到显式特征向量和隐式特征向量后,执行主体可以将显式特征向量和隐式特征向量沿着预设维度进行叉乘。具体地,显式特征向量可以对应第一矩阵,隐式特征向量可以对应第二矩阵,将显式特征向量和隐式特征向量沿着预设维度进行叉乘也就是将第一矩阵和第二矩阵中的各元素进行基于矩阵的运算规则的叉乘。这里,第一矩阵和第二矩阵仅为指代,不作为对本技术实施例的限定。可以实现高效合理的构建模型特征,以提升模型效果,降低特征开发难度。
    111.步骤s205,基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。
    112.步骤s205的原理与步骤s104的原理类似,此处不再赘述。
    113.图3是根据本技术第三实施例的信息审核方法的应用场景示意图。本技术实施例的信息审核方法,可以应用于消费者与电商纠纷的场景。如图3所示,执行主体在接收到信息审核请求后,可以从数据存储中获取对应的待审核信息。然后对待审核信息进行数据处理与审核模型预测。待审核信息,如图3所示,可以是售后记录、订单状态、物流状态、售后状态、事件id状态、客户脱敏信息、用户画像、客服评价打分等信息。然后,执行主体可以对待审核信息进行数据预处理,将进行预处理后的信息输入至审核模型中,并引入修正系数以对审核模型进行修正,提升审核模型的预测准确性。审核模型基于输入的预处理后的信息,得到审核通过概率。然后执行主体可以基于审核通过概率进行阈值判断与评价反馈。具体可以是将得到的审核通过概率与动态阈值进行比对,当审核通过概率大于动态阈值时,则审核通过,纠纷处理完成。当审核通过概率小于动态阈值时,则驳回信息审核请求,转至人工审核。当确定人工审核通过,则客服对审核模型预测情况进行评价打分,纠纷处理完成。当确认人工审核不通过时,则获取人工审核的审核意见,使客服重新申请信息审核请求对应的纠纷单,纠纷单回流至审核模型进行重新审核,得到重新审核后的审核通过概率,重复该过程,直至纠纷处理完成。
    114.示例的,图3中进行数据存储的是数据存储模块。数据存储模块存储了模型的多个原始数据特征,主要包括售后环节相关信息、状态信息以及一些用户自身属性,这些数据经过数据预处理实现了模型的训练和模型预测。具体的特征包括用户脱敏信息,如年龄、性别、所属省份、地市等信息;售后信息主要包括申请原因和用户期望等;纠纷记录主要是纠纷原因、纠纷诉求等;商品信息主要是是商品类别以及商品自身属性;物流信息主要包括物流状态、物流时效等多个特征,而用户售后画像,主要是针对用户的售后记录刻画的用户标签等。
    115.当然,这些数据只是原始的数据,并不能作为模型的特征进行预测,需要对该部分数据完成转换操作。本发明根据不同模型对数据特征的不同要求,以不同方式进行转换。对于离散特征、连续特征、文本特征以及多值离散特征分别采用不同的方式进行编码转换,以适应模型的嵌入embedding需求。其中,分别采用不同的方式进行编码转换,包括:对于离散特征会采取embedding的方式进行编码,对于连续特征会进行非线性变化log(1+x)log(1+
    x),然后输入到多层神经网络;对于文本特征按字维度进行数字编码,然后按编码进行embedding;对于多值离散特征会和文本特征处理相似,也是进行切字编码,然后进行embedding。
    116.对数据进行处理与审核模型预测的是审核模型预测模块。该模块主要是实现纠纷审核单的概率预测。其中,为了进一步提高模型预测的效果,改变以往的特征处理方式,设计了隐式和显式两种特征交互方式,自动、高效构造特征,丰富特征的维度和信息,这一特征交互工作是在模型里面特征交互的模块中实现的,不再需要人为低效的构造特征;同时,为改变数据量少造成的模型学习不充分的情况,设计了弱监督学习方案,从而达到改善模型的性能的目的。
    117.进行阈值判断与评价反馈的是阈值判断与评价反馈模块。该模块主要实现了纠纷审核的阈值判断以及客服审核评价实现纠纷审核的完整闭环。信息审核请求对应的纠纷单经过审核模型输出该单据的审核通过概率,并经过修正系数进行修正模型的通过概率,以进一步适合业务处理。当这一通过概率经过动态阈值处理后,输出该纠纷单是否通过。通过则代表该纠纷单处理完成,不通过则将该纠纷单流转到人工审核,由人工进行审核是否通过。由于纠纷单绝大多是以通过的处理结果,审核模型可以解决极大的需要审核通过的单子,且对于不通过流转到人工审核的确保了其确实具有问题,这时再由相关客服人员重新申请,并回流到纠纷单审核池中。在纠纷单流转到人工审核时,客服可以对审核模型预测情况进行评价打分,这是客服对于模型的客观反馈。我们将这一评价打分经过合理处理后,作为模型的修正系数,对审核模型预测进行反馈修正,可以更加客观公正给出审核结果,极大地提高了电商平台纠纷审核的解决效率和客户体验。
    118.本技术实施例提供了一种弱监督学习方法来构建智能的审核模型。该方法可以针对类似纠纷审核标注数据困难,时间成本高导致标注样本少的问题,利用模型自身的学习能力,基于少量标注样本,结合预测的样本置信度,不断迭代优化学习模型,使得模型可以从少量标注样本学习到纠纷合理审核结果。该方案可以大大减少标注样本,又可以取得较为不错的模型效果。本技术的技术方案针对模型的数据特征不充分存在不足的问题,设计了一种高效的、自动的构建模型特征的解决方法。当进行纠纷单审核时,可以利用构建的显式或者隐式特征构造方法,将用户脱敏信息、售后信息、纠纷记录、商品信息、物流信息进行多个维度的特征交叉,得到在不同子空间下多个特征,丰富特征的维度和多样性,然后再利用复杂神经网络模型构建模型,以提升审核模型的效果。
    119.图6是根据本技术实施例的信息审核装置的主要单元的示意图。如图6所示,信息审核装置包括接收单元601、提取单元602、组合特征生成单元603和信息审核单元604。
    120.接收单元601,被配置成接收信息审核请求,获取对应的待审核信息和信息维度标识。
    121.提取单元602,被配置成调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征。
    122.组合特征生成单元603,被配置成对各特征进行特征组合,生成对应预设维度的组合特征。
    123.信息审核单元604,被配置成基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。
    124.在一些实施例中,信息审核装置还包括图6中未示出的训练单元,被配置成:获取初始神经网络模型;获取已标注的样本数据,样本数据包括已审核信息的预设数量维度下的预设数量特征以及对应标注的审核通过概率;将预设数量维度下的预设数量特征作为初始神经网络模型的输入,将对应标注的审核通过概率作为初始神经网络模型的期望输出,对初始神经网络模型进行训练,得到中间神经网络模型;获取未标注的样本数据和对应的准确审核通过概率,将未标注的样本数据输入至中间神经网络模型,输出对应的预测审核通过概率,将预测审核通过概率与准确审核通过概率进行匹配,将匹配得到的预测审核通过概率对应的未标注样本数据和对应的预测审核通过概率加入已标注的样本数据,并更新已标注的样本数据;响应于达到模型训练终止条件,结束模型训练,以生成审核模型。
    125.在一些实施例中,信息审核单元604进一步被配置成:将审核通过概率与动态阈值进行比较,响应于审核通过概率大于动态阈值,确定对待审核信息的审核通过,响应于审核通过概率小于动态阈值,将信息审核请求发送至预设线下审核节点进行审核;响应于预设线下审核节点对信息审核请求对应的待审核信息的审核不通过,生成审核意见发送至客服节点,以使客服节点基于审核意见更新信息审核请求;响应于预设线下审核节点对信息审核请求对应的待审核信息的审核通过,接收客服评价分数,基于客服评价分数更新审核模型的模型参数。
    126.在一些实施例中,信息审核单元604进一步被配置成:将客服评价分数进行非线性变换,得到非线性变换值;基于非线性变换值和审核模型修正前的输出概率,生成审核模型修正后的输出概率;基于修正后的输出概率和修正前的输出概率,对审核模型的模型参数进行调整,进而更新调整后的审核模型的模型参数。
    127.在一些实施例中,信息审核单元604进一步被配置成:将非线性变换值与审核模型修正前的输出概率的乘积确定为审核模型修正后的输出概率。
    128.在一些实施例中,组合特征生成单元603进一步被配置成:基于各信息维度标识,调用对应的嵌入编码转换方法,以生成对应维度的特征向量;将各特征向量沿着预设维度进行叉乘,以生成对应预设维度的组合特征。
    129.在一些实施例中,组合特征生成单元603进一步被配置成:确定特征向量中的显式特征对应的显式特征向量和隐式特征对应的隐式特征向量;将显式特征向量和隐式特征向量沿着预设维度进行叉乘。
    130.需要说明的是,在本技术信息审核方法和信息审核装置在具体实施内容上具有相应关系,故重复内容不再说明。
    131.图7示出了可以应用本技术实施例的信息审核方法或信息审核装置的示例性系统架构700。
    132.如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
    133.用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
    134.终端设备701、702、703可以是具有信息审核处理屏并且支持网页浏览的各种电子
    设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
    135.服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所提交的信息审核请求提供支持的后台管理服务器(仅为示例)。后台管理服务器可以接收信息审核请求,获取对应的待审核信息和信息维度标识;调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征;对各特征进行特征组合,生成对应预设维度的组合特征;基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。从而可以实现准确地对消费者提交的纠纷信息进行审核,改善消费者购物体验。
    136.需要说明的是,本技术实施例所提供的信息审核方法一般由服务器705执行,相应地,信息审核装置一般设置于服务器705中。
    137.应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
    138.下面参考图8,其示出了适于用来实现本技术实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
    139.如图8所示,计算机系统800包括中央处理单元(cpu)801,其可以根据存储在只读存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。在ram803中,还存储有计算机系统800操作所需的各种程序和数据。cpu801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
    140.以下部件连接至i/o接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(crt)、液晶征信授权查询处理器(lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
    141.特别地,根据本技术公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(cpu)801执行时,执行本技术的系统中限定的上述功能。
    142.需要说明的是,本技术所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序
    的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
    143.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
    144.描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元、提取单元、组合特征生成单元和信息审核单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
    145.作为另一方面,本技术还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备接收信息审核请求,获取对应的待审核信息和信息维度标识;调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征;对各特征进行特征组合,生成对应预设维度的组合特征;基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。
    146.根据本技术实施例的技术方案,从而可以实现准确地对消费者提交的纠纷信息进行审核,改善消费者购物体验。
    147.上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。

    技术特征:
    1.一种信息审核方法,其特征在于,包括:接收信息审核请求,获取对应的待审核信息和信息维度标识;调用审核模型,以基于所述信息维度标识,从所述待审核信息中提取对应的特征;对各所述特征进行特征组合,生成对应预设维度的组合特征;基于所述组合特征,确定所述待审核信息的审核通过概率,进而基于所述审核通过概率确定对所述待审核信息的审核结果。2.根据权利要求1所述的方法,其特征在于,在所述调用审核模型之前,所述方法还包括:获取初始神经网络模型;获取已标注的样本数据,所述样本数据包括已审核信息的预设数量维度下的预设数量特征以及对应标注的审核通过概率;将所述预设数量维度下的预设数量特征作为所述初始神经网络模型的输入,将所述对应标注的审核通过概率作为所述初始神经网络模型的期望输出,对所述初始神经网络模型进行训练,得到中间神经网络模型;获取未标注的样本数据和对应的准确审核通过概率,将所述未标注的样本数据输入至所述中间神经网络模型,输出对应的预测审核通过概率,将所述预测审核通过概率与所述准确审核通过概率进行匹配,将匹配得到的预测审核通过概率对应的未标注样本数据和对应的预测审核通过概率加入所述已标注的样本数据,并更新所述已标注的样本数据;响应于达到模型训练终止条件,结束模型训练,以生成所述审核模型。3.根据权利要求1所述的方法,其特征在于,所述基于所述审核通过概率确定对所述待审核信息的审核结果,包括:将所述审核通过概率与动态阈值进行比较,响应于所述审核通过概率大于动态阈值,确定对所述待审核信息的审核通过,响应于所述审核通过概率小于动态阈值,将所述信息审核请求发送至预设线下审核节点进行审核;响应于所述预设线下审核节点对所述信息审核请求对应的待审核信息的审核不通过,生成审核意见发送至客服节点,以使所述客服节点基于所述审核意见更新所述信息审核请求;响应于所述预设线下审核节点对所述信息审核请求对应的待审核信息的审核通过,接收客服评价分数,基于所述客服评价分数更新所述审核模型的模型参数。4.根据权利要求3所述的方法,其特征在于,所述基于所述客服评价分数更新所述审核模型的模型参数,包括:将所述客服评价分数进行非线性变换,得到非线性变换值;基于所述非线性变换值和所述审核模型修正前的输出概率,生成所述审核模型修正后的输出概率;基于所述修正后的输出概率和所述修正前的输出概率,对所述审核模型的模型参数进行调整,进而更新调整后的审核模型的模型参数。5.根据权利要求4所述的方法,其特征在于,所述生成所述审核模型修正后的输出概率,包括:将所述非线性变换值与所述审核模型修正前的输出概率的乘积确定为所述审核模型
    修正后的输出概率。6.根据权利要求1所述的方法,其特征在于,所述对各所述特征进行特征组合,生成对应预设维度的组合特征,包括:基于各信息维度标识,调用对应的嵌入编码转换方法,以生成对应维度的特征向量;将各所述特征向量沿着预设维度进行叉乘,以生成对应预设维度的组合特征。7.根据权利要求6所述的方法,其特征在于,所述将所述特征向量沿着预设维度进行叉乘,包括:确定所述特征向量中的显式特征对应的显式特征向量和隐式特征对应的隐式特征向量;将所述显式特征向量和所述隐式特征向量沿着预设维度进行叉乘。8.一种信息审核装置,其特征在于,包括:接收单元,被配置成接收信息审核请求,获取对应的待审核信息和信息维度标识;提取单元,被配置成调用审核模型,以基于所述信息维度标识,从所述待审核信息中提取对应的特征;组合特征生成单元,被配置成对各所述特征进行特征组合,生成对应预设维度的组合特征;信息审核单元,被配置成基于所述组合特征,确定所述待审核信息的审核通过概率,进而基于所述审核通过概率确定对所述待审核信息的审核结果。9.根据权利要求8所述的装置,其特征在于,所述装置还包括训练单元,被配置成:获取初始神经网络模型;获取已标注的样本数据,所述样本数据包括已审核信息的预设数量维度下的预设数量特征以及对应标注的审核通过概率;将所述预设数量维度下的预设数量特征作为所述初始神经网络模型的输入,将所述对应标注的审核通过概率作为所述初始神经网络模型的期望输出,对所述初始神经网络模型进行训练,得到中间神经网络模型;获取未标注的样本数据和对应的准确审核通过概率,将所述未标注的样本数据输入至所述中间神经网络模型,输出对应的预测审核通过概率,将所述预测审核通过概率与所述准确审核通过概率进行匹配,将匹配得到的预测审核通过概率对应的未标注样本数据和对应的预测审核通过概率加入所述已标注的样本数据,并更新所述已标注的样本数据;响应于达到模型训练终止条件,结束模型训练,以生成所述审核模型。10.根据权利要求8所述的装置,其特征在于,所述信息审核单元进一步被配置成:将所述审核通过概率与动态阈值进行比较,响应于所述审核通过概率大于动态阈值,确定对所述待审核信息的审核通过,响应于所述审核通过概率小于动态阈值,将所述信息审核请求发送至预设线下审核节点进行审核;响应于所述预设线下审核节点对所述信息审核请求对应的待审核信息的审核不通过,生成审核意见发送至客服节点,以使所述客服节点基于所述审核意见更新所述信息审核请求;响应于所述预设线下审核节点对所述信息审核请求对应的待审核信息的审核通过,接收客服评价分数,基于所述客服评价分数更新所述审核模型的模型参数。
    11.一种信息审核电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

    技术总结
    本申请公开了信息审核方法、装置、电子设备及计算机可读介质,涉及计算机技术领域,该方法包括:接收信息审核请求,获取对应的待审核信息和信息维度标识;调用审核模型,以基于信息维度标识,从待审核信息中提取对应的特征;对各特征进行特征组合,生成对应预设维度的组合特征;基于组合特征,确定待审核信息的审核通过概率,进而基于审核通过概率确定对待审核信息的审核结果。从而可以实现准确地对消费者提交的纠纷信息进行审核,改善消费者购物体验。体验。体验。


    技术研发人员:陈旭涛
    受保护的技术使用者:北京京东世纪贸易有限公司
    技术研发日:2022.02.09
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-20858.html

    最新回复(0)