推荐对象确定方法、装置、电子设备及存储介质与流程

    专利查询2022-07-07  135



    1.本公开涉及计算机技术领域,尤其涉及一种推荐对象确定方法、装置、电子设备及存储介质。


    背景技术:

    2.推荐系统的推荐过程一般包括召回、粗排和精排三个阶段,其中召回作为整个系统的第一阶段,主要通过学习用户账户和候选推荐对象的特征表示,基于该特征表示从候选推荐对象池中快速定位并召回用户账户可能感兴趣的候选推荐对象,这些可能感兴趣的候选推荐对象将进一步经过粗排和精排以确定最终向用户账户推荐的候选推荐对象。
    3.实际应用中,用户账户的数据可能会涉及到多个场景(例如同一应用程序的主版应用程序和极速版应用程序即为不同的场景),相关技术中,推荐系统在进行候选推荐对象的召回时基于对每个场景单独训练的召回模型(即深度语义匹配模型,又称之为双塔模型),从而无法快速捕捉用户在不同场景下的兴趣偏好,降低了召回效率,进而降低了推荐效率。


    技术实现要素:

    4.本公开提供一种推荐对象确定方法、装置、电子设备及存储介质,以至少解决相关技术中无法快速捕捉用户在不同场景下的兴趣偏好,降低了召回效率以及推荐效率的问题。本公开的技术方案如下:
    5.根据本公开实施例的第一方面,提供一种推荐对象确定方法,包括:
    6.响应于目标用户账户的对象推荐请求,获取所述目标用户账户的属性信息、当前场景信息和历史交互信息序列;
    7.将所述当前场景信息分别与所述属性信息和所述历史交互信息序列进行融合,得到第一融合特征和第二融合特征;
    8.根据所述第一融合特征和所述第二融合特征,确定各候选推荐对象对应的相似程度;
    9.根据各所述候选推荐对象对应的相似程度,确定所述对象推荐请求对应的目标候选推荐对象。
    10.在一示例性的实施方式中,所述根据所述第一融合特征和所述第二融合特征,确定各候选推荐对象对应的相似程度,包括:
    11.根据所述第一融合特征和所述第二融合特征,确定所述目标用户账户的第一特征表示;
    12.根据各所述候选推荐对象的推荐对象信息,确定各所述候选推荐对象的第二特征表示;
    13.确定所述第一特征表示与各所述候选推荐对象的第二特征表示之间的相似程度,得到各所述候选推荐对象对应的相似程度。
    14.在一示例性的实施方式中,所述将所述当前场景信息分别与所述属性信息和所述历史交互信息序列进行融合,得到第一融合特征和第二融合特征,包括:
    15.将所述当前场景信息、所述属性信息和所述历史交互信息序列输入至推荐对象确定模型的第一特征表示网络,通过所述第一特征表示网络的编码网络分别对所述当前场景信息、所述属性信息和所述历史交互信息序列进行编码处理,得到当前场景编码、属性编码和历史交互编码序列;
    16.将所述当前场景编码和所述属性编码输入至所述第一特征表示网络的第一特征融合网络,通过所述第一特征融合网络分别对所述当前场景编码和所述属性编码进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第一融合特征;
    17.将所述当前场景编码和所述历史交互编码序列输入至所述第一特征表示网络的第二特征融合网络,通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征。
    18.在一示例性的实施方式中,所述第一特征融合网络包括级联的多个第一特征交叉单元,所述通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征,包括:
    19.将所述当前场景编码和所述属性编码输入第一级第一特征交叉单元,通过所述第一级第一特征交叉单元分别对所述当前场景编码和所述属性编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述第一级第一特征交叉单元的输出特征;
    20.对于剩余第一特征交叉单元中的当前级第一特征交叉单元,将前一级第一特征交叉单元的输出特征和所述当前场景编码输入至所述当前级第一特征交叉单元,通过所述当前级第一特征交叉单元分别对所述输出特征和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述当前级第一特征交叉单元的输出特征;
    21.将所述级联的多个第一特征交叉单元中最后一级第一特征交叉单元的输出特征,确定为所述第一融合特征。
    22.在一示例性的实施方式中,所述第二特征融合网络包括第二特征交叉单元和第一自注意力网络;所述通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征,包括:
    23.对于所述历史交互编码序列中的每个历史交互编码,将所述历史交互编码和所述当前场景编码输入至所述第二特征交叉单元,通过所述第二特征交叉单元分别对所述历史交互编码和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述历史交互编码对应的融合特征,得到所述历史交互编码序列对应的融合特征序列;
    24.将所述融合特征序列输入至所述第一自注意力网络,基于自注意力机制确定所述融合特征序列中各融合特征对应的权重;
    25.对各所述融合特征和对应的权重进行加权求和,得到所述第二融合特征。
    26.在一示例性的实施方式中,所述根据所述第一融合特征和所述第二融合特征,确定所述目标用户账户的第一特征表示,包括:
    27.将所述当前场景编码输入至所述第一特征表示网络的场景特征提取网络,得到当前场景特征;
    28.拼接所述第一融合特征、所述第二融合特征和所述当前场景特征,得到所述目标用户账户的第一特征表示。
    29.在一示例性的实施方式中,所述根据各所述候选推荐对象的推荐对象信息,确定各所述候选推荐对象的第二特征表示,包括:
    30.获取所述候选推荐对象的推荐对象信息;所述推荐对象信息包括推荐对象属性信息和子对象序列,所述子对象序列包括所述候选推荐对象关联的多个子对象;
    31.将所述推荐对象属性信息和所述子对象序列输入至所述推荐对象确定模型的第二特征表示网络,通过所述第二特征表示网络的编码网络分别对所述推荐对象属性信息和所述子对象序列进行编码处理,得到推荐对象编码和子对象编码序列;
    32.将所述推荐对象编码输入至所述第二特征表示网络的推荐对象特征提取网络,得到推荐对象特征;
    33.将所述子对象编码序列输入至所述第二特征表示网络的第二自注意力网络,基于自注意力机制确定所述子对象编码序列中各子对象编码对应的权重;对各所述子对象编码和对应的权重进行加权求和,得到子对象特征;
    34.拼接所述推荐对象特征和所述子对象特征,得到所述候选推荐对象的第二特征表示。
    35.在一示例性的实施方式中,所述方法还包括:
    36.获取训练样本以及所述训练样本对应的标签信息;所述训练样本包括样本用户账户对应的样本属性信息、样本场景信息和样本历史交互信息序列,以及样本推荐对象对应的推荐对象信息;所述标签信息表征所述样本用户账户对所述样本推荐对象是否感兴趣;
    37.将所述样本属性信息、样本场景信息和样本历史交互信息序列输入至预设神经网络模型的初始第一特征表示网络,得到所述初始第一特征表示网络输出的预测第一特征表示;
    38.将所述推荐对象信息输入至所述预设神经网络模型的初始第二特征表示网络,得到所述初始第二特征表示网络输出的预测第二特征表示;
    39.确定所述预测第一特征表示和所述预测第二特征表示之间的相似程度,得到预测相似程度;
    40.根据所述预测相似程度与所述标签信息之间的差异确定损失值,并基于所述损失值调整所述预设神经网络模型的模型参数,对调整后的预设神经网络模型继续进行迭代训练,直至满足预设训练结束条件,得到所述推荐对象确定模型。
    41.根据本公开实施例的第二方面,提供一种推荐对象确定装置,包括:
    42.第一获取单元,被配置为执行响应于目标用户账户的对象推荐请求,获取所述目标用户账户的属性信息、当前场景信息和历史交互信息序列;
    43.融合单元,被配置为执行将所述当前场景信息分别与所述属性信息和所述历史交互信息序列进行融合,得到第一融合特征和第二融合特征;
    44.相似程度确定单元,被配置为执行根据所述第一融合特征和所述第二融合特征,确定各候选推荐对象对应的相似程度;
    45.目标推荐对象确定单元,被配置为执行根据各所述候选推荐对象对应的相似程度,确定所述对象推荐请求对应的目标候选推荐对象。
    46.在一示例性的实施方式中,所述相似程度确定单元,包括:
    47.第一特征表示确定单元,被配置为执行根据所述第一融合特征和所述第二融合特征,确定所述目标用户账户的第一特征表示;
    48.第二特征表示确定单元,被配置为执行根据各所述候选推荐对象的推荐对象信息,确定各所述候选推荐对象的第二特征表示;
    49.相似程度确定子单元,被配置为执行确定所述第一特征表示与各所述候选推荐对象的第二特征表示之间的相似程度,得到各所述候选推荐对象对应的相似程度。
    50.在一示例性的实施方式中,所述融合单元,包括:
    51.第一编码单元,被配置为执行将所述当前场景信息、所述属性信息和所述历史交互信息序列输入至推荐对象确定模型的第一特征表示网络,通过所述第一特征表示网络的编码网络分别对所述当前场景信息、所述属性信息和所述历史交互信息序列进行编码处理,得到当前场景编码、属性编码和历史交互编码序列;
    52.第一特征融合单元,被配置为执行将所述当前场景编码和所述属性编码输入至所述第一特征表示网络的第一特征融合网络,通过所述第一特征融合网络分别对所述当前场景编码和所述属性编码进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第一融合特征;
    53.第二特征融合单元,被配置为执行将所述当前场景编码和所述历史交互编码序列输入至所述第一特征表示网络的第二特征融合网络,通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征。
    54.在一示例性的实施方式中,所述第一特征融合网络包括级联的多个第一特征交叉单元;
    55.所述第一特征融合单元,具体被配置为执行:
    56.将所述当前场景编码和所述属性编码输入第一级第一特征交叉单元,通过所述第一级第一特征交叉单元分别对所述当前场景编码和所述属性编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述第一级第一特征交叉单元的输出特征;
    57.对于剩余第一特征交叉单元中的当前级第一特征交叉单元,将前一级第一特征交叉单元的输出特征和所述当前场景编码输入至所述当前级第一特征交叉单元,通过所述当前级第一特征交叉单元分别对所述输出特征和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述当前级第一特征交叉单元的输出特征;
    58.将所述级联的多个第一特征交叉单元中最后一级第一特征交叉单元的输出特征,确定为所述第一融合特征。
    59.在一示例性的实施方式中,所述第二特征融合网络包括第二特征交叉单元和第一自注意力网络;
    60.所述第二特征融合单元,具体被配置为执行:
    61.对于所述历史交互编码序列中的每个历史交互编码,将所述历史交互编码和所述当前场景编码输入至所述第二特征交叉单元,通过所述第二特征交叉单元分别对所述历史交互编码和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述历史交互编码对应的融合特征,得到所述历史交互编码序列对应的融合特征序列;
    62.将所述融合特征序列输入至所述第一自注意力网络,基于自注意力机制确定所述融合特征序列中各融合特征对应的权重;对各所述融合特征和对应的权重进行加权求和,得到所述第二融合特征。
    63.在一示例性的实施方式中,所述第一特征表示单元,包括:
    64.当前场景特征提取单元,被配置为执行将所述当前场景编码输入至所述第一特征表示网络的场景特征提取网络,得到当前场景特征;
    65.第一拼接单元,被配置为执行拼接所述第一融合特征、所述第二融合特征和所述当前场景特征,得到所述目标用户账户的第一特征表示。
    66.在一示例性的实施方式中,所述第二特征表示单元,包括:
    67.第二获取单元,被配置为执行获取所述候选推荐对象的推荐对象信息;所述推荐对象信息包括推荐对象属性信息和子对象序列,所述子对象序列包括所述候选推荐对象关联的多个子对象;
    68.第二编码单元,被配置为执行将所述推荐对象属性信息和所述子对象序列输入至所述推荐对象确定模型的第二特征表示网络,通过所述第二特征表示网络的编码网络分别对所述推荐对象属性信息和所述子对象序列进行编码处理,得到推荐对象编码和子对象编码序列;
    69.推荐对象特征提取单元,被配置为执行将所述推荐对象编码输入至所述第二特征表示网络的推荐对象特征提取网络,得到推荐对象特征;
    70.子对象特征确定单元,被配置为执行将所述子对象编码序列输入至所述第二特征表示网络的第二自注意力网络,基于自注意力机制确定所述子对象编码序列中各子对象编码对应的权重;对各所述子对象编码和对应的权重进行加权求和,得到子对象特征;
    71.第二拼接单元,被配置为执行拼接所述推荐对象特征和所述子对象特征,得到所述候选推荐对象的第二特征表示。
    72.在一示例性的实施方式中,所述装置还包括模型训练单元;所述模型训练单元被配置为执行:
    73.获取训练样本以及所述训练样本对应的标签信息;所述训练样本包括样本用户账户对应的样本属性信息、样本场景信息和样本历史交互信息序列,以及样本推荐对象对应的推荐对象信息;所述标签信息表征所述样本用户账户对所述样本推荐对象是否感兴趣;
    74.将所述样本属性信息、样本场景信息和样本历史交互信息序列输入至预设神经网络模型的初始第一特征表示网络,得到所述初始第一特征表示网络输出的预测第一特征表示;
    75.将所述推荐对象信息输入至所述预设神经网络模型的初始第二特征表示网络,得到所述初始第二特征表示网络输出的预测第二特征表示;
    76.确定所述预测第一特征表示和所述预测第二特征表示之间的相似程度,得到预测相似程度;
    77.根据所述预测相似程度与所述标签信息之间的差异确定损失值,并基于所述损失值调整所述预设神经网络模型的模型参数,对调整后的预设神经网络模型继续进行迭代训练,直至满足预设训练结束条件,得到所述推荐对象确定模型。
    78.根据本公开实施例的第三方面,提供一种电子设备,包括:
    79.处理器;
    80.用于存储所述处理器可执行指令的存储器;
    81.其中,所述处理器被配置为执行所述指令,以实现上述第一方面的推荐对象确定方法。
    82.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面的推荐对象确定方法。
    83.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述第一方面的推荐对象确定方法。
    84.本公开的实施例提供的技术方案至少带来以下有益效果:
    85.在目标用户账户发起对象推荐请求时,通过获取该目标用户账户的属性信息、当前场景信息和历史交互信息序列,并将当前场景信息分别与属性信息和历史交互信息序列进行融合得到第一融合特征和第二融合特征,进而基于该第一融合特征和第二融合特征确定各候选推荐对象对应的相似程度,并基于该相似程度确定了目标候选推荐对象,从而在第一融合特征和第二融合特征中融入了当前场景信息,无需基于当前场景单独训练的召回模型也能准确召回,进而无需针对不同的场景单独训练各场景对应的召回模型,提高了召回效率,进而提高了推荐对象的确定效率。
    86.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
    附图说明
    87.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
    88.图1是根据一示例性实施例示出的一种推荐对象确定方法的应用环境示意图;
    89.图2是根据一示例性实施例示出的一种推荐对象确定方法的流程图;
    90.图3是根据一示例性实施例示出的推荐对象确定模型的模型结构示意图;
    91.图4是根据一示例性实施例示出的特征交叉单元的模型结构示意图;
    92.图5是根据一示例性实施例示出的根据第一融合特征和第二融合特征确定目标用户账户的第一特征表示的流程图;
    93.图6是根据一示例性实施例示出的确定候选推荐对象的第二特征表示的流程图;
    94.图7是根据一示例性实施例示出的推荐对象确定装置的结构框图;
    95.图8是根据一示例性实施例示出的一种电子设备的框图。
    具体实施方式
    96.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
    97.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或
    描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
    98.需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
    99.实际应用中,对于同一应用程序,用户的交互会发生在多个不同的场景,例如主版应用程序中的交互和极速版应用程序中的交互为不同场景下的交互,内容聚合页面在不同页面展示形式(例如单列展示、多列展示)下的交互也为不同场景下的交互,内容聚合页面中内容的不同呈现形态(例如静态图片形态、动态视频流形态)下的交互也为不同场景下的交互等等。不同场景之间的用户账户的数据以及交互信息存在差异,相关技术中,推荐系统在进行候选推荐对象的召回时基于对每个场景单独训练的召回模型(例如双塔模型),无法捕捉用户在不同场景下的兴趣偏好,降低了召回效率,进而降低了推荐效率。
    100.鉴于此,本公开实施例提供了一种推荐对象确定方法,该方法在目标用户账户发起对象推荐请求时,通过获取该目标用户账户的属性信息、当前场景信息和历史交互信息序列,并将当前场景信息分别与属性信息和历史交互信息序列进行融合得到第一融合特征和第二融合特征,进而基于该第一融合特征和第二融合特征确定各候选推荐对象对应的相似程度,并基于该相似程度确定了目标候选推荐对象,从而在第一融合特征和第二融合特征中融入了当前场景信息,无需基于当前场景单独训练的召回模型也能准确召回,进而无需针对不同的场景单独训练各场景对应的召回模型,提高了召回效率,进而提高了推荐对象的确定效率。
    101.请参阅图1,其所示为根据一示例性实施例示出的一种推荐对象确定方法的应用环境示意图,该应用环境可以包括终端110和推荐系统120。
    102.终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110中可以安装有提供推荐对象展示功能的客户端软件如应用程序(application,简称为app),该应用程序可以是独立的应用程序,也可以是应用程序中的子程序。示例性的,该应用程序可以包括游戏应用程序、直播应用程序等。终端110的用户可以通过预先注册的用户账户登录应用程序。
    103.推荐系统120可以是为终端110中的应用程序提供推荐服务的服务器,推荐对象与该应用程序的具体业务相关联,例如,对于直播应用程序,推荐对象可以是直播,也即推荐系统可以向终端110推荐直播。推荐系统120与终端110之间可以通过有线网络或者无线网络连接。
    104.具体的,如图1所示,推荐系统120可以包括候选推荐对象池121、召回服务器122、粗排服务器123和精排服务器124。召回服务器122可以接收终端110发送的对象推荐请求,并响应于该对象推荐请求获取该终端110对应目标用户账户的属性信息、当前场景信息和历史交互信息序列,将该当前场景信息分别与属性信息和历史交互信息序列进行融合得到第一融合特征和第二融合特征,进而根据第一融合特征、第二融合特征和当前场景信息,得到目标用户账户的第一特征表示,并确定该第一特征表示与候选推荐对象池121中各候选推荐对象的第二特征表示之间的相似程度,基于该相似程度从候选推荐对象池中选取目标
    候选推荐对象作为对应对象推荐请求的召回结果,并将该目标候选推荐对象发送给粗排服务器123,由粗排服务器123进一步结合粗排策略对目标候选推荐对象进行筛选得到粗排结果,该粗排结果由粗排服务器123发送给精排服务器124,由精排服务器124进一步结合精排策略对粗排结果进行筛选得到最终待推荐的候选推荐对象(即精排结果),并将该待推荐的候选推荐对象返回给终端110,由终端110进行展示。
    105.在一个具体的应用场景中,召回服务器122可以存储有训练好的推荐对象确定模型,在响应于对象推荐请求进行召回时调用该推荐对象确定模型从候选推荐对象池中召回目标候选推荐对象。
    106.需要说明的是,本公开实施例中提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。
    107.图2是根据一示例性实施例示出的一种推荐对象确定方法的流程图,如图2所示,以该方法应用于图1中的召回服务器为例,包括以下步骤。
    108.在步骤s21中,响应于目标用户账户的对象推荐请求,获取所述目标用户账户的属性信息、当前场景信息和历史交互信息序列。
    109.其中,目标用户账户为发起对象推荐请求的用户账户。目标用户账户的属性信息可以包括名称、年龄、性别等画像信息,以及其他可以表征用户账户属性的信息。目标用户账户的当前场景信息可以包括上下文信息以及部分的画像信息,上下文信息可以包括发起对象推荐请求的时间信息、地点信息、触发对象推荐请求的页面信息(可以包括页面标识、页面的展示形式、页面中内容的呈现形态等)、应用程序的版本信息等可以表征发起对象推荐请求时该目标用户账户所处于的虚拟环境的信息;部分的画像信息可以是从目标用户账户的属性信息中抽取的部分画像信息,具体的抽取数据量大小可以根据实际经验进行设定。
    110.目标用户账户的历史交互信息序列可以包括该目标用户账户在当前时间之前的预设时间段内的交互信息。以直播推荐为例,该历史交互信息序列中的交互信息可以包括在当前时间之前的预设时间段内该目标用户账户进入过的直播间的相关信息,例如直播间标识、主播标识等等。其中,预设时间段可以根据实际需要进行设定,例如可以是一周或者一个月等等。
    111.在步骤s23中,将所述当前场景信息分别与所述属性信息和所述历史交互信息序列进行融合,得到第一融合特征和第二融合特征。
    112.具体的,将当前场景信息与属性信息进行融合得到第一融合特征,该第一融合特征可以表征目标用户账户在当前场景的兴趣偏好;将当前场景信息与历史交互信息序列进行融合得到第二融合特征,该第二融合特征可以表征目标用户账户在当前场景的行为偏好。
    113.在步骤s25中,根据所述第一融合特征和所述第二融合特征,确定各候选推荐对象对应的相似程度。
    114.其中,候选推荐对象对应的相似程度可以表征目标用户账户对该候选推荐对象的兴趣程度。
    115.在一个具体的实施方式中,相似程度可以通过计算目标用户账户对应的第一特征表示与候选推荐对象对应的第二特征表示之间的相似程度得到,该相似程度可以是余弦相似度或者其他可以表征两个向量之间相似程度的度量,本公开实施例对于相似程度的具体表征方式不作限定。基于此,上述步骤s25在实施时可以包括以下步骤:
    116.根据所述第一融合特征和所述第二融合特征,确定所述目标用户账户的第一特征表示;
    117.根据各所述候选推荐对象的推荐对象信息,确定各所述候选推荐对象的第二特征表示;
    118.确定所述第一特征表示与各所述候选推荐对象的第二特征表示之间的相似程度,得到各所述候选推荐对象对应的相似程度。
    119.具体的,可以将第一融合特征和第二融合特征进行拼接以得到该目标用户账户的第一特征表示。
    120.候选推荐对象的第二特征表示根据所述候选推荐对象的推荐对象信息得到。该推荐对象信息可以包括推荐对象属性信息和子对象序列,子对象序列包括候选推荐对象关联的多个子对象。以直播推荐为例,候选直播关联的多个子对象可以是候选直播关联的直播物品(如服饰、食物等等),推荐对象属性信息可以包括主播信息、直播物品信息(例如直播物品名称、类别等)以及直播物品的提供方信息等。
    121.上述实施例,通过第一融合特征和第二融合特征来确定目标用户账户的特征表示,使得该用户账户的特征表示与当前场景相对应,并通过目标用户账户的特征表示与候选推荐对象的特征表示之间的相似程度准确表征了各候选推荐对象对应的相似程度,在提高了相似程度的准确性,进而有利于提高目标推荐对象确定的准确性。
    122.在步骤s27中,根据各所述候选推荐对象对应的相似程度,确定所述对象推荐请求对应的目标候选推荐对象。
    123.一个具体的实施方式中,可以确定相似程度大于预设阈值的候选推荐对象,作为响应于对象推荐请求而召回的目标候选推荐对象。其中,预设阈值可以根据实际经验进行设定,本公开实施例对此不作具体限定。
    124.另一个具体的实施方式中,可以根据相似程度对各候选推荐对象进行排序,根据排序结果选取预设数量的最大候选推荐对象作为响应于对象推荐请求而召回的目标候选推荐对象。例如,可以按照相似程度降序排序,然后选取排序在前的预设数量个候选推荐对象作为目标候选推荐对象。其中,预设数量可以根据实际需要进行设定,本公开实施例对此不作具体限定。
    125.在上述实施例中,将当前场景信息分别融合到用户账户的属性信息以及历史交互信息中,充分捕捉了用户账户在当前场景下的兴趣偏好以及行为偏好,从而无需基于当前场景单独训练的召回模型也能准确召回,进而无需针对不同的场景单独训练各场景对应的召回模型,提高了召回效率,进而提高了推荐对象的确定效率。
    126.本公开实施例的推荐对象确定方法可以基于训练好的推荐对象确定模型实现,该推荐对象确定模型的模型结构如图3所示可以包括:与用户账户对应的第一特征表示网络、与候选推荐对象对应的第二特征表示网络以及匹配层。第一特征表示网络用于实现用户账户的特征表示得到第一特征表示,第二特征表示网络用于实现推荐对象的特征表示得到第
    二特征表示,匹配层用于确定第一特征表示与第二特征表示的相似程度。
    127.其中,第一特征表示网络包括编码网络(即embedding layer)、第一特征融合网络、第二特征融合网络和场景特征提取网络。编码网络用于对输入进行编码以转化为嵌入向量。场景特征提取网络用于对场景信息进行特征提取以得到场景特征,该场景特征提取网络可以为一个浅层的深度神经网络(deep neural networks,dnn),例如一层dnn网络。
    128.第一特征融合网络基于co-action unit(特征交叉单元)实现,co-action是指多个特征相互关联,共同影响最终输出,co-action unit的具体结构如图4所示,包括两个深度神经网络(deep neural networks,dnn)和交叉层。为了区别表述,第一特征融合网络中的特征交叉单元以下称之为第一特征交叉单元,第一特征交叉单元中的两个dnn的输入分别对应用户账户的属性信息和场景信息,交叉层则根据两个dnn的输出基于对位相乘(element-wise multiply)输出特征交叉结果。
    129.第二特征融合网络也为基于co-action unit(特征交叉单元)实现,其结构可以参见图4。为了区别表述,第二特征融合网络中的特征交叉单元以下称之为第二特征交叉单元,第二特征交叉单元中的两个dnn的输入分别对应历史交互信息序列中的历史交互信息和场景信息,交叉层则根据两个dnn的输出基于对位相乘(element-wise multiply)输出特征交叉结果。
    130.基于此,在一个示例性的实施方式中,上述步骤s23在实施时,可以包括:
    131.将所述当前场景信息、所述属性信息和所述历史交互信息序列输入至推荐对象确定模型的第一特征表示网络,通过所述第一特征表示网络的编码网络分别对所述当前场景信息、所述属性信息和所述历史交互信息序列进行编码处理,得到当前场景编码、属性编码和历史交互编码序列;
    132.将所述当前场景编码和所述属性编码输入至所述第一特征表示网络的第一特征融合网络,通过所述第一特征融合网络分别对所述当前场景编码和所述属性编码进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第一融合特征;
    133.将所述当前场景编码和所述历史交互编码序列输入至所述第一特征表示网络的第二特征融合网络,通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征。
    134.上述实施例,通过推荐对象确定模型中第一特征表示网络的第一特征融合网络实现了当前场景与用户账户的属性的交叉,通过第二特征融合网络实现了当前场景与用户交互的交叉,有利于将当前场景充分的融合到对于用户账户的特征表示中。
    135.在一个示例性的实施方式中,为了提高特征融合的效果,第一特征融合网络可以包括级联的多个特征交叉单元(为了区别表述,第一特征融合网络中的特征交叉单元以下称之为第一特征交叉单元),示例性的,如图3中所示,可以包括级联的3个第一特征交叉单元,对于第一级第一特征交叉单元,其输入为经过编码处理得到的用户账户的属性编码以及当前场景编码,而对于剩余第一特征交叉单元,其输入为前一级第一特征交叉单元的输出特征和当前场景编码,最后一级第一特征交叉单元的输出特征即为第一特征融合网络输出的第一融合特征。
    136.基于此,上述通过所述第一特征融合网络分别对所述当前场景编码和所述属性编码进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第一融合特征在实施
    时,可以包括:
    137.将所述当前场景编码和所述属性编码输入第一级第一特征交叉单元,通过所述第一级第一特征交叉单元分别对所述当前场景编码和所述属性编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述第一级第一特征交叉单元的输出特征;
    138.对于剩余第一特征交叉单元中的当前级第一特征交叉单元,将前一级第一特征交叉单元的输出特征和所述当前场景编码输入至所述当前级第一特征交叉单元,通过所述当前级第一特征交叉单元分别对所述输出特征和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述当前级第一特征交叉单元的输出特征;
    139.将所述级联的多个第一特征交叉单元中最后一级第一特征交叉单元的输出特征,确定为所述第一融合特征。
    140.上述实施例,通过级联的多个特征交叉单元在各级将用户账户的属性与当前场景进行融合,实现用户账户的属性与当前场景的深度融合,加强了用户账户的特征表示中的当前场景信息,充分捕获了用户账户在当前场景下的兴趣偏好,使得第一融合特征与当前场景更加匹配,后续基于第一特征表示召回的推荐对象更符合用户在当前场景下的兴趣,提高了召回的准确性。
    141.为了基于历史交互信息序列和当前场景信息得到含有更多信息的第二融合特征,如图3所示,第二特征融合网络包括第二特征交叉单元和第一自注意力网络,其中,第二特征交叉单元用于实现各历史交互信息与当前场景信息的交叉,第一自注意力网络则基于自注意力机制确定每个历史交互的权重,而为了增强第一自注意力网络捕获不同场景特征间差异的能力,本公开实施例将基于第二特征交叉单元得到融合特征序列作为第一自注意网络的输入,以更好的结合当前场景确定权重。
    142.基于此,在一个示例性的实施方式中,上述通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征,可以包括:
    143.对于所述历史交互编码序列中的每个历史交互编码,将所述历史交互编码和所述当前场景编码输入至所述第二特征交叉单元,通过所述第二特征交叉单元分别对所述历史交互编码和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述历史交互编码对应的融合特征,得到所述历史交互编码序列对应的融合特征序列;
    144.将所述融合特征序列输入至所述第一自注意力网络,基于自注意力机制确定所述融合特征序列中各融合特征对应的权重;
    145.对各所述融合特征和对应的权重进行加权求和,得到所述第二融合特征。
    146.上述实施例,通过自注意力机制结合当前场景信息学习各历史交互对应的权重,进而基于权重以及对应的历史交互与当前场景的融合特征进行加权求和得到第二融合特征,在保留更多用户兴趣信息的同时充分捕捉了历史交互在当前场景下的兴趣,使得第二融合特征与当前场景更加匹配、更加准确,后续基于第一特征表示召回的推荐对象更符合当前场景下的兴趣,提高了召回的准确性。
    147.为了能够在第一特征表示中加强场景信息,在一个示例性的实施方式中,如图5所示,上述实施例中,在根据所述第一融合特征和所述第二融合特征,确定所述目标用户账户的第一特征表示时,可以包括:
    148.在步骤s51中,将所述当前场景编码输入至所述第一特征表示网络的场景特征提取网络,得到当前场景特征;
    149.在步骤s53中,拼接所述第一融合特征、所述第二融合特征和所述当前场景特征,得到所述目标用户账户的第一特征表示。
    150.基于以上的推荐对象确定模型,可以理解的,本公开实施例还包括候选推荐对象的第二特征表示的确定过程,如图6所示,上述根据各所述候选推荐对象的推荐对象信息,确定各所述候选推荐对象的第二特征表示可以包括:
    151.在步骤61中,获取候选推荐对象的推荐对象信息;所述推荐对象信息包括推荐对象属性信息和子对象序列,所述子对象序列包括所述候选推荐对象关联的多个子对象。
    152.在步骤63中,将所述推荐对象属性信息和所述子对象序列输入至所述推荐对象确定模型的第二特征表示网络,通过所述第二特征表示网络的编码网络分别对所述推荐对象属性信息和所述子对象序列进行编码处理,得到推荐对象编码和子对象编码序列;
    153.在步骤65中,将所述推荐对象编码输入至所述第二特征表示网络的推荐对象特征提取网络,得到推荐对象特征;
    154.其中,推荐对象特征提取网络可以为多层dnn网络,如图3中所示的3层dnn网络,推荐对象编码经过多层dnn网络进行特征提取后得到推荐对象特征。
    155.在步骤67中,将所述子对象编码序列输入至所述第二特征表示网络的第二自注意力网络,基于自注意力机制确定所述子对象编码序列中各子对象编码对应的权重;对各所述子对象编码和对应的权重进行加权求和,得到子对象特征;
    156.在步骤69中,拼接所述推荐对象特征和所述子对象特征,得到所述候选推荐对象的第二特征表示。
    157.上述实施例,通过自注意力机制学习各子对象的权重,进而基于权重以及对应的子对象编码进行加权求和得到子对象特征,使得子对象特征可以保留更新的信息,进而提高了候选推荐对象的第二特征表示的准确性,有利于提高召回的准确性。
    158.可以理解的,本公开实施还可以包括推荐对象确定模型的训练过程,具体的,对于推荐对象确定模型的训练可以包括以下步骤:
    159.(1)获取训练样本以及所述训练样本对应的标签信息。
    160.其中,训练样本包括样本用户账户对应的样本属性信息、样本场景信息和样本历史交互信息序列,以及样本推荐对象对应的推荐对象信息,该标签信息表征所述样本用户账户对所述样本推荐对象是否感兴趣。具体的,标签信息可以根据样本用户账户对该样本推荐对象的交互信息确定。以直播推荐为例,例如,若样本用户账户进入了样本直播,则认为对该样本直播感兴趣,那么相应的标签信息可以设置为“1”,反之,若样本用户账户未进入样本直播,则认为对该样本直播不感兴趣,那么相应的标签信息可以设置为“0”。
    161.(2)将所述样本属性信息、样本场景信息和样本历史交互信息序列输入至预设神经网络模型的初始第一特征表示网络,得到所述初始第一特征表示网络输出的预测第一特征表示。
    162.(3)将所述推荐对象信息输入至所述预设神经网络模型的初始第二特征表示网络,得到所述初始第二特征表示网络输出的预测第二特征表示。
    163.(4)确定所述预测第一特征表示和所述预测第二特征表示之间的相似程度,得到
    预测相似程度。
    164.其中,预设神经网络模型的模型结构为图3中所示的模型结构,样本属性信息、样本场景信息和样本历史交互信息序列在初始第一特征表示网络中的详细处理过程可以参见本公开实施例中前述第一特征表示网络对于输入数据的相关处理描述,在此不再赘述。
    165.推荐对象信息在初始第二特征表示网络中的详细处理过程可以参见本公开实施例中前述第二特征表示网络对于输入数据的相关处理描述,在此不再赘述。
    166.预测相似程度可以是余弦相似度或者其他可以表征两个向量之间相似程度的度量。
    167.(5)根据所述预测相似程度与所述标签信息之间的差异确定损失值,并基于所述损失值调整所述预设神经网络模型的模型参数,对调整后的预设神经网络模型继续进行迭代训练,直至满足预设训练结束条件,得到所述推荐对象确定模型。
    168.其中,损失值可以基于预设损失函数得到,该预设损失函数可以但不限于为交叉熵损失函数,在基于损失值调整预设神经网络模型的模型参数时可以采用梯度下降进行反向传播。预设训练结束条件可以是两次损失值的差值达到预设差值,或者迭代次数达到预设迭代次数,预设差值和预设迭代次数均可以根据实际经验进行设定。
    169.上述实施例,将场景信息分别与用户账户的属性信息和历史交互信息序列进行融合,使得模型可以很好的学习用户在不同场景下的兴趣偏好,进而基于该训练得到的推荐对象确定模型即可确定用户在不同场景下的行为偏好和兴趣偏好,从而无需针对每个场景分别单独训练召回模型,有利于提高召回效率。
    170.图7是根据一示例性实施例示出的一种推荐对象确定装置的结构框图。参照图7所示,该推荐对象确定装置700包括:
    171.第一获取单元710,被配置为执行响应于目标用户账户的对象推荐请求,获取所述目标用户账户的属性信息、当前场景信息和历史交互信息序列;
    172.融合单元720,被配置为执行将所述当前场景信息分别与所述属性信息和所述历史交互信息序列进行融合,得到第一融合特征和第二融合特征;
    173.相似程度确定单元730,被配置为执行根据所述第一融合特征和所述第二融合特征,确定各候选推荐对象对应的相似程度;
    174.目标推荐对象确定单元740,被配置为执行根据各所述候选推荐对象对应的相似程度,确定所述对象推荐请求对应的目标候选推荐对象。
    175.在一示例性的实施方式中,所述相似程度确定单元730,包括:
    176.第一特征表示确定单元,被配置为执行根据所述第一融合特征和所述第二融合特征,确定所述目标用户账户的第一特征表示;
    177.第二特征表示确定单元,被配置为执行根据各所述候选推荐对象的推荐对象信息,确定各所述候选推荐对象的第二特征表示;
    178.相似程度确定子单元,被配置为执行确定所述第一特征表示与各所述候选推荐对象的第二特征表示之间的相似程度,得到各所述候选推荐对象对应的相似程度。
    179.在一示例性的实施方式中,所述融合单元,包括:
    180.第一编码单元,被配置为执行将所述当前场景信息、所述属性信息和所述历史交互信息序列输入至推荐对象确定模型的第一特征表示网络,通过所述第一特征表示网络的
    编码网络分别对所述当前场景信息、所述属性信息和所述历史交互信息序列进行编码处理,得到当前场景编码、属性编码和历史交互编码序列;
    181.第一特征融合单元,被配置为执行将所述当前场景编码和所述属性编码输入至所述第一特征表示网络的第一特征融合网络,通过所述第一特征融合网络分别对所述当前场景编码和所述属性编码进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第一融合特征;
    182.第二特征融合单元,被配置为执行将所述当前场景编码和所述历史交互编码序列输入至所述第一特征表示网络的第二特征融合网络,通过所述第二特征融合网络分别对所述当前场景编码和所述历史交互编码序列进行特征提取,并根据所述特征提取得到的特征的乘积确定所述第二融合特征。
    183.在一示例性的实施方式中,所述第一特征融合网络包括级联的多个第一特征交叉单元;
    184.所述第一特征融合单元,具体被配置为执行:
    185.将所述当前场景编码和所述属性编码输入第一级第一特征交叉单元,通过所述第一级第一特征交叉单元分别对所述当前场景编码和所述属性编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述第一级第一特征交叉单元的输出特征;
    186.对于剩余第一特征交叉单元中的当前级第一特征交叉单元,将前一级第一特征交叉单元的输出特征和所述当前场景编码输入至所述当前级第一特征交叉单元,通过所述当前级第一特征交叉单元分别对所述输出特征和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述当前级第一特征交叉单元的输出特征;
    187.将所述级联的多个第一特征交叉单元中最后一级第一特征交叉单元的输出特征,确定为所述第一融合特征。
    188.在一示例性的实施方式中,所述第二特征融合网络包括第二特征交叉单元和第一自注意力网络;
    189.所述第二特征融合单元,具体被配置为执行:
    190.对于所述历史交互编码序列中的每个历史交互编码,将所述历史交互编码和所述当前场景编码输入至所述第二特征交叉单元,通过所述第二特征交叉单元分别对所述历史交互编码和所述当前场景编码进行特征提取,并将所述特征提取得到的特征的乘积作为所述历史交互编码对应的融合特征,得到所述历史交互编码序列对应的融合特征序列;
    191.将所述融合特征序列输入至所述第一自注意力网络,基于自注意力机制确定所述融合特征序列中各融合特征对应的权重;对各所述融合特征和对应的权重进行加权求和,得到所述第二融合特征。
    192.在一示例性的实施方式中,所述第一特征表示单元,包括:
    193.当前场景特征提取单元,被配置为执行将所述当前场景编码输入至所述第一特征表示网络的场景特征提取网络,得到当前场景特征;
    194.第一拼接单元,被配置为执行拼接所述第一融合特征、所述第二融合特征和所述当前场景特征,得到所述目标用户账户的第一特征表示。
    195.在一示例性的实施方式中,所述第二特征表示单元,包括:
    196.第二获取单元,被配置为执行获取候选推荐对象的推荐对象信息;所述推荐对象
    信息包括推荐对象属性信息和子对象序列,所述子对象序列包括所述候选推荐对象关联的多个子对象;
    197.第二编码单元,被配置为执行将所述推荐对象属性信息和所述子对象序列输入至所述推荐对象确定模型的第二特征表示网络,通过所述第二特征表示网络的编码网络分别对所述推荐对象属性信息和所述子对象序列进行编码处理,得到推荐对象编码和子对象编码序列;
    198.推荐对象特征提取单元,被配置为执行将所述推荐对象编码输入至所述第二特征表示网络的推荐对象特征提取网络,得到推荐对象特征;
    199.子对象特征确定单元,被配置为执行将所述子对象编码序列输入至所述第二特征表示网络的第二自注意力网络,基于自注意力机制确定所述子对象编码序列中各子对象编码对应的权重;对各所述子对象编码和对应的权重进行加权求和,得到子对象特征;
    200.第二拼接单元,被配置为执行拼接所述推荐对象特征和所述子对象特征,得到所述候选推荐对象的第二特征表示。
    201.在一示例性的实施方式中,所述装置还包括模型训练单元;所述模型训练单元被配置为执行:
    202.获取训练样本以及所述训练样本对应的标签信息;所述训练样本包括样本用户账户对应的样本属性信息、样本场景信息和样本历史交互信息序列,以及样本推荐对象对应的推荐对象信息;所述标签信息表征所述样本用户账户对所述样本推荐对象是否感兴趣;
    203.将所述样本属性信息、样本场景信息和样本历史交互信息序列输入至预设神经网络模型的初始第一特征表示网络,得到所述初始第一特征表示网络输出的预测第一特征表示;
    204.将所述推荐对象信息输入至所述预设神经网络模型的初始第二特征表示网络,得到所述初始第二特征表示网络输出的预测第二特征表示;
    205.确定所述预测第一特征表示和所述预测第二特征表示之间的相似程度,得到预测相似程度;
    206.根据所述预测相似程度与所述标签信息之间的差异确定损失值,并基于所述损失值调整所述预设神经网络模型的模型参数,对调整后的预设神经网络模型继续进行迭代训练,直至满足预设训练结束条件,得到所述推荐对象确定模型。
    207.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
    208.在一个示例性的实施方式中,还提供了一种电子设备,包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述任一实施方式中提供的推荐对象确定方法。
    209.该电子设备可以是终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图8是根据一示例性实施例示出的一种用于推荐对象确定方法的电子设备的框图,如图8所示,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)810(处理器810可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器830,一个或一个以上存储应用程序823或数据822的存储介质820(例如一个或一个以上海量存储设备)。其中,存储
    器830和存储介质820可以是短暂存储或持久存储。存储在存储介质820的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器810可以设置为与存储介质820通信,在服务器800上执行存储介质820中的一系列指令操作。服务器800还可以包括一个或一个以上电源860,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口840,和/或,一个或一个以上操作系统821,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
    210.输入输出接口840可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器800的通信供应商提供的无线网络。在一个实例中,输入输出接口840包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口840可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
    211.本领域普通技术人员可以理解,图8所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器800还可包括比图8中所示更多或者更少的组件,或者具有与图8所示不同的配置。
    212.在一个示例性的实施方式中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器830,上述指令可由装置800的处理器810执行以完成上述方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
    213.在示例性的实施方式中,还提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述任一实施方式中提供的推荐对象确定方法。
    214.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
    215.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
    转载请注明原文地址:https://tc.8miu.com/read-1652.html

    最新回复(0)