本说明书涉及数据处理领域,尤其涉及一种内容召回方法和系统以及内容推荐方法和系统。
背景技术:
1、内容召回广泛应用于各种互联网产品和服务中,旨在根据用户的偏好和上下文信息,从海量内容中筛选出潜在感兴趣的内容。为了提升内容召回的效果,出现了一些结合大语言模型的内容召回方法。然而,内容召回对大语言模型的算力消耗非常大,需要投入大量的成本,这无疑增加了基于大语言模型进行内容召回的大规模应用的难度。
2、因此,需要提供一种节约成本的内容召回方法。
3、背景技术部分的内容仅仅是发明人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。
技术实现思路
1、本说明书提供的内容召回方法和系统以及内容推荐方法和系统,可以节约召回成本。
2、第一方面,本说明书提供一种内容召回方法,包括:确定针对目标用户的召回指令;从预先划分的n个用户群体的种子用户中,确定所述目标用户对应的目标种子用户,一个用户群体包括x个种子用户,所述x小于所属用户群体的用户数量,所述n和x分别为大于0的整数;读取所述目标种子用户的目标种子召回内容,所述目标种子召回内容是预先基于大语言模型进行召回得到的;以及将所述目标种子召回内容确定为所述目标用户基于所述大语言模型的召回内容。
3、在一些实施例中,所述从预先划分的n个用户群体的种子用户中,确定所述目标用户对应的目标种子用户,包括:获取所述目标用户的目标画像;确定所述目标画像与所述n个用户群体的种子用户的用户画像之间的画像相似度;以及将所述画像相似度最高的种子用户确定为所述目标种子用户。
4、在一些实施例中,所述n个用户群体是通过以下方式划分的:获取多个用户在至少一个预设维度下的数据;对于一个用户,基于所述用户在所述至少一个预设维度下的数据确定所述用户在所述至少一个预设维度中的分类;以及基于所述多个用户在所述至少一个预设维度中的分类,将所述多个用户划分为所述n个用户群体,其中同一个用户群体中的用户在所述至少一个预设维度中的分类一致。
5、在一些实施例中,一个用户群体的x个种子用户是从所属用户群体中随机选取的。
6、在一些实施例中,所述目标种子用户的目标种子召回内容是通过以下方式得到的:将所述目标种子用户的用户数据输入所述大语言模型,得到所述大语言模型输出的m个关键词,所述m个关键词包括表征用户偏好的实体,所述用户数据包括基础数据和历史行为数据;对所述m个关键词中一个关键词:确定所述关键词与预设的内容数据库中多个内容的内容相似度;以及基于所述内容相似度确定所述目标种子召回内容。
7、在一些实施例中,所述将所述目标种子用户的用户数据输入所述大语言模型,包括:基于所述用户数据和预设的提示工程模板生成提示工程数据,所述提示工程模板用于引导所述大语言模型基于所述用户数据推理所述用户偏好;以及将所述提示工程数据输入所述大语言模型。
8、在一些实施例中,所述内容数据库中的一个内容包括多个属性,所述确定所述关键词与预设的内容数据库中多个内容的内容相似度,包括对所述多个内容中的一个内容:确定所述关键词与所述内容的多个属性的属性相似度;以及基于所述属性相似度确定所述关键词与所述内容之间的所述内容相似度。
9、在一些实施例中,所述确定所述关键词与预设的内容数据库中多个内容的内容相似度,包括对所述多个内容中的一个内容:分别确定所述关键词与所述内容的多个属性之间的所述属性相似度,得到与所述多个属性对应的多个属性相似度;以及将所述多个属性相似度之和确定为所述内容相似度。
10、在一些实施例中,所述多个属性至少包括内容标题、内容类目或者内容品牌中的两个。
11、在一些实施例中,所述基于所述内容相似度确定所述目标种子召回内容,包括:从所述关键词与所述多个内容之间的多个内容相似度中,选取排名靠前的内容;以及对所述m个关键词选取的内容进行内容相似度的排名,并将排名靠前的内容确定为所述目标种子召回内容。
12、在一些实施例中,还包括:获取所述目标用户的其他召回内容;以及将所述基于所述大语言模型的召回内容与所述其他召回内容进行合并,得到所述目标用户的目标召回内容。
13、第二方面,本说明书提供一种内容召回系统,包括:至少一个存储介质,存储有至少一组指令集用于实现内容召回;以及至少一个处理器,同所述至少一个存储介质通信连接,其中当所述内容召回系统运行时,所述至少一个处理器读取所述至少一个指令集并实施第一方面中任一项所述的内容召回方法。
14、第三方面,本说明书提供一种内容推荐方法,包括:接收针对目标用户的推荐请求;基于第一方面中的任一项所述的内容召回方法,得到所述目标召回内容;以及从所述目标召回内容中确定目标推荐内容,并将所述目标推荐内容输出给所述目标用户。
15、第四方面,本说明书还提供一种内容推荐系统,包括至少一个存储介质,存储有至少一组指令集用于实现内容推荐;以及至少一个处理器,同所述至少一个存储介质通信连接,其中当所述内容推荐系统运行时,所述至少一个处理器读取所述至少一个指令集并实施第三方面所述的内容推荐方法。
16、由以上技术方案可知,本说明书提供的内容召回方法和系统,预先划分了n个用户群体,一个用户群体包括x个种子用户,且该x小于所属用户群体的用户数量。而且,可以预先给种子用户基于大语言模型进行召回,得到种子召回内容。所述系统在确定针对目标用户的召回指令时,可以从预先划分的n个用户群体的种子用户中确定目标用户对应的目标种子用户,即,将目标用户映射到目标种子用户上,从而将目标种子用户预先基于大语言模型得到的目标种子召回内容确定为目标用户基于大语言模型的召回内容。由于只需要为用户群体中的少量种子用户调用大语言模型进行召回,因此极大地节约了大语言模型的算力成本,也就节约了内容召回的成本,推动了基于大语言模型进行内容召回的大规模应用。
17、本说明书提供的内容推荐方法和系统,在接收到针对目标用户的推荐请求时,通过上述内容召回方法得到目标用户的目标召回内容,从而从该目标召回内容中确定目标推荐内容并输出给目标用户。由于是将目标种子用户预先基于大语言模型得到的目标种子召回内容作为了目标用户基于大语言模型的召回内容,即只需要为用户群体中的少量种子用户调用大语言模型进行召回,因此极大地节约了大语言模型的算力成本,即节约了内容召回的成本,进而节约了内容推荐的成本。
18、本说明书提供的内容召回方法和系统以及内容推荐方法和系统的其他功能将在以下说明中部分列出。根据描述,以下数字和示例介绍的内容将对那些本领域的普通技术人员显而易见。本说明书提供的内容召回方法和系统以及内容推荐方法和系统的创造性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分解释。
1.一种内容召回方法,包括:
2.如权利要求1所述的方法,其中,所述从预先划分的n个用户群体的种子用户中,确定所述目标用户对应的目标种子用户,包括:
3.如权利要求1所述的方法,其中,所述n个用户群体是通过以下方式划分的:
4.如权利要求1所述的方法,其中,一个用户群体的x个种子用户是从所属用户群体中随机选取的。
5.如权利要求1所述的方法,其中,所述目标种子用户的目标种子召回内容是通过以下方式得到的:
6.如权利要求5所述的方法,其中,所述将所述目标种子用户的用户数据输入所述大语言模型,包括:
7.如权利要求5所述的方法,其中,所述内容数据库中的一个内容包括多个属性,所述确定所述关键词与预设的内容数据库中多个内容的内容相似度,包括对所述多个内容中的一个内容:
8.如权利要求7所述的方法,其中,所述确定所述关键词与预设的内容数据库中多个内容的内容相似度,包括对所述多个内容中的一个内容:
9.如权利要求7所述的方法,其中,所述多个属性至少包括内容标题、内容类目或者内容品牌中的两个。
10.如权利要求5所述的方法,其中,所述基于所述内容相似度确定所述目标种子召回内容,包括:
11.如权利要求1所述的方法,其中,还包括:
12.一种内容召回系统,包括:
13.一种内容推荐方法,包括:
14.一种内容推荐系统,包括:
