1.本公开涉及计算机技术领域,尤其涉及一种数据处理方法、电子设备及存储介质。
背景技术:
2.随着互联网技术的不断发展,电子设备上可以运行各种各样的电子书应用。电子书应用通常能够向用户推送书籍。
3.为了使得电子书应用能够向用户推送书籍,需要对至少一个用户在电子书应用的数据进行处理,根据处理的结果进行书籍推送。但是,对采用传统的数据格式的电子书应用上的数据进行处理时,处理效率很慢,导致书籍推送的效率很低,影响用户对电子书应用的使用体验。
技术实现要素:
4.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种数据处理方法、电子设备及存储介质。
5.第一方面,本公开提供了一种数据处理方法,包括:
6.获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成;
7.将结构化存储数据压缩成二进制格式,得到中间召回数据;
8.将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
9.第二方面,本公开提供了一种电子设备,包括处理器和存储器,存储器用于存储可执行指令,可执行指令使处理器执行以下操作:
10.获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成;
11.将结构化存储数据压缩成二进制格式,得到中间召回数据;
12.将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
13.第三方面,本公开提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现第一方面的数据处理方法。
14.本公开实施例提供的技术方案与现有技术相比具有如下优点:
15.本公开实施例的数据处理方法、电子设备及存储介质,能够获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成,并将结构化存储数据压缩成二进制格式,得到中间召回数据,进一步将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。由此,可以先将结构化存储数据转化为占用空间较小的二进制格式的中间召回数据,使得简化初始召回数据的格式,降低了召回数据的数据量,并且,通过将中间召回数据由二进制格式解压缩成字符串格式,可以
得到符合网络传输规则的召回数据。通过上述过程,可以得到符合网络传输规则的数据量较小的召回数据,使得对目标召回数据进行传输以及进一步根据目标召回数据进行书籍推荐。由此,在对电子书应用上的数据进行处理时,可以提高数据处理效率,进而提高书籍推送的效率,有利于提升用户对电子书应用的使用体验。
附图说明
16.结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
17.图1示出了本公开实施例提供的一种数据处理方法的流程示意图;
18.图2示出了本公开实施例提供的另一种数据处理方法的流程示意图;
19.图3示出了本公开实施例提供的又一种数据处理方法的流程示意图;
20.图4示出了本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
21.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
22.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
23.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
24.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
25.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
26.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
27.目前,电子设备对至少一个用户在电子书应用的数据进行处理时,用户在电子书应用的数据的数据格式是一种轻量级的数据交换格式(javascript object notation,json)。但是,基于json结构的字符串数据的数据量很大,使得数据处理效率很慢,进一步导致书籍推送的效率很低,不能保证书籍推送的实时性,影响用户对电子书应用的使用体验。
28.为了解决上述问题,本公开实施例提供了一种能够提高数据处理效率的数据处理方法、电子设备及存储介质。
29.下面首先结合图1-3对本公开实施例提供的数据处理方法进行说明。
30.本公开实施例提供的数据处理方法,可以由能够提供数据处理功能的电子设备。具体可以由控制数据处理功能的电子设备执行。其中,该电子设备可以包括但不限于诸如智能手机、笔记本电脑、个人数字助理(pda)、平板电脑(pad)、台式计算机等的固定终端、以及具有计算及存储功能的服务器。
31.图1示出了本公开实施例提供的一种数据处理方法的流程示意图。
32.如图1所示,该数据处理方法可以包括如下步骤。
33.s110、获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成。
34.在本公开实施例中,对于在电子书应用的召回阶段所产生的初始召回数据,电子设备可以获取至少一个用户对应的初始召回数据,并由至少一个用户对应的初始召回数据构成结构化存储数据,则得到电子书应用的结构化存储数据。
35.在本公开实施例中,初始召回数据可以包括电子书推送的召回节点产生的至少一个用户的召回数据。
36.可选的,初始召回数据可以包括至少一个用户的用户数据、书籍数据以及上下文特征等。其中,上下文特征可以包括用户在电子书应用上的阅读时间和阅读地点等。
37.在本公开实施例中,结构化存储数据具体可以是protobuf格式的数据。
38.在本公开实施例中,结构化存储数据具体可以通过如下方式得到:
39.s01、获取电子书应用的至少一个用户对应的初始召回数据;
40.s02、根据至少一个用户对应的初始召回数据和预先确定的结构化存储格式,生成结构化存储数据。
41.具体的,电子设备可以预先确定结构化存储格式,即确定protobuf结构,然后,将获取到的至少一个用户对应的初始召回数据依次填入protobuf结构,得到protobuf结构的数据,由此可以生成结构化存储数据。
42.s120、将结构化存储数据压缩成二进制格式,得到中间召回数据。
43.在本公开实施例中,为了提高数据处理过程的安全性并降低数据所占的空间,可以对结构化存储数据进行压缩,使得将结构化存储数据压缩成占用空间较小的二进制数据,得到中间召回数据。
44.具体的,电子设备可以将每个用户对应的结构化存储数据进行压缩,使得将结构化存储数据压缩成二进制格式,得到每个用户对应的中间召回数据。
45.由此,在本公开实施例中,通过将结构化存储数据压缩成二进制格式,可以降低召回数据所占的空间,因此,可以降低召回数据的数据量。
46.在本公开实施例中,在获取的结构化存储数据的数量较多时,可以将结构化存储数据压缩成二进制格式,否则,对结构化存储数据不进行压缩处理。
47.基于上述描述,在本公开实施例中,可选的,在s120之前,该方法还可以包括如下步骤:
48.判断结构化存储数据的数据量是否大于预先设置的数据量阈值;
49.相应的,s120具体可以包括如下步骤:
50.在结构化存储数据的数据量大于预先设置的数据量阈值的情况下,将结构化存储数据压缩成二进制格式,得到中间召回数据。
51.其中,数据量阈值可以是根据需要预先设置的判断是否对结构化存储数据进行压缩处理的数值。
52.由此,在获取的结构化存储数据的数量较多时,可以将结构化存储数据压缩成二进制格式,得到中间召回数据,然后对中间召回数据进行解压缩,使得得到目标召回数据,这样,可以通过压缩的方式降低召回数据所占的空间。
53.s130、将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
54.在本公开实施例中,为了对召回数据进行传输,可以将二进制格式的中间召回数据解压缩成字符串格式,使得将召回数据转化成满足超文本传输协议(hypertext transfer protocol,http)的字符串格式,得到至少一个用户对应的目标召回数据。
55.其中,本公开实施例中的字符串格式是除了json格式的字符串之外的其他格式。
56.可选的,本公开实施例中的字符串格式可以是超文本标记语言(hyper text markup language,html)格式、层叠样式表(cascading style sheets,css)格式、javascript(js)格式中的任意一种,在此不做限制。
57.需要说明的是,本公开实施例通过先对结构化存储数据进行压缩,再生成字符串格式的目标召回数据,可以得到符合网络传输规则的数据量较小的召回数据,使得在对目标召回数据进行处理时,可以提高数据处理效率。
58.在本公开实施例中,目标召回数据可以是用于进行后续排序处理的原始数据,使得通过对目标召回数据进行排序处理,根据排序结果,向每个用户推送的书籍。
59.需要说明的是,在结构化存储数据的数据量小于或等于预先设置的数据量阈值的情况下,可以直接将结构化存储数据由结构化存储格式转化为字符串格式,得到至少一个用户对应的目标召回数据。
60.由此,在获取的结构化存储数据的数量较少时,可以直接将结构化存储数据进行格式转化,得到符合网络传输规则的字符串格式的目标召回数据。这样,可以简化数据处理的流程;并且,结构化存储数据所占用的空间小于json格式的数据所占用的空间,因此,将结构化存储数据直接转化成目标召回数据,也可以得到符合网络传输规则的数据量较小的召回数据。
61.在本公开实施例中,能够获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成,并将结构化存储数据压缩成二进制格式,得到中间召回数据,进一步将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。由此,可以先将结构化存储数据转化为占用空间较小的二进制格式的中间召回数据,使得简化初始召回数据的格式,降低召回数据的数据量,并且,通过将中间召回数据由二进制格式解压缩成字符串格式,可以得到符合网络传输规则的召回数据。通过上述过程,可以得到符合网络传输规则的数据量较小的召回数据,使得对目标召回数据进行传输以及进一步根据目标召回数据进行书籍推荐。由此,在对电子书应用上的数据进行处理时,提高了数据处理效率,进而提高书籍推送的效率,有利于提升用户对电子书应用的使用体验。
62.在本公开另一种实施方式中,可以对结构化存储数据进行序列化处理,得到中间召回数据,以及对中间召回数据进行编码处理,得到目标召回数据。
63.图2示出了本公开实施例提供的另一种数据处理方法的流程示意图。
64.如图2所示,该数据处理方法具体包括如下步骤。
65.s210、获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成。
66.在本公开实施例中,初始召回数据可以包括列表数据和非列表数据。
67.其中,列表数据可以由多个独立的数据构成,使得列表数据的数据量很大,占用的空间很大。
68.如前述实施例描述,初始召回数据可以包括至少一个用户的用户数据、书籍数据以及上下文特征等。具体的,列表数据可以包括用户数据中的用户列表数据和书籍数据中的书籍列表数据,用户列表数据包括历史阅读书籍的书籍标识,书籍列表数据包括历史阅读书籍的书籍交互数据,书籍交互数据可以包括书籍点赞量、购买量等。非列表数据可以包括用户数据中的用户特征数据和书籍数据中的书籍特征数据。可选的,用户特征数据可以包括用户年龄、性别等,书籍特征数据可以包括书籍的分类、主人公特点等。
69.需要说明的是,s210的具体实现过程与s110相似,在此不做赘述。
70.s220、对结构化存储数据进行序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
71.在本公开实施例中,电子设备可以对结构化存储数据进行protobuf序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
72.其中,protobuf序列化可以是将结构化存储形式的数据转化成二进制字节流的过程。具体的,可以对结构化存储数据先进行编码再按照规定的存储方式对编码后的数据进行封装,得到二进制格式的中间召回数据。
73.s230、将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据。
74.在本公开实施例中,可选的,s230具体可以包括如下步骤。
75.s2301、对各个用户对应的召回数据中的列表数据进行序列化处理,使得将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据。
76.具体的,电子设备可以对各个用户对应的召回数据中的列表数据进行tensorproto序列化处理,使得将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据。
77.需要说明的是,由于列表数据的数据量很大,通过将列表数据压缩成二进制格式,降低了初始召回数据的数据量。
78.s240、根据二进制格式的列表数据更新结构化存储数据。
79.在本公开实施例中,在得到二进制格式的列表数据之后,可以将结构化存储数据中原始的列表数据替换为二进制格式的列表数据,即根据二进制格式的列表数据更新结构化存储数据,则可以得到更新后的结构化存储数据。
80.通过上述方式,更新后的结构化存储数据只包括非列表数据。
81.s250、对更新后的结构化存储数据进行序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
82.具体的,电子设备可以对更新后的结构化存储数据进行protobuf序列化处理,使
得将更新后的结构化存储数据压缩成二进制格式,得到中间召回数据。
83.由此,在本公开实施例中,通过s230~s250,可以对结构化存储数据进行两次压缩,使得压缩得到的中间召回数据所占的空间更小,进一步的降低的中间召回数据的数据量。
84.s260、对中间召回数据进行编码处理,使得将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
85.在本公开实施例中,电子设备可以利用预设的编码方式,对中间召回数据进行编码处理,使得将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
86.可选的,预设的编码方式可以是base64编码方式。具体的,base64编码方式可以用64个字符来表示任意二进制数据的方法,可以通过将二进制数据转变为64个“可打印字符”,使得解压缩得到的字符串格式的目标召回书籍能够满足http传输协议。
87.由此,在本公开实施例中,可以先对结构化存储数据进行序列化处理,得到中间召回数据,然后对中间召回数据进行编码处理,得到符合网络传输规则的目标召回数据。通过上述过程,可以得到符合网络传输规则的数据量较小的召回数据。
88.在本公开又一种实施方式中,通过对用于在电子书应用上的阅读交互数据进行召回处理,得到初始召回数据;并且,在得到目标召回数据之后,可以对目标召回数据进行排序,并基于排序结果进行书籍推送。
89.图3示出了本公开实施例提供的又一种数据处理方法的流程示意图。
90.如图3所示,该数据处理方法可以包括如下步骤。
91.s310、获取至少一个用户在电子书应用上针对原始书籍的阅读交互数据。
92.在本公开实施例中,用户在电子书上阅读书籍、点赞书籍、购买书籍以及评论书籍之后,电子设备可以生成该用户的阅读交互书籍。当需要向用户推送书籍时,电子设备可以获取至少一个用户在电子书应用上针对原始书籍的阅读交互数据。
93.在本公开实施例中,原始书籍可以是电子书应用对应的书籍库中的书籍。
94.在本公开实施例中,阅读交互数据可以包括用户点赞过的书籍、已读完阅读的书籍、已阅读但未读完的书籍、评论过的书籍、购买过的书籍等。
95.s320、对阅读交互数据进行召回处理,得到电子书应用上至少一个用户对应的初始召回数据,初始召回数据包括针对至少一个用户的待推送书籍。
96.在本公开实施例中,电子设备可以采用预先设置的召回规则,对阅读交互数据进行召回处理,得到每个用户对应的初始召回数据,且初始召回数据可以包括每个用户的待推送书籍。
97.可选的,预先设置的召回规则可以是基于协同过滤的原则、基于内容的原则以及基于热门的原则。
98.在本公开实施例中,待推送书籍可以是从原始书籍中初步筛选出来的用于推送给用户的书籍。
99.s330、根据至少一个用户对应的初始召回数据和预先确定的结构化存储格式,生成结构化存储数据。
100.s340、将结构化存储数据压缩成二进制格式,得到中间召回数据。
101.s350、将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
102.其中,s330~s350与s110~s130相似,在此不做赘述。
103.s360、针对至少一个用户对应的目标召回数据,对目标召回数据中的待推送书籍进行排序,得到待推送书籍的排序结果。
104.需要说明的是,由于初始召回书籍包括至少一个用户的待推送书籍,则生成的目标召回数据也可以包括至少一个用户的待推送书籍。
105.在本公开实施例中,可选的,s360具体可以包括如下步骤。
106.s3601、将至少一个用户对应的目标召回数据输入预先训练好的排序模型,得到各个用户针对待推送书籍的偏好得分;
107.s3602、按照偏好得分由高到低的顺序,对待推送书籍进行排序,得到待推送书籍的排序结果。
108.具体的,在得到目标召回数据之后,电子设备可以获取预先训练好的排序模型,由于目标召回数据的数据格式与排序模型的输入接口对应的格式一致,因此,可以将至少一个用户对应的目标召回数据输入预先训练好的排序模型,使得利用排序模型预测各个用户针对待推送书籍的偏好得分;然后,按照偏好得分由高到低的顺序,对待推送书籍进行排序,得到待推送书籍对应的排序结果。
109.其中,偏好得分可以用于表征用户对待推送书籍的喜爱程度。
110.s370、基于排序结果,对待推送书籍进行推送。
111.在本公开实施例中,电子设备可以根据每个用户对应的待推送电子书的排序结果,将排在前面的待推送书籍推送给各个用户,通过这种方式,可以得到使用电子书应用的每个用户的最终推送书籍。
112.在一些实施例中,可以将偏好得分排在前三位的待推送书籍推送给各个用户。
113.在另一些实施例中,可以将偏好得分超过预先设置的偏好得分阈值的书籍,推送给各个用户。
114.由此,在本公开实施例中,可以先对用于在电子书应用上的阅读交互数据进行召回处理,得到初始召回数据;然后,将初始召回数据转化为符合网络传输规则的数据量较小的目标召回数据;最后,对目标召回数据进行排序,并基于排序结果进行书籍推送。通过上述方式,由于目标召回数据的数据量较小,因此,在进行书籍推送时,可以提高召回数据的处理效率,保证了书籍推送过程的实时性,有利于提升用户对电子书应用的使用体验。
115.图4示出了本公开实施例提供的一种电子设备的结构示意图。
116.本公开实施例提供的电子设备可以包括能够提供数据处理功能的电子设备。该电子设备可以包括但不限于诸如智能手机、笔记本电脑、个人数字助理(pda)、平板电脑(pad)、台式计算机等的固定终端。
117.需要说明的是,图4示出的电子设备400仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
118.该电子设备400传统上包括处理器410和以存储器420形式的计算机程序产品或者计算机可读介质。存储器420可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。存储器420具有用于执行上述数据处理方法中的任
何方法步骤的可执行指令(或程序代码)4211的存储空间421。例如,用于可执行指令的存储空间421可以包括分别用于实现上面的数据处理方法中的各种步骤的各个可执行指令4211。这些可执行指令可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,光盘(cd)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为便携式或者固定存储单元。该存储单元可以具有与图4的电子设备400中的存储器420类似布置的存储段或者存储空间等。可执行指令可以例如以适当形式进行压缩。通常,存储单元包括用于执行根据本公开的数据处理方法步骤的可执行指令,即可以由例如诸如处理器410之类的处理器读取的代码,这些代码当由电子设备400运行时,导致该电子设备400执行上面所描述的数据处理方法中的各个步骤。
119.当然,为了简化,图4中仅示出了该电子设备400中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口、输入装置和输出装置等等的组件。除此之外,根据具体应用情况,电子设备400还可以包括任何其他适当的组件。
120.本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开各实施例所提供的数据处理方法。
121.该计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电链接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
122.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
123.在本公开实施例中,可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—链接到用户计算机,或者,可以链接到外部计算机(例如利用因特网服务提供商来通过因特网链接)。
124.本技术公开了:
125.a1.一种数据处理方法,包括:
126.获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成;
127.将结构化存储数据压缩成二进制格式,得到中间召回数据;
128.将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
129.a2.根据a1的方法,其中,在获取电子书应用的结构化存储数据之前,该方法还包括:
130.获取电子书应用的至少一个用户对应的初始召回数据;
131.根据至少一个用户对应的初始召回数据和预先确定的结构化存储格式,生成结构化存储数据。
132.a3.根据a1的方法,其中,将结构化存储数据压缩成二进制格式,得到中间召回数据,包括:
133.对结构化存储数据进行序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
134.a4.根据a1的方法,其中,初始召回数据包括列表数据;
135.其中,在将结构化存储数据压缩成二进制格式,得到中间召回数据之前,该方法还包括:
136.将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据;
137.根据二进制格式的列表数据更新结构化存储数据。
138.a5.根据a4的方法,其中,将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据,包括:
139.对各个用户对应的召回数据中的列表数据进行序列化处理,使得将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据。
140.a6.根据a5的方法,其中,将结构化存储数据压缩成二进制格式,得到中间召回数据,包括:
141.对更新后的结构化存储数据进行序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
142.a7.根据a1的方法,其中,将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据,包括:
143.对中间召回数据进行编码处理,使得将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
144.a8.根据a1的方法,其中,在将结构化存储数据压缩成二进制格式,得到中间召回数据之前,该方法还包括:
145.判断结构化存储数据的数据量是否大于预先设置的数据量阈值;
146.其中,将结构化存储数据压缩成二进制格式,得到中间召回数据,包括:
147.在结构化存储数据的数据量大于预先设置的数据量阈值的情况下,将结构化存储数据压缩成二进制格式,得到中间召回数据。
148.a9.根据a8的方法,其中,该方法还包括:
149.在结构化存储数据的数据量小于或等于预先设置的数据量阈值的情况下,直接将结构化存储数据由结构化存储格式转化为字符串格式,得到至少一个用户对应的目标召回数据。
150.a10.根据a2的方法,其中,获取电子书应用的至少一个用户对应的初始召回数据,包括:
151.获取至少一个用户在电子书应用上针对原始书籍的阅读交互数据;
152.对阅读交互数据进行召回处理,得到电子书应用上至少一个用户对应的初始召回数据,初始召回数据包括针对至少一个用户的待推送书籍。
153.a11.根据a10的方法,其中,在将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据之后,该方法还包括:
154.针对至少一个用户对应的目标召回数据,对目标召回数据中的待推送书籍进行排序,得到待推送书籍的排序结果;
155.基于排序结果,对待推送书籍进行推送。
156.a12.根据a11的方法,其中,针对至少一个用户对应的目标召回数据,对目标召回数据中的待推送书籍进行排序,得到待推送书籍的排序结果,包括:
157.将至少一个用户对应的目标召回数据输入预先训练好的排序模型,得到各个用户针对待推送书籍的偏好得分;
158.按照偏好得分由高到低的顺序,对待推送书籍进行排序,得到待推送书籍的排序结果。
159.b13.一种电子设备,其中,包括处理器和存储器,存储器用于存储可执行指令,可执行指令使处理器执行以下操作:
160.获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成;
161.将结构化存储数据压缩成二进制格式,得到中间召回数据;
162.将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
163.b14.根据b13的电子设备,其中,在处理器执行获取电子书应用的结构化存储数据之前,可执行指令具体使处理器执行:
164.获取电子书应用的至少一个用户对应的初始召回数据;
165.根据至少一个用户对应的初始召回数据和预先确定的结构化存储格式,生成结构化存储数据。
166.b15.根据b13的电子设备,在处理器执行将结构化存储数据压缩成二进制格式,得到中间召回数据时,可执行指令具体使处理器执行:
167.对结构化存储数据进行序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
168.b16.根据b13的电子设备,其中,初始召回数据包括列表数据;
169.其中,在处理器执行将结构化存储数据压缩成二进制格式,得到中间召回数据之前,可执行指令具体使处理器执行:
170.将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据;
171.根据二进制格式的列表数据更新结构化存储数据。
172.b17.根据b16的电子设备,其中,在处理器执行将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据时,可执行指令具体使处理器执行:
173.对各个用户对应的召回数据中的列表数据进行序列化处理,使得将各个用户对应
的召回数据中的列表数据压缩成二进制格式,得到二进制格式的列表数据。
174.b18.根据b17的电子设备,其中,在处理器执行将结构化存储数据压缩成二进制格式,得到中间召回数据时,可执行指令具体使处理器执行:
175.对更新后的结构化存储数据进行序列化处理,使得将结构化存储数据压缩成二进制格式,得到中间召回数据。
176.b19.根据b13的电子设备,其中,在处理器执行将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据时,可执行指令具体使处理器执行:
177.对中间召回数据进行编码处理,使得将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。
178.b20.根据b13的电子设备,其中,在处理器执行对将结构化存储数据压缩成二进制格式,得到中间召回数据之前,可执行指令具体使处理器执行:
179.判断结构化存储数据的数据量是否大于预先设置的数据量阈值;
180.其中,在处理器执行将结构化存储数据压缩成二进制格式,得到中间召回数据时,可执行指令具体使处理器执行:
181.在结构化存储数据的数据量大于预先设置的数据量阈值的情况下,将结构化存储数据压缩成二进制格式,得到中间召回数据。
182.b21.根据b20的电子设备,其中,
183.可执行指令具体使处理器执行:
184.在结构化存储数据的数据量小于或等于预先设置的数据量阈值的情况下,直接将结构化存储数据由结构化存储格式转化为字符串格式,得到至少一个用户对应的目标召回数据。
185.b22.根据b14的电子设备,其中,在处理器执行获取电子书应用的至少一个用户对应的初始召回数据时,可执行指令具体使处理器执行:
186.获取至少一个用户在电子书应用上针对原始书籍的阅读交互数据;
187.对阅读交互数据进行召回处理,得到电子书应用上至少一个用户对应的初始召回数据,初始召回数据包括针对至少一个用户的待推送书籍。
188.b23.根据b22的电子设备,其中,在处理器执行将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据之后,可执行指令具体使处理器执行:
189.针对至少一个用户对应的目标召回数据,对目标召回数据中的待推送书籍进行排序,得到待推送书籍的排序结果;
190.基于排序结果,对待推送书籍进行推送。
191.b24.根据b22的电子设备,其中,在处理器执行针对至少一个用户对应的目标召回数据,对目标召回数据中的待推送书籍进行排序,得到待推送书籍的排序结果时,可执行指令具体使处理器执行:
192.将至少一个用户对应的目标召回数据输入预先训练好的排序模型,得到各个用户针对待推送书籍的偏好得分;
193.按照偏好得分由高到低的顺序,对待推送书籍进行排序,得到待推送书籍的排序
结果。
194.c25.一种计算机可读存储介质,其中,存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现用上述a1-a12中任一项的数据处理方法。
195.本公开的各个部件实施例可以全部或部分步骤以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本公开实施例的电子设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
196.以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
197.此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
198.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现书的示例形式。
技术特征:
1.一种数据处理方法,其特征在于,所述方法包括:获取电子书应用的结构化存储数据,所述结构化存储数据由至少一个用户对应的初始召回数据构成;将所述结构化存储数据压缩成二进制格式,得到中间召回数据;将所述中间召回数据由所述二进制格式解压缩成字符串格式,得到所述至少一个用户对应的目标召回数据。2.根据权利要求1所述的方法,其特征在于,在所述获取电子书应用的结构化存储数据之前,所述方法还包括:获取所述电子书应用的至少一个用户对应的初始召回数据;根据所述至少一个用户对应的初始召回数据和预先确定的结构化存储格式,生成所述结构化存储数据。3.根据权利要求1所述的方法,其特征在于,所述将所述结构化存储数据压缩成二进制格式,得到中间召回数据,包括:对所述结构化存储数据进行序列化处理,使得将所述结构化存储数据压缩成二进制格式,得到所述中间召回数据。4.根据权利要求1所述的方法,其特征在于,所述初始召回数据包括列表数据;其中,在所述将所述结构化存储数据压缩成二进制格式,得到中间召回数据之前,所述方法还包括:将各个用户对应的召回数据中的列表数据压缩成二进制格式,得到所述二进制格式的列表数据;根据所述二进制格式的列表数据更新所述结构化存储数据。5.根据权利要求1所述的方法,其特征在于,所述将所述中间召回数据由所述二进制格式解压缩成字符串格式,得到所述至少一个用户对应的目标召回数据,包括:对所述中间召回数据进行编码处理,使得将所述中间召回数据由所述二进制格式解压缩成字符串格式,得到所述至少一个用户对应的目标召回数据。6.根据权利要求1所述的方法,其特征在于,在所述将所述结构化存储数据压缩成二进制格式,得到中间召回数据之前,所述方法还包括:判断所述结构化存储数据的数据量是否大于预先设置的数据量阈值;其中,所述将所述结构化存储数据压缩成二进制格式,得到中间召回数据,包括:在所述结构化存储数据的数据量大于所述预先设置的数据量阈值的情况下,将所述结构化存储数据压缩成二进制格式,得到所述中间召回数据。7.根据权利要求2所述的方法,其特征在于,所述获取所述电子书应用的至少一个用户对应的初始召回数据,包括:获取所述至少一个用户在所述电子书应用上针对原始书籍的阅读交互数据;对所述阅读交互数据进行召回处理,得到所述电子书应用上至少一个用户对应的初始召回数据,所述初始召回数据包括针对所述至少一个用户的待推送书籍。8.根据权利要求7所述的方法,其特征在于,在所述将所述中间召回数据由所述二进制格式解压缩成字符串格式,得到所述至少一个用户对应的目标召回数据之后,所述方法还包括:
针对所述至少一个用户对应的目标召回数据,对所述目标召回数据中的所述待推送书籍进行排序,得到所述待推送书籍的排序结果;基于所述排序结果,对所述待推送书籍进行推送。9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器用于存储可执行指令,所述可执行指令使所述处理器执行以下操作:获取电子书应用的结构化存储数据,所述结构化存储数据由至少一个用户对应的初始召回数据构成;将所述结构化存储数据压缩成二进制格式,得到中间召回数据;将所述中间召回数据由所述二进制格式解压缩成字符串格式,得到所述至少一个用户对应的目标召回数据。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,当所述计算机程序被处理器执行时,使得处理器实现用上述权利要求1-8中任一项所述的数据处理方法。
技术总结
本公开涉及一种数据处理方法、电子设备及存储介质。其中,数据处理方法包括:获取电子书应用的结构化存储数据,结构化存储数据由至少一个用户对应的初始召回数据构成;将结构化存储数据压缩成二进制格式,得到中间召回数据;将中间召回数据由二进制格式解压缩成字符串格式,得到至少一个用户对应的目标召回数据。根据本公开实施例,可以得到符合网络传输规则的数据量较小的召回数据,使得对目标召回数据进行传输以及进一步根据目标召回数据进行书籍推荐。因此,在对电子书应用上的数据进行处理时,可以提高数据处理效率,进而提高书籍推送的效率,有利于提升用户对电子书应用的使用体验。体验。体验。
技术研发人员:明瑞刚
受保护的技术使用者:掌阅科技股份有限公司
技术研发日:2022.02.17
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-11627.html