所属的技术人员能够理解,本技术的各个方面可以实现为系统、方法或程序产品。因此,本技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一发明构思,本技术实施例中还提供了一种计算设备。在一种实施例中,该计算设备可以是服务器,如图1所示的服务器120。在该实施例中,计算设备1700的结构如图17所示,可以至少包括存储器1701、通讯模块1703,以及至少一个处理器1702。存储器1701,用于存储处理器1702执行的计算机程序。存储器1701可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。存储器1701可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器1701也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器1701是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器1701可以是上述存储器的组合。处理器1702,可以包括一个或多个中央处理单元(central processing unit,cpu)或者为数字处理单元等等。处理器1702,用于调用存储器1701中存储的计算机程序时实现上述标题质量评估方法。通讯模块1703用于与终端设备和其他服务器进行通信。本技术实施例中不限定上述存储器1701、通讯模块1703和处理器1702之间的具体连接介质。本技术实施例在图17中以存储器1701和处理器1702之间通过总线1704连接,总线1704在图17中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1704可以分为地址总线、数据总线、控制总线等。为便于描述,图17中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。存储器1701中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本技术实施例的标题质量评估方法。处理器1702用于执行上述的标题质量评估方法。在另一种实施例中,计算设备也可以是其他计算设备,如图1所示的终端设备110。在该实施例中,计算设备的结构可以如图18所示,包括:通信组件1810、存储器1820、显示单元1830、摄像头1840、传感器1850、音频电路1860、蓝牙模块1870、处理器1880等部件。通信组件1810用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(wireless fidelity,wifi)模块,wifi模块属于短距离无线传输技术,计算设备通过wifi模块可以帮助对象收发信息。存储器1820可用于存储软件程序及数据。处理器1880通过运行存储在存储器1820的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器1820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1820存储有使得终端设备110能运行的操作系统。本技术中存储器1820可以存储操作系统及各种应用程序,还可以存储执行本技术实施例标题质量评估方法的计算机程序。显示单元1830还可用于显示由对象输入的信息或提供给对象的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,gui)。具体地,显示单元1830可以包括设置在终端设备110正面的显示屏1832。其中,显示屏1832可以采用液晶显示器、发光二极管等形式来配置。显示单元1830可以用于显示本技术实施例中的标题质量评估界面、质量评估结果界面等。显示单元1830还可用于接收输入的数字或字符信息,产生与终端设备110的对象设置以及功能控制有关的信号输入,具体地,显示单元1830可以包括设置在终端设备110正面的触控屏1831,可收集对象在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。其中,触控屏1831可以覆盖在显示屏1832之上,也可以将触控屏1831与显示屏1832集成而实现物理终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本技术中显示单元1830可以显示应用程序以及对应的操作步骤。摄像头1840可用于捕获静态图像,对象可以将摄像头1840拍摄的图像通过应用发布。摄像头1840可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1880转换成数字图像信号。物理终端设备还可以包括至少一种传感器1850,比如加速度传感器1851、距离传感器1852、指纹传感器1853、温度传感器1854。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。音频电路1860、扬声器1861、传声器1862可提供对象与终端设备110之间的音频接口。音频电路1860可将接收到的音频数据转换后的电信号,传输到扬声器1861,由扬声器1861转换为声音信号输出。物理终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器1862将收集的声音信号转换为电信号,由音频电路1860接收后转换为音频数据,再将音频数据输出至通信组件1810以发送给比如另一物理终端设备110,或者将音频数据输出至存储器1820以便进一步处理。蓝牙模块1870用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,物理终端设备可以通过蓝牙模块1870与同样具备蓝牙模块的可穿戴计算设备(例如智能手表)建立蓝牙连接,从而进行数据交互。处理器1880是物理终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1820内的软件程序,以及调用存储在存储器1820内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1880可包括一个或多个处理单元;处理器1880还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1880中。本技术中处理器1880可以运行操作系统、应用程序、用户界面显示及触控响应,以及本技术实施例的标题质量评估方法。另外,处理器1880与显示单元1830耦接。此外需要注意的是,在本技术的具体实施方式中,涉及到与多媒体信息的历史浏览数据等相关的对象数据,当本技术以上实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。在一些可能的实施方式中,本技术提供的标题质量评估方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在计算设备上运行时,计算机程序用于使计算设备执行本说明书上述描述的根据本技术各种示例性实施方式的标题质量评估方法中的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体地例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。本技术的实施方式的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括计算机程序,并可以在计算设备上运行。然而,本技术的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本技术操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。计算机程序可以完全地在用户计算设备上执行、部分地在用户计算设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。此外,尽管在附图中以特定顺序描述了本技术方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
背景技术:
1、目前,随着互联网技术的快速发展,自媒体应用越来越普遍,发布对象可以通过在自媒体应用上发布多媒体信息进行网络社交活动,多媒体信息可以包括图文、音频和视频等内容。
2、在多媒体信息的创造过程中,不仅会创造多媒体信息的内容,还会基于多媒体信息的内容创造一个标题,并将内容和标题同时进行发布展现,一个高质量的标题既能囊括内容的主旨,又能吸引浏览对象的兴趣,因此,需要对多媒体信息的标题质量进行评估。
3、现有技术中,在评估标题质量时,通常采用人工评估的方式,从流畅性和多样性等方面衡量标题质量,对标题质量进行手动打分。
4、然而,通过相关技术中的这种方式评估标题质量时,由于人工评估存在主观性,以及需要依赖于专业人员的经验,因此,不同的专业人员评估的结果不同,导致评估结果不准确,例如,当专业人员的经验不够时,可能会存在评估失误的情况,并且,人工评估的效率较低和成本较高。
5、因此,如何提高标题质量评估的准确性和评估效率,降低评估成本是目前需要解决的技术问题。
技术实现思路
1、本技术实施例提供一种标题质量评估方法、装置、计算设备及存储介质,以提高标题质量评估的准确度和评估效率。
2、第一方面,本技术实施例提供了一种标题质量评估方法,该方法包括:
3、获取多媒体信息的待评估标题以及与所述待评估标题关联的各参考标题,其中,每个参考标题为:基于多媒体信息的信息内容和历史浏览数据,生成的符合质量条件的标题;
4、针对各参考标题中每个参考标题,分别执行以下操作:基于参考标题包含的至少一个分词的词特征,获得每个分词的吸引评估值,并基于每个分词的吸引评估值,分别确定相应分词的吸引权重,吸引评估值表征:相应分词吸引浏览对象浏览多媒体信息的可能性;
5、分别基于待评估标题包含的至少一个分词和各参考标题包含的至少一个分词的词特征,结合各参考标题包含的至少一个分词的吸引权重,确定各参考标题中每个参考标题与待评估标题之间的至少一个相关度;
6、从获得的各相关度中,确定符合预设评估条件的至少一个目标相关度,作为待评估标题的质量评估结果。
7、第二方面,本技术实施例还提供了一种标题质量评估装置,该装置包括:
8、获取模块,用于获取多媒体信息的待评估标题以及与待评估标题关联的各参考标题,其中,每个参考标题为:基于多媒体信息的信息内容和历史浏览数据,生成的符合质量条件的标题;
9、第一处理模块,用于针对各参考标题中每个参考标题,分别执行以下操作:基于参考标题包含的至少一个分词的词特征,获得每个分词的吸引评估值,并基于每个分词的吸引评估值,分别确定相应分词的吸引权重,吸引评估值表征:相应分词吸引浏览对象浏览多媒体信息的可能性;
10、第二处理模块,用于分别基于待评估标题包含的至少一个分词和各参考标题包含的至少一个分词的词特征,结合各参考标题包含的至少一个分词的吸引权重,确定各参考标题中每个参考标题与待评估标题之间的至少一个相关度;
11、生成模块,用于从获得的各相关度中,确定符合预设评估条件的至少一个目标相关度,作为待评估标题的质量评估结果。
12、在一种可能的实现方式,基于参考标题包含的至少一个分词的词特征,获得每个分词的吸引评估值,并基于每个分词的吸引评估值,分别确定相应分词的吸引权重时,第一处理模块用于:
13、基于参考标题包含的至少一个分词的词特征,结合参考标题的标题特征和历史浏览数据,获得每个分词的吸引评估值;
14、对获得的各吸引评估值进行归一化操作,获得每个分词的吸引权重。
15、在一种可能的实现方式,基于参考标题包含的至少一个分词的词特征,结合参考标题的标题特征和历史浏览数据,获得每个分词的吸引评估值时,第一处理模块还用于:
16、基于参考标题包含的至少一个分词的词特征和参考标题的标题特征,获得每个分词各自与参考标题之间的关联度;
17、基于参考标题的历史浏览数据,确定参考标题的吸引度;
18、基于获得的各关联度和吸引度,确定每个分词的吸引评估值。
19、在一种可能的实现方式,分别基于待评估标题包含的至少一个分词和各参考标题包含的至少一个分词的词特征,结合各参考标题包含的至少一个分词的吸引权重,确定各参考标题中每个参考标题与待评估标题之间的相关度时,第二处理模块用于:
20、根据各参考标题和待评估标题各自的文本信息,提取各参考标题包含的至少一个分词和待评估标题包含的至少一个分词的词特征,并对获得的各词特征进行归一化操作,获得各目标词特征;
21、基于各参考标题包含的至少一个分词的目标词特征和待评估标题包含的至少一个分词的目标词特征,确定各参考标题包含的至少一个分词各自与待评估标题包含的至少一个分词之间的词相似度;
22、针对各参考标题中每个参考标题,分别执行以下操作:基于参考标题包含的至少一个分词各自与待评估标题包含的至少一个分词之间的词相似度,结合参考标题包含的至少一个分词的吸引权重,确定参考标题与待评估标题之间的至少一个相关度。
23、在一种可能的实现方式,基于参考标题包含的至少一个分词各自与待评估标题包含的至少一个分词之间的词相似度,结合参考标题包含的至少一个分词的吸引权重,确定参考标题与待评估标题之间的至少一个相关度时,第二处理模块还用于:
24、针对待评估标题包含的至少一个分词,分别执行以下操作:基于预设的筛选规则,确定一个分词对应的至少一个词相似度中的目标词相似度,并基于获得的各目标词相似度和参考标题包含的至少一个分词的吸引权重,确定待评估标题与一个参考标题之间的第一相关度;
25、针对参考标题包含的至少一个分词,分别执行以下操作:基于筛选规则,确定一个分词对应的至少一个词相似度中的目标词相似度,并基于获得的各目标词相似度和相应的吸引权重,确定待评估标题与一个参考标题之间的第二相关度;
26、针对待评估标题和参考标题各自包含的至少一个分词,分别执行以下操作:基于筛选规则,确定一个分词对应的至少一个词相似度中的目标词相似度,并基于获得的各目标词相似度和参考标题包含的至少一个分词的吸引权重,确定待评估标题与参考标题之间的第三相关度。
27、在一种可能的实现方式,从获得的各相关度中,确定符合预设评估条件的至少一个目标相关度,作为待评估标题的质量评估结果之后,该装置还包括更新模块,更新模块用于:
28、从样本标题集中选取出预设数量的各样本标题对;
29、基于各样本标题对中包含的两个样本标题之间的至少一个样本相关度,对至少一个目标相关度进行值域更新;
30、将更新后的至少一个目标相关度,作为待评估标题的质量评估结果。
31、在一种可能的实现方式,基于各样本标题对中包含的两个样本标题之间的至少一个样本相关度,对至少一个目标相关度进行值域更新时,更新模块还用于:
32、针对各样本标题对,分别执行以下操作:基于一个样本标题对中包含的两个样本标题各自的文本信息,提取两个样本标题各自包含的至少一个分词的样本词特征,并基于每个分词的样本词特征,确定两个样本标题之间的至少一个样本相关度;
33、基于获得的各样本相关度和预设数量,确定标准值域的至少一个基准值,其中,基准值是在标准值域下的合格分值,标准值域中小于基准值的数值为不合格值,大于等于基准值的数值为合格值,标准值域为各样本标题对对应的样本相关度的统一值域;
34、基于至少一个基准值和至少一个目标相关度,确定更新后的至少一个目标相关度。
35、第三方面,本技术实施例还提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一种标题质量评估方法的步骤。
36、第四方面,本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种标题质量评估方法的步骤。
37、第五方面,本技术实施例还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行上述任意一种标题质量评估方法的步骤。
38、本技术有益效果如下:
39、本技术实施例中,服务器获取多媒体信息的待评估标题以及与待评估标题关联的各参考标题。针对各参考标题中每个参考标题,分别执行以下操作:基于参考标题包含的至少一个分词的词特征,确定相应分词的吸引权重。分别基于待评估标题包含的至少一个分词和各参考标题包含的至少一个分词的词特征,结合各参考标题包含的至少一个分词的吸引权重,确定各参考标题各自与待评估标题之间的至少一个相关度。从获得的各相关度中,选择出符合预设评估条件的至少一个目标相关度,作为待评估标题的质量评估结果。其中,每个参考标题为:基于多媒体信息的信息内容和历史浏览数据,生成的符合质量条件的标题,这样,由于各参考标题为符合质量条件的标题,因此,待评估标题与各参考标题之间的相关度越高,待评估标题的质量越高,能够避免人工评估的错误和效率低。另外,确定待评估标题与各参考标题之间的相关度时,结合了吸引权重,能够在不改变相关度度量方式的前提下,快速兼容吸引性度量,综合考虑待评估标题的相关性和吸引性,确定质量评估结果,具有与人类评价更高的一致性,提高了标题质量评估的准确度和评估效率。
40、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
1.一种标题质量评估方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述基于所述参考标题包含的至少一个分词的词特征,获得每个所述分词的吸引评估值,并基于每个所述分词的吸引评估值,分别确定相应分词的吸引权重,包括:
3.如权利要求2所述的方法,其特征在于,所述基于所述参考标题包含的至少一个分词的词特征,结合所述参考标题的标题特征和历史浏览数据,获得每个所述分词的吸引评估值,包括:
4.如权利要求1-3任一项所述的方法,其特征在于,所述分别基于所述待评估标题包含的至少一个分词和所述各参考标题包含的至少一个分词的词特征,结合所述各参考标题包含的至少一个分词的吸引权重,确定所述各参考标题中每个参考标题与所述待评估标题之间的相关度,包括:
5.如权利要求4所述的方法,其特征在于,所述基于所述参考标题包含的至少一个分词各自与所述待评估标题包含的至少一个分词之间的词相似度,结合所述参考标题包含的至少一个分词的吸引权重,确定所述参考标题与所述待评估标题之间的至少一个相关度,包括以下方式中任意一种或任意组合:
6.如权利要求1-3任一项所述的方法,其特征在于,所述从获得的各相关度中,确定符合预设评估条件的至少一个目标相关度,作为所述待评估标题的质量评估结果之后,还包括:
7.如权利要求6所述的方法,其特征在于,所述基于所述各样本标题对中包含的两个样本标题之间的至少一个样本相关度,对所述至少一个目标相关度进行值域更新,包括:
8.一种标题质量评估装置,其特征在于,包括:
9.一种计算设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,其包括程序代码,当所述程序代码在计算设备上运行时,所述程序代码用于使所述计算设备执行权利要求1~7中任一项所述方法的步骤。
11.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述方法的步骤。
