1.本发明涉及人工智能技术领域,具体涉及一种回复语句确定方法、装置、电子设备和存储介质。
背景技术:
2.随着智能化时代的到来,智能对话系统被广泛的运用于客服领域中,代替传统的人工坐席与用户进行简单沟通,例如:场景导航、服务导航、简单资讯等,以减少企业的人力成本。在现有的智能对话系统中,只有在智能对话系统获取了用户精确意图后,才会开启用户意图对应的业务流程。例如:智能对话系统通过用户的语音信息识别出用户当前的意图为“汽车刮痕补漆理赔咨询”,则智能对话系统根据该意愿匹配出对应的流程图和对话库,并根据用户当前输入语音的意图,生成回复语句,开始进行对话服务,帮助顾客解决问题。因此,传统的智能对话系统十分依赖与对用户意图的精准识别,当无法十分精准的识别用户意图时,智能对话系统就会陷入无法回答的处境,只能向用户输出拒识,请求其再次说明,或者直接挂机,导致用户体验差。
3.因此,传统的解决方案是先累积大量的对话样本,对智能对话系统的模型进行训练,使其对用户输入的语音的意图识别的精度提升。显而易见,在这种方式下,样本的数量越多,得到的模型的精度就越大。
4.总而言之,传统的方法中需要大量的时间去累积原始数据。但是,对于新的领域而言,一方面由于业务是新开辟的,并没有大量的样本积累,另一方面又需要立即使用智能对话系统应对大量用户的咨询,没有时间去做样本的收集。因此,传统的方法无法适用于新建领域中智能对话系统的建立,目前亟需一种可以在低样本甚至于零样本的情况下直接使用且同时进行样本积累的智能对话方案。
技术实现要素:
5.为了解决现有技术中存在的上述问题,本技术实施方式提供了一种回复语句确定方法、装置、电子设备和存储介质,可以在低样本甚至于零样本的情况下直接使用,且同时进行样本积累。
6.第一方面,本技术的实施方式提供了一种回复语句确定方法包括:
7.获取用户当前时刻的语音信息,并对语音信息进行分析,得到文字文本;
8.对文字文本进行特征提取,得到特征x;
9.获取特征库中样本的样本数量;
10.当样本数量小于或等于第一阈值时,将语音信息发送至人工坐席,并接收人工坐席对语音信息的意图分析结果,得到意图a;
11.根据意图a向用户进行二次确认处理;
12.当二次确认处理通过时,将意图a和特征x进行组合,将组合结果作为样本存入特征库,并根据意图a生成回复语句,以回复用户;
13.当二次确认处理不通过时,生成拒识信息,并将拒识信息发送至用户。
14.第二方面,本技术的实施方式提供了一种回复语句确定装置,包括:
15.分析模块,用于获取用户当前时刻的语音信息,并对语音信息进行分析,得到文字文本;
16.提取模块,用于对文字文本进行特征提取,得到特征x;
17.处理模块,用于获取文字文本的意图,得到意图a;根据意图a向用户进行二次确认处理;当二次确认处理通过时,根据意图a生成回复语句,对用户进行回复。
18.第三方面,本技术实施方式提供一种电子设备,包括:处理器,处理器与存储器相连,存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行如第一方面的方法。
19.第四方面,本技术实施方式提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行如第一方面的方法。
20.第五方面,本技术实施方式提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机可操作来使计算机执行如第一方面的方法。
21.实施本技术实施方式,具有如下有益效果:
22.可以看出,在本技术实施方式中,在特征库中缺乏样本支撑时,通过人工坐席对用户的意图进行识别以保证在低样本或零样本的情况下意图识别的精准性。同时,根据人工坐席识别出的意图向客户进行二次确认,进一步提升意图的正确性,并将该意图与自身提取出的用户语音的特征进行组合,作为一个样本进行存储。由此,在低样本或零样本的情况下,可以确保智能对话系统的正确运行,不会因为意图识别的精准度不够反复的输出拒识或挂机,提升了用户的体验。同时,通过二次确认的方式使意图的正确性得到保证,并在服务过程中完成了对正确样本的累积,进一步提升了后续训练的准确性和效率。
附图说明
23.为了更清楚地说明本技术实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1为本技术实施方式提供的一种回复语句确定方法的流程示意图;
25.图2为本技术实施方式提供的一种通过对用户当前时刻语音信息,得到文字文本的方法的流程示意图;
26.图3为本技术实施方式提供的一种通过对文字文本进行特征提取,得到特征x的方法的流程示意图;
27.图4为本技术实施方式提供的一种计算相似度的方法的流程示意图;
28.图5为本技术实施方式提供的一种让用户对意图a进行二次确认处理的方法的流程示意图;
29.图6为本技术实施方式提供的一种回复语句确定装置的硬件结构示意图;
30.图7为本技术实施方式提供的一种回复语句确定装置的功能模块组成框图;
31.图8为本技术实施方式提供的一种电子设备的结构示意图。
具体实施方式
32.下面将结合本技术实施方式中的附图,对本技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本技术一部分实施方式,而不是全部的实施方式。基于本技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本技术保护的范围。
33.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
34.在本文中提及“实施方式”意味着,结合实施方式描述的特定特征、结果或特性可以包含在本技术的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式,也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是,本文所描述的实施方式可以与其它实施方式相结合。
35.首先,需要说明的是,本技术所提供的回复语句确定方法可以适用于远程智能语音客服对话、线下智能机器人场景导航、智能业务办理机业务引导等场景。在本实施方式中,将以远程智能语音客服对话场景为例,对本技术所提供的回复语句确定方法进行说明,其他场景下的回复语句确定方法与远程智能语音客服对话场景下的回复语句确定方法相似,在此不再赘述。
36.其次,需要说明的是,本技术所公开的实施方式可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
37.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
38.参阅图1,图1为本技术实施方式提供的一种回复语句确定方法的流程示意图。该回复语句确定方法包括以下步骤:
39.101:获取用户当前时刻的语音信息,并对语音信息进行分析,得到文字文本。
40.具体而言,在用户通过通讯设备与智能客服机器人建立通讯后,智能客服机器人可以接收到用户通过通讯设备输入的语音信息,继而对语音信息进行分析,得到文字文本。在可选的实施方式中,例如在线下智能机器人场景导航场景中,智能机器人可以通过自身安装的麦克风等语音采集装置对用户的语音信息进行采集。换而言之,本领域中可以对语音进行实时采集的方法均可以运用与本实施方式,即,本实施方式并不限定对语音进行实时采集的方法。
41.同时,在本实施方式中,提供了一种通过对用户当前时刻语音信息进行分析,得到
文字文本的方法,如图2所示,该方法包括:
42.201:对语音信息进行音频提取,得到拼音文本。
43.在本实施方式中,可以对用户当前时刻语音信息进行音频提取,得到对应的音频特征,继而对该音频特征进一步的分析拆解,得到相应的拼音文本。示例性的,用户当前时刻的语音信息为“我想要办理汽车刮痕补漆理赔”,通过对此语音信息进行音频提取后,可以得到拼音文本:“woxiangyaobanliqicheguahenbuqilipei”。
44.202:对拼音文本进行分割,得到至少一个子拼音。
45.在本实施方式中,至少一个子拼音中的每个子拼音用于标识发音中的一个音节。沿用上述“我想要办理汽车刮痕补漆理赔”的示例,在得到拼音文本“woxiangyaobanliqicheguahenbuqilipei”后,可以对拼音文本按照拼音组成规律进行分割,得到至少一个子拼音。具体而言,首先识别出拼音文本中的声母和韵母,进而将拼音文本拆分成单个的声母和韵母,再根据拼音组成规律进行组合,将声母和韵母组合得到至少一个子拼音。在进行拼音文本拆分时,首先识别第一个声母和第一个韵母。为了确保第一个韵母识别成功,对第一个韵母最后一个拼音字母以及下一个拼音字母进行识别,若均为声母,则第一个字母为前一个韵母的一部分。例如,“hanghang”识别声母和韵母可能为[h,ang,h,ang]或者[h,an,g,h,an,g],对[h,an,g,h,an,g]中的第三和第四个拼音字母识别,发现均为声母,且第三个拼音字母[g]后没有韵母,因此,此种拆分方法有误,应选择第一种方式。由此,对于拼音文本“woxiangyaobanliqicheguahenbuqilipei”而言,在进行声母和韵母识别处理后,可以得到字符串:[w,o,x,i,ang,y,ao,b,an,l,i,q,i,ch,e,g,u,a,h,en,b,u,q,i,l,i,p,ei]。再根据拼音组成规律对字符串进行识别组合,从第一个字符开始,向后识别。当识别到第二个声母时,将前面几个字符组合成一个子拼音。接着进行后续识别,直至识别至最后一个字符。对示例中的字符串进行声母和韵母的拆分、组合后,可以得到至少一个子拼音为[wo,xiang,yao,ban,li,qi,che,gua,hen,bu,qi,li,pei]。
[0046]
203:获取用户当前时刻的语音信息的应用场景。
[0047]
在本实施方式中,可以获取用户与智能客服机器人通话时所拨打的客服号码,与预设的客服号码分类表进行匹配,得到该客服号码所对应的应用场景。示例性的,可以预设将客服号码表中不同的客服号码与不同的应用场景相对应,例如:客服号码“10087”对应“保养”应用场景;客服号码“10089”对应“保险”应用场景。基于此,沿用上述“我想要办理汽车刮痕补漆理赔”的示例,得到用户当前拨打的客服号码为“10089”时,将该客服号码与预设的电话号码分类表进行匹配,确定该客服号码所对应的应用场景为“保险”场景。
[0048]
204:根据用户当前时刻的语音信息的应用场景,确定与应用场景相对应的预设的词库。
[0049]
在本实施方式中,通过应用场景对词库进行筛选,可以减少候选词的数量,提升文字文本的确认效率。且候选词的语义与语音信息的应用场景相符合,可以提升后续生成的文字文本的准确性。
[0050]
205:根据每个子拼音在预设的词库中进行匹配,得到与至少一个子拼音一一对应的至少一组第一词语。
[0051]
在本实施方式中,将子拼音与筛选出来的预设词库中的词语的拼音进行比对。识别子拼音的语义,与预设词库中的词语的语义进行匹配,选取匹配度最大的词语作为子拼
音对应的第一词语。示例性的,子拼音为[wo,xiang,yao,ban,li,qi,che,gua,hen,bu,qi,li,pei],选择其中的“li”来详细解释。具体而言,预设的词库中,对于子拼音“li”对应的一组第一词语可以是:“理”、“利”或“里”。
[0052]
206:根据每个子拼音相邻的子拼音,在每个子拼音对应的第一词组中确定目标词,得到与至少一个子拼音一一对应的至少一个目标词。
[0053]
在本实施方式中,可以根据每个子拼音左相邻和/或右相邻的两个词语,进行组合,得到词组。根据词组的语义与用户当前时刻语音信息的应用场景进行匹配,在至少一组第一词语中筛选出最符合应用场景的目标词。示例性的,在预设的词库中,对于子拼音“li”对应的一组第一词语包括:“理”、“利”或“里”,其右相邻的子拼音“pei”对应的一组第一词语包括:“赔”、“配”或“陪”。因此,经过组合,可以得到词组:“理赔”、“理配”、“理陪”、“利赔”、“利配”、“利陪”、“里赔”、“里配”和“里陪”。继而将得到的词组与应用场景“保险”进行匹配,得到词组“理赔”与该应用场景的匹配度最高,因此,将第一词语“理”作为子拼音“li”对应的目标词。
[0054]
207:将至少一个目标词按照至少一个子拼音在拼音文本中的排列顺序进行排列,得到文字文本。
[0055]
在本实施方式中,在通过步骤206中的筛选得到每个子拼音对应的目标词之后,可以将这些目标词按照各自对应的子拼音在拼音文本中的顺序进行排列,进而得到文字文本。具体而言,沿用上述“我想要办理汽车刮痕补漆理赔”的示例。经过前面系列操作,分别得到子拼音[wo,xiang,yao,ban,li,qi,che,gua,hen,bu,qi,li,pei]对应的目标词为:“我”、“想”、“要”、“办”、“理”、“汽”、“车”、“刮”、“痕”、“补”、“漆”、“理”、“赔”。由此,根据子拼音[wo,xiang,yao,ban,li,qi,che,gua,hen,bu,qi,li,pei]在拼音文本“woxiangyaobanliqicheguahenbuqilipei”中的顺序对目标词“我”、“想”、“要”、“办”、“理”、“汽”、“车”、“刮”、“痕”、“补”、“漆”、“理”、“赔”进行排列,即可得到文字文本“我想要办理汽车刮痕补漆理赔”。
[0056]
102:对文字文本进行特征提取,得到特征x。
[0057]
在本实施方式中,提供了一种通过对文字文本进行特征提取,得到特征x的方法,如图3所示,该方法包括:
[0058]
301:对文字文本进行拆词处理,得到至少一个关键词。
[0059]
在本实施方式中,可以通过对文字文本中的分割字符进行识别,继而将识别出的分割字符替换为空格,得到至少一个候选字段。具体而言,该分割字符可以预先进行设置,包括但不限于:动词性词语、名词性词语、标点符号、特殊符号等。然后,通过将至少一个候选字段中的每个候选字段分别与通用分词词典进行正向最大匹配,将通用分词词典成功匹配的词语作为每个候选字段对应的候选词。最后,对得到的若干个候选词进行筛选,得到至少一个关键词。
[0060]
示例性的,可以通过比对候选词的语义对若干个候选词进行筛选,具体而言:对于文字文本“我想要办理汽车刮痕补漆理赔”进行分割,根据动词性词语和名词性词语的分隔符可得到,“我想要办理汽车刮痕补漆理赔”。对比候选词语义,且结合用户当前处于的应用场景可知,关键词为“汽车”、“刮痕”、“补漆”、“理赔”。
[0061]
302:计算至少一个关键词中任意两个不同的关键词之间的关联度,得到至少一个
关联度。
[0062]
在本实施方式中,首先,对至少一个关键词中的任意相邻的两个关键词进行组合,得到第二词组合。将第二词组合和应用场景进行匹配,对两者的匹配度进行打分,当评分大于第五阈值时,确定两个关键词相关联,并将评分作为关联度。沿用关键词为“汽车”、“刮痕”、“补漆”、“理赔”的示例,对“汽车”和“刮痕”进行组合,得到第二词组合“汽车刮痕”,与应用场景“保险”进行匹配,得到评分95,大于第五阈值,确定两个词语关联且关联度为95。
[0063]
303:根据至少一个关联度和至少一个关键词,构建关键词图谱。
[0064]
在本实施方式中,首先,以关键词为顶点,建立全连接图;根据全连接图与关联度,将全连接图中关联度低于第四阈值的连线删除,生成与关键词对应的关键词图谱。
[0065]
304:根据关键词图谱对至少一个关键词中的每个关键词进行图嵌入处理,得到至少一个第一图向量,至少一个第一图向量和至少一个关键词一一对应。
[0066]
在本实施方式中,首先,将关键词确定为图节点。再根据所图节点构建同构图。最后,调用深度游走模型对共现关系结构图进行图嵌入处理,输出关键词对应的第一图向量。
[0067]
305:对每个关键词进行词嵌入处理,得到和至少一个关键词一一对应的至少一个第一词向量。
[0068]
306:对于至少一个图向量中的每个图像量,计算每个图像量和每个图像量对应的词向量的平均向量,得到至少一个第一向量,其中,至少一个第一向量和至少一个关键词一一对应。
[0069]
在本实施方式中,对至少一个关键词对应的至少一个第一图向量和至少一个词向量进行相加,再求平均值,计算得到平均向量,得到至少一个关键词对应的至少一个第一向量。示例性的,如上例,关键词“汽车”的词向量为(1,2)和图向量为(5,6),求和后向量为(6,8),计算平均向量为(3,4)作为关键词“汽车”的第一向量。
[0070]
307:对至少一个第一向量按照至少一个关键词在文字文本中的顺序进行拼接,得到特征x。
[0071]
在本实施方式中,沿用上述“我想要办理汽车刮痕补漆理赔”的示例,关键词“汽车”对应第一向量a,关键词“刮痕”对应第一向量b,关键词“补漆”对应第一向量c,关键词“理赔”对应第一向量d,按照原文本“汽车刮痕补漆理赔”的顺序排列,即“汽车”、“刮痕”、“补漆”、“理赔”。将第一向量从上往下进行纵向拼接,得到向量p作为文本“汽车刮痕补漆理赔”的特征x。具体而言,向量p可以通过公式
①
表示:
[0072][0073]
103:获取特征库中样本的样本数量。
[0074]
104:当样本数量小于或等于第一阈值时,将语音信息发送至人工坐席,并接收人工坐席对语音信息的意图分析结果,得到意图a。
[0075]
在本实施方式中,当样本数量小于或等于第一阈值时,说明此时数据库中还没有足够数量的样本支撑智能客服机器人对用户的语音信息进行精准识别。因此,可以将用户
当前时刻的语音信息发送至人工坐席,通过人工坐席的识别来确定用户的语音信息对应的意图a。
[0076]
同时,在本实施方式中,当样本数量大于第一阈值时,说明在数据库中已经有了一定的样本数据作为支撑,该数量的样本虽然不足以支持训练出精度足够大的意图识别模型,但是每个意图对应的样本特征的数量已经足够支持进行特征比对。基于此,在对用户语音信息进行意图识别时,可以将特征x与特征库中n个样本中的每个样本进行相似度计算处理,得到和n个样本一一对应n个相似度,n为大于或等于1的整数。然后将n个相似度中最大的相似度确定为目标相似度,当该目标相似度大于第二阈值时,将该目标相似度对应的意图b作为用户当前时刻的语音信息的意图a。
[0077]
示例性的,在特征库中样本数量达到一定数量m(第一阈值)时,在对用户当前时刻的语音信息进行提取特征后,可以将提取的特征分别与特征库中采集到的特征进行相似度计算,得到出相似度s。具体而言,特征库中包括j个意图,每个意图对应有500条样本,经过相似度计算处理,可以得到j
×
500个相似度。此时,可以从该j
×
500个相似度中找出最大的相似度s
max
,并将该最大的相似度s
max
与预设的第二阈值进行比较。当s
max
大于第二阈值时,就将最大的相似度s
max
对应的样本所属的意图作为用户当前时刻的语音信息的意图。
[0078]
基于此,在本实施方式中,提供了一种计算相似度的方法,如图4所示,该方法包括:
[0079]
401:计算特征x与每个样本对应的特征向量的积,得到向量积f。
[0080]
402:计算特征x的模与每个样本对应的特征向量的模的积,得到特征x的模与每个样本对应的特征向量的长度积e。
[0081]
403:计算特征x的模与每个样本对应的特征向量的长度积e和常数c的和,得到长度和g。
[0082]
在本实施方式中,常数c可以为大于或等于1的整数,常数c可以用于避免特征x的向量的模与样本特征的向量的模的长度积为0,导致公式无效。
[0083]
404:获取向量积f和长度和g的比值,将比值作为特征x与每个样本之间的相似度。
[0084]
具体而言,相似度可以通过公式
②
进行表示:
[0085][0086]
其中,s为相似度,a为特征x,b为每个样本对应的特征向量,丨a丨为特征x的向量的模,丨b丨为每个样本对应的特征向量的模,c为自定义参数,可以是大于或等于1的整数,在本实施方式中,可以等于1。
[0087]
进一步的,特征x的向量的模丨a丨可以通过公式
③
进行表示:
[0088][0089]
其中,丨a丨为特征x的向量的模,v
1-vd为特征x的向量中的一个元素;进一步的,每个样本对应的特征向量的模丨b丨可以通过公式
④
进行表示:
[0090][0091]
其中,丨b丨为每个样本对应的特征向量的模,x
1-xd为每个样本对应的特征向量中
的一个元素;
[0092]
在本实施方式中,当样本数量大于第三阈值时,说明特征库中累积的样本数量已经足够支撑模型的训练,得到精准的意图识别模型。因此,在此阶段可以将样本库中的累积的样本输入初始模型进行训练,得到分类模型,再将特征x输入分类模型,得到意图a。其中,第三阈值大于第一阈值。
[0093]
具体而言,在本实施方式中,初始模型可以采用自然语言理解(natural language understanding,nlu)模型。nlu模型本质上是一个特征提取网络加一个分类器,先通过特征提取网络提取特征,然后将特征输入到分类器进行分类,输出的标签就是各个精确意图的打分值,选取打分最高的并且大于预设阈值t的结果作为最终的结果,如果小于阈值则输出拒识(无法识别意图)。假设总共有n个业务场景,对应有n个意图(a1,a2,a3,
…
,ae),前期采用这样的方式在实际中采集数据,当每个意图采集到的特征x达到一定数量m时,如每个意图各采集到500条以上时,就得到了一个特征库(每个意图取m条特征构成的特征库)。
[0094]
在本实施方式中,在数据量采集到一定程度后,即样本数量大于第三阈值时,可以进行常规的nlu模型训练。通过nlu模型输出用户意图,并且额外输出提取到的特征x。如果识别出拒识,则将用户说的话推送给坐席人员,让坐席人工判断给出意图a,并将数据入库,得到一个bad case的特征库。在本实施方式中,任意数量即可启用nlu模型,(大于m时则随机选取m条),可以缓解下次nlu模型训练上线这段期间的人工坐席压力。
[0095]
105:确定根据意图a向用户进行的二次确认处理是否通过,当二次确认处理通过时,跳转至步骤106,当二次确认处理没有通过时,跳转至步骤107。
[0096]
本实施方式中,进行二次确认用于在进行后续服务之前向用户确认识别出的意图a是否精准,以确保识别精确度。在本实施方式中,提供了一种让用户对意图a进行二次确认处理的方法,如图5所示,该方法包括:
[0097]
501:根据意图a生成确认语句。
[0098]
在本实施方式中,示例性的,可以将意图a为“汽车刮痕补漆理赔”,转化为类似于疑问句“您的要求是否为汽车刮痕补漆理赔?”,作为确认语句,以向用户确认识别出的意图a是否正确。
[0099]
502:向用户发送确认语句,并接收用户的反馈信息。
[0100]
在本实施方式中,向用户发送确认语句,并通过语音接收用户反馈的信息,对用户反馈的语音进行接收,识别用户所反馈的意图。除此之外,在线下的场景中,还可以通过显示设备向用户展示“是”和“否”两种选择,由用户自行确认。
[0101]
503:当反馈信息为是时,判定二次确认处理通过。
[0102]
504:当反馈信息为否时,判定二次确认处理不通过。
[0103]
106:将意图a和特征x进行组合,将组合结果作为样本存入特征库,并根据意图a生成回复语句,以回复用户。
[0104]
在本实施方式中,通过将用户二次确认得到精准意图a与提取得到的特征x进行组合,获得一条准确的样本对特征库进行样本填充,继而实现在工作的同时,累积样本库中的样本。且由于二次确认的关系,所得的样本基本上是意图正确的正向样本。示例性的,将精准意图a与对应的特征x以(a,x)的形式相组合,作为一条样本存入特征库中。
[0105]
107:生成拒识信息,并将拒识信息发送至用户。
[0106]
综上所述,本技术所提供的一种回复语句确定的方法,在特征库中,当样本的数量小于或等于第一阈值时,特征库缺乏样本支撑,使用人工坐席与特征提取网络共同作用的方式来实现向用户输出识别出来的意图。并让客户对识别出的意图进行二次确认,获得用户反馈后,进行后续服务。在用户反馈为确认时,将用户语音信息以及对应的意图一同放入特征库,实现数据积累。在特征库中,当样本的数量大于第一阈值且小于或等于第三阈值时,特征库有一定的样本基础,依旧使用特征提取网络识别用户语音信息的意图。在此阶段,基于特征库有一定的样本基础,将特征提取网络识别用户语音信息的意图与已有的样本特征进行相似度计算,得出最大相似度对应的意图。同时,也需要进行二次确认,获得用户反馈后进行后续服务。在用户反馈为确认时,将用户语音信息以及对应的意图一同放入特征库,实现数据再积累。在特征库中,当样本的数量大于第三阈值时,特征库中的样本数量足够,则进行常规的意图识别,输出意图和相应的特征。并进行二次确认,获得用户反馈后进行后续服务。在用户反馈为确认时,将用户语音信息以及对应的意图一同放入特征库,实现数据积累。经过这一系列的过程,实现了一个智能客服机器人从无到有的训练过程。不仅减缓了人工坐席的压力,同时也很好的解决了前期冷启动的问题,增强了智能客服机器人系统的可靠性,降低了企业的成本,提高了进线客户的体验。
[0107]
参阅图6,图6为本技术实施方式提供的一种回复语句确定装置的硬件结构示意图。该回复语句确定装置600包括至少一个处理器601,通信线路602,存储器603以及至少一个通信接口604。
[0108]
在本实施方式中,处理器601,可以是一个通用中央处理器(central processing unit,cpu),微处理器,特定应用集成电路(application-specific integrated circuit,asic),或一个或多个用于控制本技术方案程序执行的集成电路。
[0109]
通信线路602,可以包括一通路,在上述组件之间传送信息。
[0110]
通信接口604,可以是任何收发器一类的装置(如天线等),用于与其他设备或通信网络通信,例如以太网,ran,无线局域网(wireless local area networks,wlan)等。
[0111]
存储器603,可以是只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
[0112]
在本实施方式中,存储器603可以独立存在,通过通信线路602与处理器601相连接。存储器603也可以和处理器601集成在一起。本技术实施方式提供的存储器603通常可以具有非易失性。其中,存储器603用于存储执行本技术方案的计算机执行指令,并由处理器601来控制执行。处理器601用于执行存储器603中存储的计算机执行指令,从而实现本技术下述实施方式中提供的方法。
[0113]
在可选的实施方式中,计算机执行指令也可以称之为应用程序代码,本技术对此不作具体限定。
[0114]
在可选的实施方式中,处理器601可以包括一个或多个cpu,例如图6中的cpu0和cpu1。
[0115]
在可选的实施方式中,该回复语句确定装置600可以包括多个处理器,例如图6中的处理器601和处理器607。这些处理器中的每一个可以是一个单核(single-cpu)处理器,也可以是一个多核(multi-cpu)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
[0116]
在可选的实施方式中,若一种回复语句确定装置600为服务器,例如,可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。则回复语句确定装置600还可以包括输出设备605和输入设备606。输出设备605和处理器601通信,可以以多种方式来显示信息。例如,输出设备605可以是液晶显示器(liquid crystal display,lcd),发光二级管(light emitting diode,led)显示设备,阴极射线管(cathode ray tube,crt)显示设备,或投影仪(projector)等。输入设备606和处理器601通信,可以以多种方式接收用户的输入。例如,输入设备606可以是鼠标、键盘、触摸屏设备或传感设备等。
[0117]
上述的一种回复语句确定装置600可以是一个通用设备或者是一个专用设备。本技术实施方式不限定一种回复语句确定装置600的类型。
[0118]
参阅图7,图7为本技术实施方式提供的一种回复语句确定装置的功能模块组成框图。如图7所示,该回复语句确定装置包括:
[0119]
分析模块701,用于获取用户当前时刻的语音信息,并对语音信息进行分析,得到文字文本;
[0120]
提取模块702,用于对文字文本进行特征提取,得到特征x;
[0121]
处理模块703,用于获取特征库中样本的样本数量,在样本数量小于或等于第一阈值时,将语音信息发送至人工坐席,并接收人工坐席对语音信息的意图分析结果,得到意图a,并根据意图a向用户进行二次确认处理,在二次确认处理通过时,根据意图a生成回复语句,对用户进行回复。
[0122]
在本发明的实施方式中,在对根据意图a向用户进行二次确认处理方面,处理模块703,具体用于:
[0123]
根据意图a生成确认语句;
[0124]
向用户发送确认语句,并接收用户的反馈信息;
[0125]
当反馈信息为是时,判定二次确认处理通过;
[0126]
当反馈信息为否时,判定二次确认处理不通过。
[0127]
在本发明的实施方式中,在对用户当前时刻的语音信息进行分析,得到文字文本方面,分析模块701,具体用于:
[0128]
对语音信息进行音频提取,得到拼音文本;
[0129]
对拼音文本进行分割,得到至少一个子拼音,其中,至少一个子拼音中的每个子拼音用于标识发音中的一个音节;
[0130]
获取用户当前时刻的语音信息的应用场景;
[0131]
根据用户当前时刻的语音信息的应用场景,确定与应用场景相对应的预设的词
库;
[0132]
根据每个子拼音在预设的词库中进行匹配,得到至少一组第一词语,其中至少一组第一词语与至少一个子拼音一一对应;
[0133]
根据每个子拼音相邻的子拼音,在每个子拼音对应的第一词组中确定目标词,得到至少一个目标词,其中,至少一个目标词与至少一个子拼音一一对应;
[0134]
将至少一个目标词按照至少一个子拼音在拼音文本中的排列顺序进行排列,得到文字文本。
[0135]
在本发明的实施方式中,在对文字文本进行特征提取,得到特征x方面,提取模块702,具体用于:
[0136]
对文字文本进行拆词处理,得到至少一个关键词;
[0137]
计算至少一个关键词中任意两个不同的关键词之间的关联度,得到至少一个关联度;
[0138]
根据至少一个关联度和至少一个关键词,构建关键词图谱;
[0139]
根据关键词图谱对至少一个关键词中的每个关键词进行图嵌入处理,得到至少一个第一图向量,至少一个第一图向量和至少一个关键词一一对应;
[0140]
对每个关键词进行词嵌入处理,得到至少一个第一词向量,其中,至少一个第一词向量和至少一个关键词一一对应;
[0141]
对于至少一个图向量中的每个图像量,计算每个图像量和每个图像量对应的词向量的平均向量,得到至少一个第一向量,其中,至少一个第一向量和至少一个关键词一一对应;
[0142]
至少一个第一向量按照至少一个关键词在文字文本中的顺序进行拼接,得到特征x。
[0143]
在本发明的实施方式中,当样本数量大于第一阈值时,处理模块703,具体用于:
[0144]
将特征x与特征库中n个样本中的每个样本进行相似度计算处理,得到n个相似度,其中,n个相似度和n个样本一一对应,n为大于或等于1的整数;
[0145]
在n个相似度中确定目标相似度,其中,目标相似度为n个相似度中最大的相似度;
[0146]
当目标相似度大于第二阈值时,获取目标相似度对应的意图b,并将意图b作为意图a。
[0147]
在本发明的实施方式中,在计算相似度方面,处理模块703,具体用于:
[0148]
计算特征x与每个样本对应的特征向量的积,得到向量积f;
[0149]
计算特征x的模与每个样本对应的特征向量的模的积,得到特征x的模与每个样本对应的特征向量的长度积e;
[0150]
计算特征x的模与每个样本对应的特征向量的长度积e和常数c的和,得到长度和g,其中,常数c为大于或等于1的整数;
[0151]
获取向量积f和长度和g的比值,将比值作为特征x与每个样本之间的相似度。
[0152]
具体而言,特征x与每个样本对应的特征向量之间相似度可以通过公式
⑤
进行表示:
[0153]
[0154]
其中,s为相似度,a为特征x,b为每个样本对应的特征向量,丨a丨为特征x的向量的模,丨b丨为每个样本对应的特征向量的模,c为自定义参数,可以是大于或等于1的整数,在本实施方式中,可以等于1。
[0155]
在本发明的实施方式中,当样本数量大于第三阈值时,处理模块703,具体用于:
[0156]
将样本库中的样本输入初始模型进行训练,得到分类模型,其中,第三阈值大于第一阈值;
[0157]
将特征x输入分类模型,得到所意图a。
[0158]
参阅图8,图8为本技术实施方式提供的一种电子设备的结构示意图。如图8所示,电子设备800包括收发器801、处理器802和存储器803。它们之间通过总线804连接。存储器803用于存储计算机程序和数据,并可以将存储器803存储的数据传输给处理器802。
[0159]
处理器802用于读取存储器803中的计算机程序执行以下操作:
[0160]
获取用户当前时刻的语音信息,并对语音信息进行分析,得到文字文本;
[0161]
对文字文本进行特征提取,得到特征x;
[0162]
获取特征库中样本的样本数量;
[0163]
当样本数量小于或等于第一阈值时,将语音信息发送至人工坐席,并接收人工坐席对语音信息的意图分析结果,得到意图a;
[0164]
根据意图a向用户进行二次确认处理;
[0165]
当二次确认处理通过时,将意图a和特征x进行组合,将组合结果作为样本存入特征库,并根据意图a生成回复语句,以回复用户;
[0166]
当二次确认处理不通过时,生成拒识信息,并将拒识信息发送至用户。
[0167]
在本发明的实施方式中,在对根据意图a向用户进行二次确认处理方面,处理器802,具体用于执行以下操作:
[0168]
根据意图a生成确认语句;
[0169]
向用户发送确认语句,并接收用户的反馈信息;
[0170]
当反馈信息为是时,判定二次确认处理通过;
[0171]
当反馈信息为否时,判定二次确认处理不通过。
[0172]
在本发明的实施方式中,在对用户当前时刻的语音信息进行分析,得到文字文本方面,处理器802,具体用于执行以下操作:
[0173]
对语音信息进行音频提取,得到拼音文本;
[0174]
对拼音文本进行分割,得到至少一个子拼音,其中,至少一个子拼音中的每个子拼音用于标识发音中的一个音节;
[0175]
获取用户当前时刻的语音信息的应用场景;
[0176]
根据用户当前时刻的语音信息的应用场景,确定与应用场景相对应的预设的词库;
[0177]
根据每个子拼音在预设的词库中进行匹配,得到至少一组第一词语,其中至少一组第一词语与至少一个子拼音一一对应;
[0178]
根据每个子拼音相邻的子拼音,在每个子拼音对应的第一词组中确定目标词,得到至少一个目标词,其中,至少一个目标词与至少一个子拼音一一对应;
[0179]
将至少一个目标词按照至少一个子拼音在拼音文本中的排列顺序进行排列,得到
文字文本。
[0180]
在本发明的实施方式中,在对文字文本进行特征提取,得到特征x方面,处理器802,具体用于执行以下操作:
[0181]
对文字文本进行拆词处理,得到至少一个关键词;
[0182]
计算至少一个关键词中任意两个不同的关键词之间的关联度,得到至少一个关联度;
[0183]
根据至少一个关联度和至少一个关键词,构建关键词图谱;
[0184]
根据关键词图谱对至少一个关键词中的每个关键词进行图嵌入处理,得到至少一个第一图向量,至少一个第一图向量和至少一个关键词一一对应;
[0185]
对每个关键词进行词嵌入处理,得到至少一个第一词向量,其中,至少一个第一词向量和至少一个关键词一一对应;
[0186]
对于至少一个图向量中的每个图像量,计算每个图像量和每个图像量对应的词向量的平均向量,得到至少一个第一向量,其中,至少一个第一向量和至少一个关键词一一对应;
[0187]
至少一个第一向量按照至少一个关键词在文字文本中的顺序进行拼接,得到特征x。
[0188]
在本发明的实施方式中,当样本数量大于第一阈值时,处理器802,具体用于执行以下操作:
[0189]
将特征x与特征库中n个样本中的每个样本进行相似度计算处理,得到n个相似度,其中,n个相似度和n个样本一一对应,n为大于或等于1的整数;
[0190]
在n个相似度中确定目标相似度,其中,目标相似度为n个相似度中最大的相似度;
[0191]
当目标相似度大于第二阈值时,获取目标相似度对应的意图b,并将意图b作为意图a。
[0192]
在本发明的实施方式中,在计算相似度方面,处理器802,具体用于执行以下操作:
[0193]
计算特征x与每个样本对应的特征向量的积,得到向量积f;
[0194]
计算特征x的模与每个样本对应的特征向量的模的积,得到特征x的模与每个样本对应的特征向量的长度积e;
[0195]
计算特征x的模与每个样本对应的特征向量的长度积e和常数c的和,得到长度和g,其中,常数c为大于或等于1的整数;
[0196]
获取向量积f和长度和g的比值,将比值作为特征x与每个样本之间的相似度。
[0197]
具体而言,特征x与每个样本对应的特征向量之间相似度可以通过公式
⑥
进行表示:
[0198][0199]
其中,s为相似度,a为特征x,b为每个样本对应的特征向量,丨a丨为特征x的向量的模,丨b丨为每个样本对应的特征向量的模,c为自定义参数,可以是大于或等于1的整数,在本实施方式中,可以等于1。
[0200]
在本发明的实施方式中,当样本数量大于第三阈值时,处理器802,具体用于执行以下操作:
[0201]
将样本库中的样本输入初始模型进行训练,得到分类模型,其中,第三阈值大于第一阈值;
[0202]
将特征x输入分类模型,得到所意图a。
[0203]
应理解,本技术中的回复语句确定装置可以包括智能手机(如android手机、ios手机、windows phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobile internet devices,简称:mid)、机器人或穿戴式设备等。上述回复语句确定装置仅是举例,而非穷举,包含但不限于上述回复语句确定装置。在实际应用中,上述回复语句确定装置还可以包括:智能车载终端、计算机设备等等。
[0204]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分的方法。
[0205]
因此,本技术实施方式还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行以实现如上述方法实施方式中记载的任何一种回复语句确定方法的部分或全部步骤。例如,存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
[0206]
本技术实施方式还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如上述方法实施方式中记载的任何一种回复语句确定方法的部分或全部步骤。
[0207]
需要说明的是,对于前述的各方法实施方式,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施方式均属于可选的实施方式,所涉及的动作和模块并不一定是本技术所必须的。
[0208]
在上述实施方式中,对各个实施方式的描述都各有侧重,某个实施方式中没有详述的部分,可以参见其他实施方式的相关描述。
[0209]
在本技术所提供的几个实施方式中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0210]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0211]
另外,在本技术各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的
单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
[0212]
集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0213]
本领域普通技术人员可以理解上述实施方式的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-only memory,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
[0214]
以上对本技术实施方式进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施方式的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本技术的限制。
技术特征:
1.一种回复语句确定方法,其特征在于,所述方法包括:获取用户当前时刻的语音信息,并对所述语音信息进行分析,得到文字文本;对所述文字文本进行特征提取,得到特征x;获取特征库中样本的样本数量;当所述样本数量小于或等于第一阈值时,将所述语音信息发送至人工坐席,并接收所述人工坐席对所述语音信息的意图分析结果,得到意图a;根据所述意图a向所述用户进行二次确认处理;当所述二次确认处理通过时,将所述意图a和所述特征x进行组合,将组合结果作为样本存入所述特征库,并根据所述意图a生成回复语句,以回复所述用户;当所述二次确认处理不通过时,生成拒识信息,并将所述拒识信息发送至所述用户。2.根据权利要求1所述的方法,其特征在于,所述根据所述意图a向所述用户进行二次确认处理,包括:根据所述意图a生成确认语句;向所述用户发送所述确认语句,并接收所述用户的反馈信息;当所述反馈信息为是时,判定所述二次确认处理通过;当所述反馈信息为否时,判定所述二次确认处理不通过。3.根据权利要求1所述的方法,其特征在于,获取用户当前时刻的语音信息,并对所述语音信息进行分析,得到文字文本,包括:对所述语音信息进行音频提取,得到拼音文本;对所述拼音文本进行分割,得到至少一个子拼音,其中,所述至少一个子拼音中的每个子拼音用于标识发音中的一个音节;获取所述用户当前时刻的语音信息的应用场景;根据所述用户当前时刻的语音信息的应用场景,确定与应用场景相对应的预设的词库;根据所述每个子拼音在预设的词库中进行匹配,得到至少一组第一词语,其中所述至少一组第一词语与所述至少一个子拼音一一对应;根据所述每个子拼音相邻的子拼音,在所述每个子拼音对应的第一词组中确定目标词,得到至少一个目标词,其中,所述至少一个目标词与所述至少一个子拼音一一对应;将所述至少一个目标词按照所述至少一个子拼音在所述拼音文本中的排列顺序进行排列,得到所述文字文本。4.根据权利要求1所述的方法,其特征在于,所述对所述文字文本进行特征提取,得到特征x,包括:对所述文字文本进行拆词处理,得到至少一个关键词;计算所述至少一个关键词中任意两个不同的关键词之间的关联度,得到至少一个关联度;根据所述至少一个关联度和所述至少一个关键词,构建关键词图谱;根据所述关键词图谱对所述至少一个关键词中的每个关键词进行图嵌入处理,得到至少一个第一图向量,至少一个第一图向量和至少一个关键词一一对应;对每个关键词进行词嵌入处理,得到至少一个第一词向量,其中,至少一个第一词向量
和至少一个关键词一一对应;对于所述至少一个图向量中的每个图像量,计算所述每个图像量和所述每个图像量对应的词向量的平均向量,得到至少一个第一向量,其中,所述至少一个第一向量和至少一个关键词一一对应;对所述至少一个第一向量按照所述至少一个关键词在所述文字文本中的顺序进行拼接,得到特征x。5.根据权利要求1所述的方法,其特征在于,当所述样本数量大于所述第一阈值时,所述方法还包括:将所述特征x与所述特征库中n个样本中的每个样本进行相似度计算处理,得到n个相似度,其中,所述n个相似度和所述n个样本一一对应,n为大于或等于1的整数;在所述n个相似度中确定目标相似度,其中,所述目标相似度为所述n个相似度中最大的相似度;当所述目标相似度大于第二阈值时,获取所述目标相似度对应的意图b,并将所述意图b作为所述意图a。6.根据权利要求5所述的方法,其特征在于,所述将所述特征x与所述特征库中n个特征中的每个特征进行相似度计算处理,包括:计算所述特征x与所述每个样本对应的特征向量的积,得到向量积f;计算所述特征x的模与所述每个样本对应的特征向量的模的积,得到所述特征x的模与所述每个样本对应的特征向量的长度积e;计算所述特征x的模与所述每个样本对应的特征向量的长度积e和常数c的和,得到长度和g,其中,所述常数c为大于或等于1的整数;获取所述向量积f和长度和g的比值,将所述比值作为所述特征x与所述每个样本之间的相似度。7.根据权利要求1所述的方法,其特征在于,当所述样本数量大于第三阈值时,所述方法还包括:将所述特征库中的样本输入初始模型进行训练,得到分类模型,其中,所述第三阈值大于所述第一阈值;将所述特征x输入所述分类模型,得到所述意图a。8.一种回复语句确定装置,其特征在于,所述装置包括:分析模块,用于获取用户当前时刻的语音信息,并对所述语音信息进行分析,得到文字文本;提取模块,用于对所述文字文本进行特征提取,得到特征x;处理模块,用于获取特征库中样本的样本数量,在所述样本数量小于或等于第一阈值时,将所述语音信息发送至人工坐席,并接收所述人工坐席对所述语音信息的意图分析结果,得到意图a,并根据所述意图a向所述用户进行二次确认处理,在所述二次确认处理通过时,根据所述意图a生成回复语句,对所述用户进行回复。9.一种电子设备,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述一个或多个程序包括用于执行权利要求1-7任一项方法中的步骤的指令。
10.一种可读计算机存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7任一项所述的方法。
技术总结
本申请涉及人工智能技术领域,具体公开了一种回复语句确定方法、装置、电子设备和存储介质,其特征在于,方法包括:获取用户当前时刻的语音信息,并对语音信息进行分析,得到文字文本;对文字文本进行特征提取,得到特征X;获取特征库中样本的样本数量;当样本数量小于或等于第一阈值时,将语音信息发送至人工坐席,并接收人工坐席对语音信息的意图分析结果,得到意图A;根据意图A向用户进行二次确认处理;当二次确认处理通过时,将意图A和特征X进行组合,将组合结果作为样本存入特征库,并根据意图A生成回复语句,以回复用户;当二次确认处理不通过时,生成拒识信息,并将拒识信息发送至用户。用户。用户。
技术研发人员:黄天来 梁必志 叶怡周
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2022.02.17
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-10113.html