一种智能语音交互识别方法、装置和电子设备与流程

专利查询2023-08-03 79

1.本发明涉及互联网技术领域，具体为一种智能语音交互识别方法、装置和电子设备。

背景技术：

2.随着互联网不断的发展，智能语音交互是基于语音输入的新一代交互模式，你可以通过说话就可以得到反馈结果。典型的应用场景——语音助手，自从iphone4s推出siri后，智能语音交互应用得到飞速发展。
3.但是目前语音交互技术不够成熟，在实际应用中，无法准确的识别用户的意图，同时语音在输入或输出的过程中，容易发生数据丢失情况，没有对此缺陷进行相应的改进。

技术实现要素：

4.针对现有技术的不足，本发明提供了一种智能语音交互识别方法、装置和电子设备，解决了目前语音交互技术不够成熟，在实际应用中，无法准确的识别用户的意图，同时语音在输入或输出的过程中，容易发生数据丢失的问题。
5.为实现以上目的，本发明通过以下技术方案予以实现：一种智能语音交互识别方法、装置和电子设备，包括以下步骤：
6.s1、用户发出语音请求给人机交互平台，然后人机交互平台收到语音请求后，对用户的语音进行处理，以语音的方式来响应用户的语音请求；
7.s2、对语音请求进行接入和转发，并且进行全局流量的调度和数据分析，同时对语音请求进行安全防御；
8.s3、连接负责设备端和云端服务的通信，定义设备端和云端服务之间的协议；
9.s4、将多语音源的输入进行归一化处理和差异化输出以及准确解析用户语音的意图，接着将用户的语音请求中关键词信息发送到处理用户意图的后端服务模块中，然后后端技能对用户的语音请求进行处理，响应用户的语音请求。
10.进一步的，所述步骤s2中，请求安全防御时，具体步骤如下：当收到海量的用户请求后，对用户的语音请求进行负载分发，分担云端服务器的压力，保证云端服务器在高访问情况下不会造成用户语音请求的丢失和响应的问题。
11.进一步的，所述步骤s3中的协议包括指令和事件以及端状态三个部分。
12.进一步的，所述识别装置适用于智能语音交互识别方法，包括网管平台和语音交互系统、olt终端、无源光分路器以及电子设备，所述语音交互系统将语音交互的结果传输给网管平台，网管平台将信息传输给olt终端，olt终端通过无源光分路器控制电子设备工作。
13.进一步的，所述语音交互系统包括有人机交互平台和用户端、接入层、连接层以及后端服务器，所述用户端将语音传输给人机交互平台，所述人机交互平台将信息分别传输给接入层和连接层以及后端服务器。
14.进一步的，所述用户端包括有智能音箱和app设备，用于负责语音的输入和输出。
15.进一步的，所述接入层包括有bwg网关和bfe统一前端、负载均衡器以及反向代理服务器，bwg网关用于接入和转发用户请求，bfe统一前端用于全局流量的调度和数据分析，负载均衡器用于负载服务器的压力，反向代理服务器用于反向代理工作。
16.进一步的，所述连接层包括有dcs设备端和云端通信服务器以及语音proxy，dcs设备端和云端通信服务器用于负责定制端和云端的通信协议，语音proxy用于语音转换文本，然后文本转换语音以及储存设备信息。
17.进一步的，所述后端服务器包括有输出/输入模块、中控模块、会话模块、用户信息模块、意图解析模块以及技能服务模块，主要用于语音输出和输入的处理，储存用户信息和会话信息的处理、解析用户意图并转发处理、槽位填充处理以及用户语音请求的处理。
18.进一步的，包括电子设备，所述电子设备包括有计算机和摄像机、门禁控制器以及ddc。
19.有益效果
20.本发明提供了一种智能语音交互识别方法、装置和电子设备，与现有技术相比具备以下有益效果：
21.1、该智能语音交互识别方法、装置和电子设备，通过用户的语音输入和输出后，人机交互平台分别使接入层和连接层以及后端服务器工作，保证语音识别的准确性，响应速度快，不会发生语音丢失情况，保证了数据的安全性。
22.2、该智能语音交互识别方法、装置和电子设备，采用语音交互的方式控制电子设备工作，节约了运维成本，施工高效简单，维护简单方便，保证了系统运行的稳定性。
附图说明
23.图1为本发明的原理框图；
24.图2为本发明的语音交互系统的原理框图。
25.图中：1、网管平台；2、语音交互系统；21、人机交互平台；22、用户端；23、接入层；24、连接层；25、后端服务器；3、olt终端；4、无源光分路器；5、电子设备。
具体实施方式
26.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
27.请参阅图1-2，本发明提供一种技术方案，一种智能语音交互识别方法、装置和电子设备，包括以下步骤：
28.s1、用户发出语音请求给人机交互平台，然后人机交互平台收到语音请求后，对用户的语音进行处理，以语音的方式来响应用户的语音请求；
29.s2、对语音请求进行接入和转发，并且进行全局流量的调度和数据分析，同时对语音请求进行安全防御；
30.s3、连接负责设备端和云端服务的通信，定义设备端和云端服务之间的协议；
31.s4、将多语音源的输入进行归一化处理和差异化输出以及准确解析用户语音的意图，接着将用户的语音请求中关键词信息发送到处理用户意图的后端服务模块中，然后后端技能对用户的语音请求进行处理，响应用户的语音请求。
32.本发明实施例中，步骤s2中，请求安全防御时，具体步骤如下：当收到海量的用户请求后，对用户的语音请求进行负载分发，分担云端服务器的压力，保证云端服务器在高访问情况下不会造成用户语音请求的丢失和响应的问题。
33.本发明实施例中，步骤s3中的协议包括指令和事件以及端状态三个部分。
34.本发明实施例中，识别装置适用于智能语音交互识别方法，包括网管平台1和语音交互系统2、olt终端3、无源光分路器4以及电子设备5，语音交互系统2将语音交互的结果传输给网管平台1，网管平台1将信息传输给olt终端3，olt终端3通过无源光分路器4控制电子设备5工作。
35.本发明实施例中，语音交互系统2包括有人机交互平台21和用户端22、接入层23、连接层24以及后端服务器25，用户端22将语音传输给人机交互平台21，人机交互平台21将信息分别传输给接入层23和连接层24以及后端服务器25。
36.本发明实施例中，用户端22包括有智能音箱和app设备，用于负责语音的输入和输出。
37.本发明实施例中，接入层23包括有bwg网关和bfe统一前端、负载均衡器以及反向代理服务器，bwg网关用于接入和转发用户请求，bfe统一前端用于全局流量的调度和数据分析，负载均衡器用于负载服务器的压力，反向代理服务器用于反向代理工作。
38.本发明实施例中，连接层24包括有dcs设备端和云端通信服务器以及语音proxy，dcs设备端和云端通信服务器用于负责定制端和云端的通信协议，语音proxy用于语音转换文本，然后文本转换语音以及储存设备信息。
39.本发明实施例中，后端服务器25包括有输出/输入模块、中控模块、会话模块、用户信息模块、意图解析模块以及技能服务模块，主要用于语音输出和输入的处理，储存用户信息和会话信息的处理、解析用户意图并转发处理、槽位填充处理以及用户语音请求的处理。
40.本发明实施例中，包括电子设备5，电子设备5包括有计算机和摄像机、门禁控制器以及ddc。
41.综上所述，本发明中，通过用户的语音输入和输出后，人机交互平台分别使接入层和连接层以及后端服务器工作，保证语音识别的准确性，响应速度快，不会发生语音丢失情况，保证了数据的安全性，采用语音交互的方式控制电子设备工作，节约了运维成本，施工高效简单，维护简单方便，保证了系统运行的稳定性。
42.同时本说明书中未作详细描述的内容均属于本领域技术人员公知的现有技术。
43.工作原理：用户发出语音请求给人机交互平台，然后人机交互平台收到语音请求后，对用户的语音进行处理，以语音的方式来响应用户的语音请求，对语音请求进行接入和转发，并且进行全局流量的调度和数据分析，同时对语音请求进行安全防御，请求安全防御时，具体步骤如下：当收到海量的用户请求后，对用户的语音请求进行负载分发，分担云端服务器的压力，保证云端服务器在高访问情况下不会造成用户语音请求的丢失和响应的问题，连接负责设备端和云端服务的通信，定义设备端和云端服务之间的协议，语音交互系统2将语音交互的结果传输给网管平台1，网管平台1将信息传输给olt终端3，olt终端3通过无
源光分路器4控制电子设备5工作，用户端22用于负责语音的输入和输出，接入层23中bwg网关用于接入和转发用户请求，bfe统一前端用于全局流量的调度和数据分析，负载均衡器用于负载服务器的压力，反向代理服务器用于反向代理工作，连接层24中dcs设备端和云端通信服务器用于负责定制端和云端的通信协议，语音proxy用于语音转换文本，然后文本转换语音以及储存设备信息，后端服务器25用于语音输出和输入的处理，储存用户信息和会话信息的处理、解析用户意图并转发处理、槽位填充处理以及用户语音请求的处理。
44.需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

技术特征：
1.一种智能语音交互识别方法，其特征在于，包括以下步骤：s1、用户发出语音请求给人机交互平台，然后人机交互平台收到语音请求后，对用户的语音进行处理，以语音的方式来响应用户的语音请求；s2、对语音请求进行接入和转发，并且进行全局流量的调度和数据分析，同时对语音请求进行安全防御；s3、连接负责设备端和云端服务的通信，定义设备端和云端服务之间的协议；s4、将多语音源的输入进行归一化处理和差异化输出以及准确解析用户语音的意图，接着将用户的语音请求中关键词信息发送到处理用户意图的后端服务模块中，然后后端技能对用户的语音请求进行处理，响应用户的语音请求。2.根据权利要求1所述的一种智能语音交互识别方法，其特征在于：所述步骤s2中，请求安全防御时，具体步骤如下：当收到海量的用户请求后，对用户的语音请求进行负载分发，分担云端服务器的压力，保证云端服务器在高访问情况下不会造成用户语音请求的丢失和响应的问题。3.根据权利要求1所述的一种智能语音交互识别方法，其特征在于：所述步骤s3中的协议包括指令和事件以及端状态三个部分。4.一种智能语音交互识别装置，其特征在于：所述识别装置适用于权利要求1～4任意一项的方法，包括网管平台(1)和语音交互系统(2)、olt终端(3)、无源光分路器(4)以及电子设备(5)，所述语音交互系统(2)将语音交互的结果传输给网管平台(1)，网管平台(1)将信息传输给olt终端(3)，olt终端(3)通过无源光分路器(4)控制电子设备(5)工作。5.根据权利要求4所述的一种智能语音交互识别装置，其特征在于：所述语音交互系统(2)包括有人机交互平台(21)和用户端(22)、接入层(23)、连接层(24)以及后端服务器(25)，所述用户端(22)将语音传输给人机交互平台(21)，所述人机交互平台(21)将信息分别传输给接入层(23)和连接层(24)以及后端服务器(25)。6.根据权利要求5所述的一种智能语音交互识别装置，其特征在于：所述用户端(22)包括有智能音箱和app设备，用于负责语音的输入和输出。7.根据权利要求5所述的一种智能语音交互识别装置，其特征在于：所述接入层(23)包括有bwg网关和bfe统一前端、负载均衡器以及反向代理服务器，bwg网关用于接入和转发用户请求，bfe统一前端用于全局流量的调度和数据分析，负载均衡器用于负载服务器的压力，反向代理服务器用于反向代理工作。8.根据权利要求5所述的一种智能语音交互识别装置，其特征在于：所述连接层(24)包括有dcs设备端和云端通信服务器以及语音proxy，dcs设备端和云端通信服务器用于负责定制端和云端的通信协议，语音proxy用于语音转换文本，然后文本转换语音以及储存设备信息。9.根据权利要求5所述的一种智能语音交互识别装置，其特征在于：所述后端服务器(25)包括有输出/输入模块、中控模块、会话模块、用户信息模块、意图解析模块以及技能服务模块，主要用于语音输出和输入的处理，储存用户信息和会话信息的处理、解析用户意图并转发处理、槽位填充处理以及用户语音请求的处理。10.一种智能语音交互识别电子设备，其特征在于：包括权利要求4中的电子设备(5)，所述电子设备(5)包括有计算机和摄像机、门禁控制器以及ddc。

技术总结
本发明公开了一种智能语音交互识别方法、装置和电子设备，本发明涉及互联网技术领域，包括用户发出语音请求给人机交互平台，然后人机交互平台收到语音请求后，对用户的语音进行处理，以语音的方式来响应用户的语音请求，对语音请求进行接入和转发，并且进行全局流量的调度和数据分析，同时对语音请求进行安全防御。该智能语音交互识别方法、装置和电子设备，通过用户的语音输入和输出后，人机交互平台分别使接入层和连接层以及后端服务器工作，保证语音识别的准确性，响应速度快，不会发生语音丢失情况，保证了数据的安全性，采用语音交互的方式控制电子设备工作，节约了运维成本，施工高效简单，维护简单方便，保证了系统运行的稳定性。稳定性。稳定性。

技术研发人员：孙晓刚张国强彭魁邓雅念
受保护的技术使用者：武汉众诚华鑫科技有限公司
技术研发日：2022.02.11
技术公布日：2022/5/25

转载请注明原文地址:https://tc.8miu.com/read-17910.html

专利

最新回复(0)