本发明属于智能家居领域,尤其涉及一种智能家居设备语音模组待机唤醒方法。
背景技术:
1、随着智能家居的飞速发展,语音在智能家居扮演越来越重的角色。现在多种智能家居设备支持语音待机唤醒。目前市面上的语音模组,待机唤醒主要有两种方案。一是语音模组一直全速运行,检测到唤醒词之后唤醒智能家居设备。二是语音模组先处于待机状态,当声音能量超过硬件vad检测阈值之后,语音模组全速运行,检测到唤醒词之后唤醒智能家居设备。
2、当采用语音模组一直全速运行检测唤醒词的方式,会增加智能家居的待机功耗。倘若先使用硬件vad检测声音能量,超过阈值后再全速运行语音模组的方式,相比较第一种方式,功耗有所降低,但是在噪音场景下,语音模组也会长时间处于全速运行状态,功耗仍然较高。
3、另外,由于语音唤醒存在误唤醒的情况。在智能家居设备待机时,上述两种方式都有较高几率误唤醒智能家居设备,通常智能家居在待机时,误唤醒的容忍度是比较低的。
技术实现思路
1、本发明的技术目的是提供一种智能家居设备语音模组待机唤醒方法,以解决现有技术中容易误唤醒以及功耗高问题。
2、为解决上述问题,本发明的技术方案为:
3、一种智能家居设备语音模组待机唤醒方法,包括如下步骤:
4、实时监测周围声音的能量,判断声音能量是否超过阈值,若超过,则令dsp单元进行低频工作模式;
5、提取周围声音的音频特征,送至npu计算单元进行计算,进而得到模型后验信息,而后送入dsp单元;
6、由dsp单元执行第一唤醒词网络搜索,若搜索到第一唤醒词,则令dsp单元进入全速工作模式,反之则令dsp单元重回待机模式;
7、进入全速工作模式之后,由dsp单元执行第二唤醒词网络搜索,若在预设时间内搜索到第二唤醒词,则启动相对应的智能家居设备,反之则令dsp单元重回待机模式。
8、其中,由vad单元实时监测周围声音的能量大小并加以判断,此时,dsp单元处于待机模式。
9、其中,提取周围声音的音频特征具体包括:接收到周围声音的音频信息后,对音频信息依次进行分帧、加窗和快速傅里叶变化处理,得到音频信息的频谱分布,再进行提取得到梅尔频率倒谱系数。
10、其中,送至npu计算单元进行计算,进而得到模型后验信息具体为:将提取得到的梅尔频率倒谱系数输入至npu计算单元,npu计算单元中存储有语言模型,通过语言模型对输入的梅尔频率倒谱系数进行计算,而后输出模型后验信息,模型后验信息包括各个音节的概率。
11、其中,由dsp单元执行第一唤醒词网络搜索具体为:接收npu计算单元输出的模型后验信息,npu单元中存储有第一唤醒词声学模型,通过第一唤醒词声学模型对模型后验信息进行前缀树搜索,计算第一唤醒词的概率。
12、其中,由dsp单元执行第二唤醒词网络搜索具体为:对模型后验信息依次进行回声消除和波束形成处理,npu单元中存储有第二唤醒词声学模型,通过第二唤醒词声学模型对信号处理后的模型后验信息进行计算以及搜索,计算第二唤醒词的概率。
13、其中,第二唤醒词声学模型相较于第一唤醒词声学模型更大,npu单元在第二唤醒词搜索时的策略相较于在第一唤醒词搜索时的策略更为复杂。
14、一种电子设备,电子设备包括处理器和存储器,存储器上存储有可在处理器上运行的计算机指令,处理器用于调用存储器中的计算机指令执行如上述中任一项的智能家居设备语音模组待机唤醒方法。
15、一种存储介质,存储介质用于存储计算机指令,其中,在计算机指令运行时控制存储介质所在设备执行如上述中任一项的智能家居设备语音模组待机唤醒方法。
16、本发明由于采用以上技术方案,使其与现有技术相比具有以下的优点和积极效果:
17、本发明利用vad单元实时监测周围声音能量,在安静场景下,语音模组可以持续处于低功耗待机状态,功耗低。进一步的,vad单元监测通过后,利用硬件特征提取模块和npu计算单元,计算出一个模型后验信息,此时语音模组只需要工作在很低的主频,就可以根据模型后验信息检测是否唤醒,进一步降低功耗。
18、当第一唤醒词唤醒后,语音模组进入全速状态,并继续检测第二唤醒词,第二唤醒词唤醒后,唤醒智能家居设备。通过使用两个唤醒词组合,可以有效的降低误唤醒率。
1.一种智能家居设备语音模组待机唤醒方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的智能家居设备语音模组待机唤醒方法,其特征在于,由vad单元实时监测周围声音的能量大小并加以判断,此时,所述dsp单元处于待机模式。
3.根据权利要求1所述的智能家居设备语音模组待机唤醒方法,其特征在于,所述提取周围声音的音频特征具体包括:接收到周围声音的音频信息后,对音频信息依次进行分帧、加窗和快速傅里叶变化处理,得到音频信息的频谱分布,再进行提取得到梅尔频率倒谱系数。
4.根据权利要求3所述的智能家居设备语音模组待机唤醒方法,其特征在于,所述送至npu计算单元进行计算,进而得到模型后验信息具体为:将提取得到的梅尔频率倒谱系数输入至所述npu计算单元,所述npu计算单元中存储有语言模型,通过语言模型对输入的梅尔频率倒谱系数进行计算,而后输出所述模型后验信息,所述模型后验信息包括各个音节的概率。
5.根据权利要求1所述的智能家居设备语音模组待机唤醒方法,其特征在于,所述由所述dsp单元执行第一唤醒词网络搜索具体为:接收所述npu计算单元输出的所述模型后验信息,所述npu单元中存储有第一唤醒词声学模型,通过所述第一唤醒词声学模型对所述模型后验信息进行前缀树搜索,计算第一唤醒词的概率。
6.根据权利要求5所述的智能家居设备语音模组待机唤醒方法,其特征在于,所述由所述dsp单元执行第二唤醒词网络搜索具体为:对所述模型后验信息依次进行回声消除和波束形成处理,所述npu单元中存储有第二唤醒词声学模型,通过所述第二唤醒词声学模型对信号处理后的所述模型后验信息进行计算以及搜索,计算第二唤醒词的概率。
7.根据权利要求6所述的智能家居设备语音模组待机唤醒方法,其特征在于,所述第二唤醒词声学模型相较于所述第一唤醒词声学模型更大,所述npu单元在第二唤醒词搜索时的策略相较于在第一唤醒词搜索时的策略更为复杂。
8.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器用于调用所述存储器中的计算机指令执行如权利要求1-8中任一项所述的智能家居设备语音模组待机唤醒方法。
9.一种存储介质,其特征在于,所述存储介质用于存储计算机指令,其中,在所述计算机指令运行时控制所述存储介质所在设备执行如权利要求1-7中任一项所述的智能家居设备语音模组待机唤醒方法。