一种基于音频重构的汽车引擎音频处理方法、装置、设备及介质与流程

专利查询2025-09-14 291

本发明属于音频处理，具体涉及一种基于音频重构的汽车引擎音频处理方法、装置、设备及介质。

背景技术：

1、汽车引擎声异常往往可以反应出发动机过热、进排气系统异常、发动机缺缸等汽车问题，但汽车引擎音频经传输后可能出现失帧、音色改变等情况，导致无法准确、远程判断汽车问题，造成汽车问题处理效率降低，且增加运输成本。同时，汽车引擎声可用于游戏或vr中，还原、真实的音频能够使玩家更具代入感，也使游戏或vr的真实度大幅提升。

技术实现思路

1、为解决现有技术中存在的上述问题，本发明提供了一种基于音频重构的汽车引擎音频处理方法、装置、设备及介质。

2、本发明的目的可以通过以下技术方案实现：

3、一种基于音频重构的汽车引擎音频处理方法，所述汽车引擎音频处理方法的实施包括以下步骤：

4、s1：通过便携式麦克风采集汽车引擎音频信号并获取引擎音频信号参数；

5、s2：通过分贝检测仪获取汽车引擎音量，基于所述引擎音频信号参数构建引擎音频信号预处理判断模型并输出引擎音频信号预处理判断结果，所述引擎音频信号预处理判断结果包括引擎音频信号需预处理结果和引擎音频信号无需预处理结果，当所述引擎音频信号预处理判断模型输出所述引擎音频信号无需预处理结果时获取第一汽车引擎音频信号；

6、s3：当所述引擎音频信号预处理判断模型输出所述引擎音频信号需预处理结果时，通过改进波形掩盖法对所述汽车引擎音频信号进行预处理并获取第二汽车引擎音频信号，所述预处理为通过替代帧掩盖所述引擎音频信号中的丢失帧；

7、s4：获取完整汽车引擎音频信号，所述完整汽车引擎音频信号为所述第一汽车引擎音频信号和所述第二汽车引擎音频信号的集合，通过改进音频重构法还原所述完整汽车引擎音频信号的音色并获取还原汽车引擎音频信号；

8、s5：发送所述还原汽车引擎音频信号给一终端，由终端进行汽车引擎声处理，所述汽车引擎声处理包括汽车引擎质量远程评判、游戏汽车引擎声插入、ar模拟汽车引擎声插入。

9、优选的，所述引擎音频信号参数包括音频频率、音频声压、音频量化位数、音频声道数。

10、优选的，所述步骤s2具体包括：

11、s201：通过所述引擎音频信号参数计算引擎音频信号预处理判断指标并构建所述引擎音频信号预处理判断模型，所述引擎音频信号预处理判断指标的计算公式为：

12、

13、其中，∝为引擎音频信号预处理判断指标，单位为％，f为音频频率，单位为赫兹，v为汽车引擎音量，单位为分贝，fv为音频声压，单位为帕斯卡，d为音频量化位数，单位为个，h为音频声道数，单位为个；

14、s202：预设引擎音频信号预处理判断阈值，通过比较所述引擎音频信号预处理判断指标和所述引擎音频信号预处理判断阈值得到所述引擎音频信号预处理判断结果。

15、优选的，所述步骤s202具体为：

16、判断所述引擎音频信号预处理判断指标，当所述引擎音频信号预处理判断指标大于等于所述引擎音频信号预处理判断阈值时，所述引擎音频信号预处理判断模型输出所述引擎音频信号需预处理结果；

17、当所述引擎音频信号预处理判断指标小于所述引擎音频信号预处理判断阈值时，所述引擎音频信号预处理判断模型输出所述引擎音频信号无需预处理结果并获取所述第一汽车引擎音频信号。

18、优选的，所述步骤s3具体包括：

19、s301：获取所述汽车引擎音频信号的信号帧集合，表达式为：

20、a＝{a1，a2，…，an}，

21、其中，a为信号帧集合，a1为第一帧，a2为第二帧，an为第n帧，n为信号帧总数；

22、s302：获取丢失帧，通过小波分解法获取第t-1帧小波系数，表达式为：

23、

24、其中，为第t-1帧小波系数，t为丢失帧编号，n为信号帧总数，n为小波分解层数，at-1,n为第t-1帧平滑系数，bt-1,n为第n层第t-1帧细节系数，bt-1,n-1为第n-1层第t-1帧细节系数，bt-1,1为第一层第t-1帧细节系数；

25、s303：通过小波分解法获取第一帧至第t-2帧的小波系数矩阵，所述小波系数矩阵的表达式为：

26、

27、其中，c为小波系数矩阵，为第一帧小波系数，为第二帧小波系数，为第t-2帧小波系数，t为丢失帧编号，n为信号帧总数，a1,n为第一帧平滑系数，a2,n为第二帧平滑系数，at-2,n为第t-2帧平滑系数，n为小波分解层数，b1,n为第n层第一帧细节系数，b1,n-1为第n-1层第一帧细节系数，bt-2,1为第一层第t-2帧细节系数；

28、s304：获取所述小波系数矩阵中平滑系数集，计算所述第t-1帧平滑系数和所述平滑系数集的相关性并构成相关性向量，所述平滑系数集为：

29、a＝{a1，n，a2，n，...，at-2，n}，t∈[1，n]，

30、其中，a为平滑系数集，a1,n为第一帧平滑系数，a2,n为第二帧平滑系数，at-2,n为第t-2帧平滑系数，n为小波分解层数，t为丢失帧编号，n为信号帧总数；

31、所述相关性向量的表达式为：

32、

33、其中，为相关性向量，a1为第t-1帧平滑系数与第一帧平滑系数相关性，a2为第t-1帧平滑系数与第二帧平滑系数相关性，at-2为第t-1帧平滑系数与第t-2帧平滑系数相关性，t为丢失帧编号，n为信号帧总数；

34、s305：获取所述相关性向量中最大值对应的最大信号帧小波系数，将所述最大信号帧小波系数作为替代帧小波系数并获取所述替代帧，所述最大信号帧小波系数的表达式为：

35、

36、其中，为最大信号帧小波系数，m为最大信号帧编号，am+1，n为第m+1帧平滑系数，bm+1，n为第n层第m+1帧细节系数，bm+1，n-1为第n-1层第m+1帧细节系数，bm+1，1为第1层第m+1帧细节系数，n为小波分解层数，t为丢失帧编号，n为信号帧总数。

37、优选的，所述步骤s4具体包括：

38、s401：通过扫描搜索获取频谱分量，所述频谱分量包括前向频谱分量和后向频谱分量，所述前向频谱分量的表达式为：

39、ψf(x，y)＝min{ψ(x，y′)}，y-3≤y′≤y，

40、其中，ψf为前向频谱分量，ψ为完整汽车引擎音频信号，y为完整汽车引擎音频信号第y帧，y'为完整汽车引擎音频信号第y'帧，x为完整汽车引擎音频信号第y帧第x个样本点，min{·}为取最小值；

41、所述后向频谱分量的表达式为：

42、ψb(x，y)＝min{ψ(x，y′)}y≤y′≤y+2，

43、其中，ψb为后向频谱分量，ψ为完整汽车引擎音频信号，y为完整汽车引擎音频信号第y帧，y'为完整汽车引擎音频信号第y'帧，x为完整汽车引擎音频信号第y帧第x个样本点，min{·}为取最小值；

44、s402：基于所述频谱分量获取完整汽车引擎音频信号基准值，所述完整汽车引擎音频信号基准值的表达式为：

45、ψs(x，y)＝max{ψf(x，y)，ψb(x，y)}，

46、其中，ψs为完整汽车引擎音频信号基准值，ψf为前向频谱分量，ψb为后向频谱分量，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点，max{·}为取最大值；

47、s403：设定存在阈值，根据所述完整汽车引擎音频信号基准值计算完整汽车引擎音频信号存在概率，计算公式为：

48、

49、其中，p为完整汽车引擎音频信号存在概率，β为第一固定系数，λ为存在阈值，ψ为完整汽车引擎音频信号，ψs为完整汽车引擎音频信号基准值，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点；

50、s404：根据所述完整汽车引擎音频信号存在概率获取最终噪声谱；

51、s405：根据所述最终噪声谱计算后验信噪比，计算公式为：

52、

53、其中，δ为后验信噪比，τ为最终噪声谱，ψ为完整汽车引擎音频信号，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点；

54、s406：根据所述后验信噪比计算先验信噪比，计算公式为：

55、

56、其中，φ为先验信噪比，κ为第一常数，δ为后验信噪比，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点，max{·}为取最大值；

57、s407：基于所述先验信噪比得到增益因子，所述增益因子的表达式为：

58、

59、其中，g为增益因子，φ为先验信噪比，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点；

60、s408：基于所述增益因子获取所述还原汽车引擎音频信号，所述还原汽车引擎音频信号的表达式为：

61、ψ′(x，y)＝g(x，y)·ψ(x，y)，

62、其中，ψ′为还原汽车引擎音频信号，g为增益因子，ψ为完整汽车引擎音频信号，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点。

63、优选的，所述步骤s404具体包括：

64、s404-1：基于所述完整汽车引擎音频信号计算可变系数，计算公式为：

65、μ(x，y)＝p(x，y)+k[1-p(x，y)]，

66、其中，μ为可变系数，p为完整汽车引擎音频信号存在概率，k为第二固定系数，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点；

67、s404-2：根据所述频谱分量计算噪声谱过度浮动参数，计算公式为：

68、

69、其中，γ为噪声谱过度浮动参数，ψf为前向频谱分量，ψb为后向频谱分量，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点；

70、s404-3：基于所述可变系数和所述噪声谱过度浮动参数获取所述最终噪声谱，所述最终噪声谱的表达式为：

71、

72、其中，τ为最终噪声谱，ψ为完整汽车引擎音频信号，μ为可变系数，ω为补偿因子，ψs为完整汽车引擎音频信号基准值，γ为噪声谱过度浮动参数，κ为第一常数，ι为第二常数，y为完整汽车引擎音频信号第y帧，x为完整汽车引擎音频信号第y帧第x个样本点。

73、一种基于音频重构的汽车引擎音频处理装置，用于执行上述所述的汽车引擎音频处理方法，其特征在于，包括音频采集模块、预处理模型构建模块、音频预处理模块、音频还原模块、音频处理模块；

74、所述音频采集模块用于通过便携式麦克风采集汽车引擎音频信号并获取引擎音频信号参数，所述引擎音频信号参数包括音频频率、音频声压、音频量化位数、音频声道数；

75、所述预处理模型构建模块用于通过分贝检测仪获取汽车引擎音量，基于所述引擎音频信号参数构建引擎音频信号预处理判断模型并输出引擎音频信号预处理判断结果，所述引擎音频信号预处理判断结果包括引擎音频信号需预处理结果和引擎音频信号无需预处理结果，当所述引擎音频信号预处理判断模型输出所述引擎音频信号无需预处理结果时获取第一汽车引擎音频信号；

76、所述音频预处理模块用于当所述引擎音频信号预处理判断模型输出所述引擎音频信号需预处理结果时，通过改进波形掩盖法对所述汽车引擎音频信号进行预处理并获取第二汽车引擎音频信号，所述预处理为通过替代帧掩盖所述引擎音频信号中的丢失帧；

77、所述音频还原模块用于获取完整汽车引擎音频信号，所述完整汽车引擎音频信号为所述第一汽车引擎音频信号和所述第二汽车引擎音频信号的集合，通过改进音频重构法还原所述完整汽车引擎音频信号的音色并获取还原汽车引擎音频信号；

78、所述音频处理模块用于发送所述还原汽车引擎音频信号给一终端，由终端进行汽车引擎声处理，所述汽车引擎声处理包括汽车引擎质量远程评判、游戏汽车引擎声插入、ar模拟汽车引擎声插入。

79、一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述所述的汽车引擎音频处理方法。

80、一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行上述所述的汽车引擎音频处理方法。

81、本发明的有益效果为：

82、(1)通过构建引擎音频信号预处理判断模型并输出引擎音频信号预处理判断结果，综合判断采集的汽车引擎音频信号是否存在失帧现象以及是否需要使用替代帧掩盖引擎音频信号中的丢失帧，判断结果更准确，且判断方式简洁，效率高；

83、(2)通过改进波形掩盖法对汽车引擎音频信号进行丢失帧掩盖处理并获取完整汽车引擎音频信号，汽车引擎音频信号更加连贯，有利于进行下一步的音频处理；

84、(3)通过改进音频重构法还原完整汽车引擎音频信号的音色并获取还原汽车引擎音频信号，使采集的汽车引擎音频信号更贴近于真实音色，有利于将还原后的音频应用于多个场景，如汽车引擎质量远程评判等，无需将汽车运往维修中心即可通过还原的汽车引擎音频信号来判断汽车引擎的质量或进行汽车引擎故障判断；

85、(4)通过扫描搜索获取频谱分量并最终获取先验信噪比，使得汽车引擎音频的音色还原过程更加精确；

86、(5)通过增益因子获得还原汽车引擎音频信号，有效增强采集的汽车引擎音频信号且大限度还原采集的汽车引擎音频信号。

技术特征：

1.一种基于音频重构的汽车引擎音频处理方法，其特征在于，所述汽车引擎音频处理方法的实施包括以下步骤：

2.根据权利要求1所述的汽车引擎音频处理方法，其特征在于，所述步骤s2具体包括：

3.根据权利要求2所述的汽车引擎音频处理方法，其特征在于，所述步骤s202具体为：

4.根据权利要求1所述的汽车引擎音频处理方法，其特征在于，所述步骤s3具体包括：

5.根据权利要求4所述的汽车引擎音频处理方法，其特征在于，所述步骤s305具体为：

6.根据权利要求1所述的汽车引擎音频处理方法，其特征在于，所述步骤s4具体包括：

7.根据权利要求6所述的汽车引擎音频处理方法，其特征在于，所述步骤s404具体包括：

8.一种基于音频重构的汽车引擎音频处理装置，其特征在于，包括音频采集模块、预处理模型构建模块、音频预处理模块、音频还原模块、音频处理模块；

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一所述的汽车引擎音频处理方法。

10.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的汽车引擎音频处理方法。

技术总结
本发明涉及一种基于音频重构的汽车引擎音频处理方法、装置、设备及介质，属音频处理领域。其中，该方法包括获取引擎音频信号参数；基于引擎音频信号参数输出引擎音频信号预处理判断结果，当输出引擎音频信号无需预处理结果时获取第一汽车引擎音频信号；当输出引擎音频信号需预处理结果时获取第二汽车引擎音频信号；获取完整汽车引擎音频信号并获取还原汽车引擎音频信号；发送还原汽车引擎音频信号给一终端。本发明实现了综合判断引擎音频失帧情况并通过音频重构还原音色，便于远程通过引擎声判断引擎质量或将音色还原的音频用于游戏音频或AR模拟音频等。

技术研发人员：赵琦帅,郑勇超,顾炎
受保护的技术使用者：拾音汽车科技（上海）有限公司
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-31254.html

专利

最新回复(0)