QMF域中的时域增益建模的制作方法

    专利查询2025-11-17  4


    本公开涉及音频处理技术。具体地,本公开描述了在调制滤波器组(mfb)域(例如,正交镜像滤波器(qmf)域)中的时域增益建模,以及在目标时域交叉淡入淡出增益函数应尽可能精确地实现的情况下在mfb域中对音频信号的交叉淡入淡出。


    背景技术:

    1、在音频编码中,编码器的输入可以是经过可逆变换的两个或更多个音频通道,其中,所述变换随时间帧变化。当从先前时间帧切换到当前时间帧时,变换信号的变换参数在编码之前在时域中平滑地交叉淡入淡出。这种交叉淡入淡出需要在解码器侧进行镜像。传统上,在qmf域中进行参数解码之后,在时域中执行交叉淡入淡出。

    2、然而,时域交叉淡入淡出引入了额外的处理延迟,并阻止了在qmf域中对解码信号进行音频处理。

    3、因此,需要能够实现高效音频处理的技术,特别是在解码器侧。还需要能够实现在mfb域(例如,qmf域)中对音频信号进行交叉淡入淡出的技术(特别是在解码器侧),以及对适当的mfb域宽带增益的高效确定。


    技术实现思路

    1、鉴于这种需要,本公开提供了一种用于处理音频的方法和装置以及对应的程序和计算机可读存储介质,它们具有相应独立权利要求的特征。

    2、本公开的一方面涉及一种处理音频的方法。所述方法可以包括:根据时域的目标增益确定用于淡入淡出音频信号的调制滤波器组(mfb)域的宽带增益,使得在所述mfb域中应用所述宽带增益模拟在所述时域中应用所述目标增益。其中,确定所述宽带增益可以包括:使用所述目标增益、mfb分析原型滤波器和mfb合成原型滤波器计算所述宽带增益。目标增益可以与作为时间(或样本数量或其他合适的时间索引)的函数的目标增益函数相关。

    3、按照上述定义进行配置,所提出的方法可以在mfb域中应用宽带增益,从而实现对应用增益后的音频信号的mfb域处理,并降低音频处理链的总体延迟和计算复杂度。

    4、在一些实施例中,可以为多个mfb分析时隙中的每一个计算相应的宽带增益。

    5、在一些实施例中,计算所述宽带增益可以包括通过计算最小二乘解来优化所述宽带增益。

    6、在一些实施例中,确定所述宽带增益可以包括:基于输入训练信号和所述mfb分析原型滤波器,针对多个mfb分析时隙中的每一个以及多个频带中的每一个确定相应的mfb分析信号。确定所述宽带增益可以进一步包括:基于相应的mfb分析时隙中的mfb分析信号和所述mfb合成原型滤波器,针对所述多个mfb分析时隙中的每一个确定相应的mfb合成信号。确定所述宽带增益可以又进一步包括:基于所述mfb合成信号和所述目标增益,跨mfb分析时隙计算所述宽带增益。

    7、由此,可以准确且高效地计算最佳宽带增益。

    8、在一些实施例中,计算所述宽带增益可以包括通过计算最小二乘解来优化所述宽带增益。

    9、在一些实施例中,所述最小二乘解可以最小化第一音频信号的样本与第二音频信号的样本之间的误差。所述第一音频信号可以通过对所述训练信号进行mfb分析、然后进行mfb合成、重叠相加和应用所述目标增益来获得。可替代地,所述第一音频信号可以通过应用所述目标增益并通过mfb分析和mfb合成的处理延迟进行延迟获得。所述第二音频信号可以通过在每个mfb分析时隙中将相应的(待确定)宽带增益应用于相应的mfb合成信号,并对所有mfb分析时隙的贡献求和来获得。其中,所述第一音频信号和所述第二音频信号可以为时域音频信号。

    10、在一些实施例中,所述最小二乘解可以是基于取决于所述多个mfb合成信号的变换矩阵t1以及取决于所述目标增益的目标向量t1的目标函数的解。

    11、在一些实施例中,所述变换矩阵t1可以由t1=[w0(n),w1(n),...,wk-1(n)]给出,其中,k是mfb分析时隙的数量并且n指示样本数量。所述目标向量t1可以由t1=x2(n)g(n-dp)给出,其中,x2(n)是可通过对所述训练信号进行mfb分析、然后进行mfb合成和重叠相加获得的时域信号,并且dp是延迟(例如,处理延迟)。所述最小二乘解可以是方程t1g=t1的解,其中,g是由g=[g0,g1,...,gk-1]t给出的宽带增益向量,其中,□t指示转置。dp可以是进行mfb分析、然后进行mfb合成和重叠相加的处理延迟。

    12、在一些实施例中,所述宽带增益向量g的最小二乘解可以由给出,其中,□-1指示逆。

    13、在一些实施例中,所述训练信号可以是随机信号或dc信号。例如,随机信号可以是白噪声信号。

    14、在一些实施例中,计算所述宽带增益可以是迭代进行的,第一次迭代之后的每次迭代利用相应的经修改训练信号或相应的不同训练信号进行计算。可以进一步基于至少一次先前迭代的结果的平均值计算第一次迭代之后每次迭代中的宽带增益。例如,可以通过对所有迭代的结果取平均来确定宽带增益的最终结果。

    15、通过对不同的输入训练信号重复/迭代执行宽带增益确定,可以实现所提出方法对广泛的现实世界音频信号具有更好的准确性。

    16、在一些实施例中,确定所述宽带增益可以包括:基于所述mfb分析原型滤波器和所述mfb合成原型滤波器确定mfb内插原型滤波器。确定所述宽带增益可以进一步包括:基于所述mfb内插原型滤波器和所述目标增益,跨mfb分析时隙计算所述宽带增益。

    17、由此,可以准确且高效地计算最佳宽带增益。

    18、在一些实施例中,所述mfb内插原型滤波器可以被确定为所述mfb分析原型滤波器和所述mfb合成原型滤波器中的一个与所述mfb分析原型滤波器和所述mfb合成原型滤波器中的另一个的镜像(例如,时间镜像)和移位版本的乘积。例如,移位版本可以根据mfb内插原型滤波器的有效长度进行移位。

    19、在一些实施例中,计算所述宽带增益可以包括通过计算最小二乘解来优化所述宽带增益。

    20、在一些实施例中,所述最小二乘解可以是基于变换矩阵t2以及取决于所述目标增益的目标向量t2的目标函数的解。

    21、在一些实施例中,所述最小二乘解可以是基于取决于所述mfb内插原型滤波器的变换矩阵t2以及取决于所述目标增益的目标向量t2的目标函数的解。

    22、在一些实施例中,所述变换矩阵t2可以是所述mfb内插原型滤波器的移位版本的矩阵,每个版本与特定的mfb分析时隙相关联。

    23、在一些实施例中,所述变换矩阵t2可以由t2=[pi(n),pi(n-s),...,pi(n-(k-1)s)]给出,其中,pi是所述mfb内插原型滤波器,k是mfb分析时隙的数量,n指示样本数量,并且s是所述mfb分析时隙的时隙长度。所述目标向量t2可以由给出,其中,g是所述目标增益。所述最小二乘解可以是方程t2g=t2的解,g是由g=[g0,g1,...,gk-1]t给出的宽带增益向量,其中,□t指示转置。

    24、在一些实施例中,所述宽带增益向量g的最小二乘解可以由给出,其中,□-1指示逆。

    25、在一些实施例中,所述mfb内插原型滤波器pi可以由pi(n)=ps(n)pa(d-n)给出,其中,pa是所述mfb分析原型滤波器,ps是所述mfb合成原型滤波器,并且d+1是所述mfb内插原型滤波器pi的有效长度。

    26、在一些实施例中,所述方法可以进一步包括:通过识别时间样本封装的、所述目标增益的非恒定增益函数部分并基于所述非恒定增益函数部分确定相关联的时隙来确定一组(相关的)mfb分析时隙。

    27、在一些实施例中,所述mfb域可以是正交镜像滤波器(qmf)域。

    28、在一些实施例中,所述方法可以包括在所述mfb域中应用所确定的宽带增益。

    29、在一些实施例中,所述方法可以包括使用所述所确定的宽带增益生成时域宽带信号。

    30、在一些实施例中,所述方法可以包括将所确定的宽带增益限制(例如,映射或缩短)在预定范围,例如0至1的范围内(包括端值)。

    31、在一些实施例中,所述方法可以进一步包括:使用每个mfb分析时隙的宽带增益,对所述mfb域中的变换信号进行解码,包括对与当前参数集相关的音频信号进行淡入淡出和/或对与先前参数集相关的音频信号进行淡入淡出。例如,这可以对应于对前述音频信号进行交叉淡入淡出。具体地,这可以对应于对先前和当前参数(参数集)进行交叉淡入淡出,以实现对与先前和当前参数相关的信号的交叉淡入淡出。

    32、根据另一方面,提供了一种用于处理音频的装置。所述装置可以包括处理器和存储器,所述存储器耦接到处理器并且存储用于处理器的指令。所述处理器可以被配置为执行根据前述方面及其实施例的方法的所有步骤。

    33、根据另一方面,描述了一种计算机程序。所述计算机程序可以包括可执行指令,所述可执行指令当由计算设备执行时用于执行贯穿本公开概述的方法或方法步骤。

    34、根据又一方面,描述了一种计算机可读存储介质。所述存储介质可以存储计算机程序,所述计算机程序适于在处理器上执行并且当在处理器上执行时用于执行贯穿本公开概述的方法或方法步骤。

    35、应当注意,如在本公开中概述的方法和系统(包括其优选实施例)可以独立使用,或者与本文档中公开的其他方法和系统结合使用。此外,本公开中概述的方法和系统的所有方面可以任意组合。特别地,权利要求的特征可以以任意方式彼此组合。

    36、将理解,装置特征和方法步骤可以以多种方式互换。特别地,如技术人员将理解的,所公开的(多种)方法的细节可以由对应的装置实现,并且反之亦然。此外,上述关于(多种)方法(以及,例如其步骤)的任何陈述均应理解为同样适用于对应的装置(以及,例如,其框、级、单元),并且反之亦然。


    技术特征:

    1.一种处理音频的方法,所述方法包括:根据时域的目标增益确定用于淡入淡出音频信号的调制滤波器组mfb域的宽带增益,使得在所述mfb域中应用所述宽带增益模拟在所述时域中应用所述目标增益,

    2.根据权利要求1所述的方法,其中,为多个mfb分析时隙中的每一个mfb分析时隙计算相应的宽带增益。

    3.根据前述权利要求中任一项所述的方法,其中,计算所述宽带增益包括通过计算最小二乘解来优化所述宽带增益。

    4.根据权利要求1所述的方法,其中,确定所述宽带增益包括:

    5.根据权利要求4所述的方法,其中,计算所述宽带增益包括通过计算最小二乘解来优化所述宽带增益。

    6.根据权利要求5所述的方法,其中,所述最小二乘解最小化第一音频信号的样本与第二音频信号的样本之间的误差,所述第一音频信号能够通过对所述训练信号进行mfb分析、然后进行mfb合成、重叠相加和应用所述目标增益来获得,或者通过应用所述目标增益并通过mfb分析和mfb合成的处理延迟进行延迟获得,并且所述第二音频信号能够通过在每个mfb分析时隙中将相应的宽带增益应用于相应的mfb合成信号,并对所有mfb分析时隙的贡献求和来获得。

    7.根据权利要求5或6所述的方法,其中,所述最小二乘解是基于取决于所述多个mfb合成信号的变换矩阵t1以及取决于所述目标增益的目标向量t1的目标函数的解。

    8.根据权利要求7所述的方法,其中,所述变换矩阵t1由t1=[w0(n),w1(n),...,wk-1(n)]给出,其中,k是mfb分析时隙的数量并且n指示样本数量,并且所述目标向量t1由t1=x2(n)g(n-dp)给出,其中,x2(n)是能够通过对所述训练信号进行mfb分析、然后进行mfb合成和重叠相加获得的时域信号,并且dp是延迟;并且

    9.根据权利要求8所述的方法,其中,所述宽带增益向量g的最小二乘解由给出,其中,指示逆。

    10.根据权利要求4至9中任一项所述的方法,其中,所述训练信号是随机信号或恒定信号。

    11.根据权利要求4至10中任一项所述的方法,其中,计算所述宽带增益是迭代进行的,第一次迭代之后的每次迭代利用相应的经修改训练信号或相应的不同训练信号进行计算。

    12.根据权利要求1所述的方法,其中,确定所述宽带增益包括:

    13.根据权利要求12所述的方法,其中,所述mfb内插原型滤波器被确定为所述mfb分析原型滤波器和所述mfb合成原型滤波器中的一个与所述mfb分析原型滤波器和所述mfb合成原型滤波器中的另一个的镜像和移位版本的乘积。

    14.根据权利要求12或13所述的方法,其中,计算所述宽带增益包括通过计算最小二乘解来优化所述宽带增益。

    15.根据权利要求14所述的方法,其中,所述最小二乘解是基于变换矩阵t2以及取决于所述目标增益的目标向量t2的目标函数的解。

    16.根据权利要求14所述的方法,其中,所述最小二乘解是基于取决于所述mfb内插原型滤波器的变换矩阵t2以及取决于所述目标增益的目标向量t2的目标函数的解。

    17.根据权利要求15或16所述的方法,其中,所述变换矩阵t2是所述mfb内插原型滤波器的移位版本的矩阵,每个版本与特定的mfb分析时隙相关联。

    18.根据权利要求15至17中任一项所述的方法,其中,所述变换矩阵t2由t2=[pi(n),pi(n-s),...,pi(n-(k-1)s)]给出,

    19.根据权利要求18所述的方法,其中,所述宽带增益向量g的最小二乘解由给出,其中,指示逆。

    20.根据权利要求18或19所述的方法,其中,所述mfb内插原型滤波器pi由pi(n)=ps(n)pa(d-n)给出,其中,pa是所述mfb分析原型滤波器,ps是所述mfb合成原型滤波器,并且d+1是所述mfb内插原型滤波器pi的有效长度。

    21.根据前述权利要求中任一项所述的方法,进一步包括通过识别时间样本封装的、所述目标增益的非恒定增益函数部分并基于所述非恒定增益函数部分确定相关联的时隙来确定一组mfb分析时隙。

    22.根据前述权利要求中任一项所述的方法,其中,所述mfb域是正交镜像滤波器qmf域。

    23.根据前述权利要求中任一项所述的方法,包括在所述mfb域中应用所确定的宽带增益。

    24.根据前述权利要求中任一项所述的方法,包括使用所述所确定的宽带增益生成时域宽带信号。

    25.根据前述权利要求中任一项所述的方法,包括将所述所确定的宽带增益限制在包括端值的0至1的范围内。

    26.根据前述权利要求中任一项所述的方法,进一步包括:

    27.一种装置,包括处理器和存储器,所述存储器耦接到所述处理器,并且存储用于所述处理器的指令,其中,所述处理器适于执行根据权利要求1至26中任一项所述的方法。

    28.一种程序,包括指令,所述指令当由处理器执行时使所述处理器执行根据权利要求1至26中任一项所述的方法。

    29.一种计算机可读存储介质,存储有根据权利要求28所述的程序。


    技术总结
    提供了一种处理音频的方法。方法包括:根据时域的目标增益确定用于淡入淡出音频信号的调制滤波器组MFB域的宽带增益,使得在MFB域中应用宽带增益模拟在时域中应用目标增益。确定宽带增益包括使用目标增益、MFB分析原型滤波器和MFB合成原型滤波器计算宽带增益。还提供了对应的装置、程序和计算机可读存储介质。

    技术研发人员:H·穆特,L·维莱莫斯
    受保护的技术使用者:杜比国际公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-32094.html

    最新回复(0)