一种房间声学反射边界测量方法

    专利查询2023-09-16  93



    1.本发明涉及一种房间声学反射边界测量方法。


    背景技术:

    2.在音频信号处理的诸多领域中,声学反射边界定位对于提高计算能力的效果均具有重要的作用,例如声源定位、声场重建、音频取证等。此外,房间几何模型参数的获取也可以增强声场中的目标信号,在诸如语音增强、声源分离以及去混响等计算方法上得到应用。
    3.传统上定位声学反射边界具体位置的方法有两种,一种是像声源法,一种是椭圆法。像声源法先通过tdoa(time difference of arrival,波达时间差),定位实际声源经过房间反射后得到的像声源,再根据实际声源和像声源的位置确定反射边界。椭圆法则根据反射声toa(time of arrival,波达时间)所满足的条件,构建一个非线性优化问题,通过求解该优化问题直接定位反射边界。像声源法计算速度快,但是准确性低;椭圆法计算速度慢,但是更为准确。
    4.在房间反射边界测量中,由于声学信号的发射端和信号的接收端存在延迟,故而测量信号的传播时间本身会引入误差,该误差以下简称为延迟误差。传统的像声源法使用tdoa信息定位,可以避免延迟误差,同时该方法也可以得到闭式解,计算速度较快。但是由于该方法需要先计算像声源的坐标,再计算反射边界的位置,像声源坐标定位的误差会被放大,最终结果仍然会存在较大的偏差。椭圆线法使用toa信息定位,本身会引入延迟误差,且该方法需要进行非线性优化,计算速度较慢,难以实现实时测量。
    5.此外,传统方法在计算tdoa或者toa时,是先使用扫频信号逐个测量每个声源的房间脉冲响应。这种测量方法会由于各个通道不同步而引入误差,以下简称同步误差。


    技术实现要素:

    6.为了解决上述技术缺陷,本发明提出一种声效处理系统和方法。
    7.解决前述技术问题的技术方案为:一种房间声学反射边界测量方法,包括如下步骤:
    8.s1:测量每个扬声器相对每个传声器的房间脉冲响应;
    9.s2:计算首次反射声信号的tdoa值;
    10.s3:计算像声源坐标以及坐标的偏差和协方差矩阵;
    11.s4:根据像声源坐标以及坐标的偏差和协方差矩阵,计算声学反射边界的位置;
    12.其中,步骤s3的具体过程为:
    13.s3.1从步骤s2获得的所有首次反射声信号组合的tdoa值中,提取出任意一个扬声器相对于任意两个传声器的首次反射声信号的tdoa值的所有组合;
    14.s3.2计算该扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵;
    15.s3.3对每一个扬声器进行上述操作,得到所有扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵;设编号为m的像声源坐标的协方差矩阵为covm,该矩阵的3个不重
    复元素分别为n
    xx,m
    、n
    xy,m
    、n
    yy,m
    ,则协方差矩阵如下所示:
    [0016][0017]
    其中,n
    xx,m
    为x坐标与x坐标的协方差,,n
    xy,m
    为x坐标与y坐标的协方差,n
    yy,m
    为y坐标与y坐标的协方差为。
    [0018]
    进一步,步骤s4具体过程为:
    [0019]
    s4.1根据像声源坐标和已知的扬声器坐标,依次计算以下参数:
    [0020][0021]exx
    =diag{n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,m
    }
    [0022]exy
    =diag{n
    xy,1
    ,n
    xy,2
    ,

    ,n
    xy,m
    }
    [0023]eyy
    =diag{n
    yy,1
    ,n
    yy,2
    ,

    ,n
    yy,m
    }
    [0024][0025][0026][0027][0028][0029][0030]
    其中,x
    s,1
    、x
    s,2
    ……
    x
    s,m
    和y
    s,1
    、y
    s,2
    ……ys,m
    表示在全部m个扬声器中,编号分别为1、2
    ……
    m的扬声器在直角坐标系中的x轴坐标和y轴坐标,x
    i,1
    、x
    i,2
    ……
    x
    i,m
    和y
    i,1
    、y
    i,2
    ……yi,m
    表示在全部m个扬声器中,编号分别为1、2
    ……
    m的扬声器所对应的像声源在直角坐标系中的x轴坐标和y轴坐标。diag{n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,m
    }表示主对角线元素分别为n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,mxx
    ,其余元素为0的对角矩阵,右上角标t表示矩阵的转置,右下角标2m
    ×
    2表示该矩阵有2m行,2列矩阵;n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,m
    、n
    xy,1
    ,n
    xy,2
    ,

    ,n
    xy,m
    、n
    yy,1
    ,n
    yy,2
    ,

    ,n
    yy,m
    为每个像声源坐标的协方差矩阵中的元素;
    [0031]
    s4.2设声学反射边界的方程为l1x+l2y+1=0,其中l1和l2为声学反射边界方程的线性参数,计算声学反射边界方程的线性参数的初步估计值
    [0032][0033]
    其中,是声学反射边界方程的线性参数的初步估计值,参数b

    [0034][0035]
    s4.3根据声学反射边界方程的线性参数的初步估计值,重新计算参数ψ为
    [0036][0037][0038][0039][0040]
    s4.4计算声学反射边界方程线性参数的最终估计值
    [0041]
    θ=(a
    t
    ψ-1
    a)-1at
    ψ-1b[0042]
    其中,是声学反射边界方程的线性参数的最终估计值。
    [0043]
    进一步,所述的房间声学反射边界测量方法还包括:步骤s5:根据声学反射边界方程的线性参数的最终估计值,修正测量结果,具体过程如下:
    [0044]
    s5.1计算参数矩阵
    [0045]ex
    =[n
    x,1
    ,n
    x,2
    ,

    ,n
    x,m
    ]
    t
    [0046]ey
    =[n
    y,1
    ,n
    y,2
    ,

    ,n
    y,m
    ]
    t
    [0047][0048]
    其中,n
    x,1
    ,n
    x,2
    ,

    ,n
    x,m
    和n
    y,1
    ,n
    y,2
    ,

    ,n
    y,m
    为每个像声源坐标的x坐标和y坐标的偏差,由步骤s3计算的像声源坐标的偏差得到;
    [0049]
    s5.2计算声学反射边界方程线性参数的修正值
    [0050][0051]
    其中,是声学反射边界方程的线性参数的修正值,参数θ、a、ψ由步骤s4步计算得到。
    [0052]
    进一步,步骤s1的具体过程为:
    [0053]
    s1.1生成编码信号和解码信号;
    [0054]
    s1.2将生成的编码信号同时馈给所有扬声器进行播放;
    [0055]
    s1.3使用传声器阵列接收扬声器阵列播放的信号,获得测量信号;
    [0056]
    s1.4计算每个传声器得到的测量信号和解码信号的周期互相关,得到每个扬声器相对每个传声器的房间脉冲响应。
    [0057]
    进一步,步骤s2的具体过程为:
    [0058]
    s2.1根据测量得到的房间脉冲响应,提取房间脉冲响应的首次反射声信号;
    [0059]
    s2.2计算任意两个首次反射声信号之间的广义互相关函数;
    [0060]
    s2.3获取该广义互相关函数的最大值所对应的时延值,该时延值即为所计算的两个首次反射声信号的tdoa值;
    [0061]
    s2.4对所有不重复的首次反射声信号的两两组合重复上述s2.1-s2.3操作,得到所有首次反射声信号组合的tdoa值。
    [0062]
    本发明与现有技术相比,其显著优点在于:本发明通过改进声学反射边界定位算法,以及通过估计定位结果的偏差对定位结果进行修正,获得了更高的定位精度。相比传统的椭圆定位方法,本发明通过使用tdoa进行计算,避免了延时误差的影响;通过给出最终定位结果的闭式解,获得了更快的计算速度。另外,相比于两种传统方法,本发明通过同时测量每个扬声器相对每个传声器的房间脉冲响应,避免了同步误差的影响。综合而言,本发明具有定位精度高、计算量小,可以进行实时定位的优点。
    附图说明
    [0063]
    图1是本发明步骤流程简图;
    [0064]
    图2是本发明声流程详图。
    具体实施方式
    [0065]
    容易理解,依据本发明的技术方案,在不变更本发明的实质精神的情况下,本领域的一般技术人员可以想象出本发明的多种实施方式。因此,以下具体实施方式和附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限制或限定。
    [0066]
    现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
    [0067]
    以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
    [0068]
    对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
    [0069]
    在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
    [0070]
    应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
    [0071]
    如图1所示,本发明房间声学反射边界测量方法的具体实现过程如下:
    [0072]
    步骤s1:测量房间脉冲响应
    [0073]
    为避免引入同步误差,本发明同时测量每个扬声器相对每个传声器的房间脉冲响应。在本步骤中,
    [0074]
    s1.1,首先生成编码信号和解码信号;
    [0075]
    s1.2将生成的编码信号,同时馈给所有扬声器进行播放;
    [0076]
    s1.3使用传声器阵列接收测量信号,即使用传声器阵列接收扬声器阵列播放的信
    号;
    [0077]
    s1.4,最后计算每个传声器得到的测量信号和解码信号的周期互相关,得到每个扬声器相对每个传声器的房间脉冲响应。
    [0078]
    生成编码信号和解码信号的方法可以采用现有技术,例如文献《基于三元伪随机序列集的多声源房间脉冲响应测量方法》[j/ol].应用声学:1-18记载的方法。
    [0079]
    步骤s2:计算首次反射声信号的tdoa
    [0080]
    本发明利用广义互相关法,计算首次反射声的tdoa,计算过程如下:
    [0081]
    s2.1首先,根据测量得到的房间脉冲响应,提取房间脉冲响应的首次反射声部分,以下简称为首次反射声信号,首次反射声信号的个数与房间脉冲响应的个数相同;
    [0082]
    s2.2计算任意两个首次反射声信号之间的广义互相关函数;
    [0083]
    s2.3找到该广义互相关函数的最大值所对应的时延值,该时延值即为所计算的两个首次反射声信号的tdoa估计值;
    [0084]
    s2.4最后,对所有不重复的首次反射声信号的两两组合重复上述s2.1-s2.3操作,得到所有首次反射声信号组合的tdoa估计值。
    [0085]
    本步骤中,可以使用现有技术提取房间脉冲响应的首次反射声部分,如文献remaggi l,jackson p j b,coleman p,et al.acoustic reflector localization:novel image source reversion and direct localization methods[j].ieee/acm transactions on audio,speech,and language processing,2016,25(2):296-309.记载的方法。也可以使用现有技术计算任意两个首次反射声信号之间的广义互相关函数,如文献tervo s,j,lokki t.acoustic reflection localization from room impulse responses[j].acta acustica united with acustica,2012,98(3):418-440.中记载的方法。
    [0086]
    步骤s3:计算像声源坐标以及坐标的偏差和协方差矩阵
    [0087]
    像声源是指实际发声的扬声器,与声学反射边界轴对称的镜像。本发明计算像声源坐标以及坐标的偏差和协方差矩阵的具体过程如下:
    [0088]
    s3.1从上一步得到的所有首次反射声信号组合的tdoa估计值中,提取出某一个扬声器相对于任意两个传声器的首次反射声信号的tdoa估计值的所有组合;
    [0089]
    s3.2计算该扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵;
    [0090]
    s3.3对每一个扬声器进行上述操作,得到所有扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵。计算得到的每一个像声源坐标的协方差矩阵应当为2
    ×
    2矩阵且有两个元素相同。设编号为m的像声源坐标的协方差矩阵为covm,该矩阵的3个不重复元素分别为n
    xx,m
    、n
    xy,m
    、n
    yy,m
    ,则协方差矩阵如下所示:
    [0091][0092]
    其中,n
    xx,m
    为x坐标与x坐标的协方差,,n
    xy,m
    为x坐标与y坐标的协方差,n
    yy,m
    为y坐标与y坐标的协方差。
    [0093]
    设n
    x,m
    为编号为m的像声源的x坐标的偏差,n
    y,m
    为编号为m的像声源的y坐标的偏差。
    [0094]
    计算该扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵的方法可以为
    文献ho k c.bias reduction for an explicit solution of source localization using tdoa[j].ieee transactions on signal processing,2012,60(5):2101-2114.中的方法。
    [0095]
    步骤s4:定位声学反射边界
    [0096]
    利用上一步计算得到的像声源坐标以及坐标的偏差和协方差矩阵,计算声学反射边界的位置,具体计算过程如下:
    [0097]
    s4.1根据像声源坐标和已知的扬声器坐标,依次计算以下参数
    [0098][0099]exx
    =diag{n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,m
    }
    [0100]exy
    =diag{n
    xy,1
    ,n
    xy,2
    ,

    ,n
    xy,m
    }
    [0101]eyy
    =diag{n
    yy,1
    ,n
    yy,2
    ,

    ,n
    yy,m
    }
    [0102][0103][0104][0105][0106][0107][0108]
    其中,x
    s,1
    、x
    s,2
    ……
    x
    s,m
    和y
    s,1
    、y
    s,2
    ……ys,m
    表示在全部m个扬声器中,编号分别为1、2
    ……
    m的扬声器在直角坐标系中的x轴坐标和y轴坐标,x
    i,1
    、x
    i,2
    ……
    x
    i,m
    和y
    i,1
    、y
    i,2
    ……yi,m
    表示在全部m个扬声器中,编号分别为1、2
    ……
    m的扬声器所对应的像声源在直角坐标系中的x轴坐标和y轴坐标。diag{a,b,c

    }表示主对角线元素分别为a,b,c

    ,其余元素为0的对角矩阵,右上角标t表示矩阵的转置,右下角标a
    ×
    b表示该矩阵为a
    ×
    b矩阵。即diag{n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,m
    }表示主对角线元素分别为其余元素为0的对角矩阵。n
    xx,1
    ,n
    xx,2
    ,

    ,n
    xx,m
    、n
    xy,1
    ,n
    xy,2
    ,

    ,n
    xy,m
    、n
    yy,1
    ,n
    yy,2
    ,

    ,n
    yy,m
    为每个像声源坐标的协方差矩阵中的元素,由上一步计算的像声源坐标的协方差矩阵中得到。
    [0109]
    s4.2设声学反射边界的方程为l1x+l2y+1=0,其中l1和l2为声学反射边界方程的线性参数,计算声学反射边界方程的线性参数的初步估计值
    [0110]
    [0111]
    其中,是声学反射边界方程的线性参数的初步估计值,参数b为
    [0112][0113]
    s4.3根据声学反射边界方程的线性参数的初步估计值,重新计算参数ψ为
    [0114][0115][0116][0117][0118]
    s 4.4计算声学反射边界方程线性参数的最终估计值
    [0119]
    θ=(a
    t
    ψ-1
    a)-1at
    ψ-1b[0120]
    其中,是声学反射边界方程的线性参数的最终估计值。即声学反射边界的方程为l1x+l2y+1=0。该方程决定了声学反射边界的位置。
    [0121]
    步骤s5:修正定位结果
    [0122]
    根据声学反射边界方程的线性参数的最终估计值,修正测量结果,具体过程如下:
    [0123]
    s5.1计算参数矩阵
    [0124]ex
    =[n
    x,1
    ,n
    x,2
    ,

    ,n
    x,m
    ]
    t
    [0125]ey
    =[n
    y,1
    ,n
    y,2
    ,

    ,n
    y,m
    ]
    t
    [0126][0127]
    其中,n
    x,1
    ,n
    x,2
    ,

    ,n
    x,m
    和n
    y,1
    ,n
    y,2
    ,

    ,n
    y,m
    为每个像声源坐标的x坐标和y坐标的偏差,由第3步计算的像声源坐标的偏差得到。
    [0128]
    s5.2计算声学反射边界方程线性参数的修正值
    [0129][0130]
    其中,是声学反射边界方程的线性参数的修正值,参数θ、a、ψ由步骤s4步计算得到。

    技术特征:
    1.一种房间声学反射边界测量方法,其特征在于,包括如下步骤:s1:测量每个扬声器相对每个传声器的房间脉冲响应;s2:计算首次反射声信号的tdoa值;s3:计算像声源坐标以及坐标的偏差和协方差矩阵;s4:根据像声源坐标以及坐标的偏差和协方差矩阵,计算声学反射边界的位置;其中,步骤s3的具体过程为:s3.1从步骤s2获得的所有首次反射声信号组合的tdoa值中,提取出任意一个扬声器相对于任意两个传声器的首次反射声信号的tdoa值的所有组合;s3.2计算该扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵;s3.3对每一个扬声器进行上述操作,得到所有扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵;设编号为m的像声源坐标的协方差矩阵为cov
    m
    ,该矩阵的3个不重复元素分别为n
    xx,m
    、n
    xy,m
    、n
    yy,m
    ,则协方差矩阵如下所示:其中,n
    xx,m
    为x坐标与x坐标的协方差,,n
    xy,m
    为x坐标与y坐标的协方差,n
    yy,m
    为y坐标与y坐标的协方差为。2.如权利要求1所述的房间声学反射边界测量方法,其特征在于,步骤s4具体过程为:具体计算过程如下:s4.1根据像声源坐标和已知的扬声器坐标,依次计算以下参数:e
    xx
    =diag{n
    xx,1
    ,n
    xx,2


    ,n
    xx,m
    }e
    xy
    =diag{n
    xy,1
    ,n
    xy,2


    ,n
    xy,m
    }e
    yy
    =diag{n
    yy,1
    ,n
    yy,2


    ,n
    yy,m
    }}}}}}其中,x
    s,1
    、x
    s,2
    ......x
    s,m
    和y
    s,1
    、y
    s,2
    ......y
    s,m
    表示在全部m个扬声器中,编号分别为1、
    2......m的扬声器在直角坐标系中的x轴坐标和y轴坐标,x
    i,1
    、x
    i,2
    ......x
    i,m
    和y
    i,1
    、y
    i,2
    ......y
    i,m
    表示在全部m个扬声器中,编号分别为1、2......m的扬声器所对应的像声源在直角坐标系中的x轴坐标和y轴坐标。diag{n
    xx,1
    ,n
    xx,2


    ,n
    xx,m
    }表示主对角线元素分别为n
    xx,1
    ,n
    xx,2


    ,其余元素为0的对角矩阵,右上角标t表示矩阵的转置,右下角标2m
    ×
    2表示该矩阵有2m行,2列矩阵;n
    xx,1
    ,n
    xx,2


    ,n
    xx,m
    、n
    xy,1
    ,n
    xy,2


    ,n
    xy,m
    、n
    yy,1
    ,n
    yy,2


    ,n
    yy,m
    为每个像声源坐标的协方差矩阵中的元素;s4.2设声学反射边界的方程为l1x+l2y+1=0,其中l1和l2为声学反射边界方程的线性参数,计算声学反射边界方程的线性参数的初步估计值数,计算声学反射边界方程的线性参数的初步估计值其中,其中,是声学反射边界方程的线性参数的初步估计值,参数b为s4.3根据声学反射边界方程的线性参数的初步估计值,重新计算参数ψ为s4.3根据声学反射边界方程的线性参数的初步估计值,重新计算参数ψ为s4.3根据声学反射边界方程的线性参数的初步估计值,重新计算参数ψ为s4.3根据声学反射边界方程的线性参数的初步估计值,重新计算参数ψ为s4.4计算声学反射边界方程线性参数的最终估计值θ=(a
    t
    ψ-1
    a)-1
    a
    t
    ψ-1
    b其中,其中,是声学反射边界方程的线性参数的最终估计值。3.如权利要求2所述的房间声学反射边界测量方法,其特征在于,还包括:步骤s5:根据声学反射边界方程的线性参数的最终估计值,修正测量结果,具体过程如下:s5.1计算参数矩阵e
    x
    =[n
    x,1
    ,n
    x,2


    ,n
    x,m
    ]
    t
    e
    y
    =[n
    y,1
    ,n
    y,2


    ,n
    y,m
    ]
    t
    其中,n
    x,1
    ,n
    x,2


    ,n
    x,m
    和n
    y,1
    ,n
    y,2


    ,n
    y,m
    为每个像声源坐标的x坐标和y坐标的偏差,由步骤s3计算的像声源坐标的偏差得到;s5.2计算声学反射边界方程线性参数的修正值其中,是声学反射边界方程的线性参数的修正值,参数θ、a、ψ由步骤s4
    步计算得到。4.如权利要求1所述的房间声学反射边界测量方法,其特征在于,步骤s1的具体过程为:s1.1生成编码信号和解码信号;s1.2将生成的编码信号同时馈给所有扬声器进行播放;s1.3使用传声器阵列接收扬声器阵列播放的信号,获得测量信号;s1.4计算每个传声器得到的测量信号和解码信号的周期互相关,得到每个扬声器相对每个传声器的房间脉冲响应。5.如权利要求1所述的房间声学反射边界测量方法,其特征在于,步骤s2的具体过程为:s2.1根据测量得到的房间脉冲响应,提取房间脉冲响应的首次反射声信号;s2.2计算任意两个首次反射声信号之间的广义互相关函数;s2.3获取该广义互相关函数的最大值所对应的时延值,该时延值即为所计算的两个首次反射声信号的tdoa值;s2.4对所有不重复的首次反射声信号的两两组合重复上述s2.1-s2.3操作,得到所有首次反射声信号组合的tdoa值。

    技术总结
    本发明涉及一种房间声学反射边界测量方法。测量每个扬声器相对每个传声器的房间脉冲响应;计算首次反射声信号的TDOA值;计算像声源坐标以及坐标的偏差和协方差矩阵;根据像声源坐标以及坐标的偏差和协方差矩阵,计算声学反射边界的位置;其中,根据所有首次反射声信号组合的TDOA值中,提取出任意一个扬声器相对于任意两个传声器的首次反射声信号的TDOA值的所有组合;计算该扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵;对每一个扬声器进行上述操作,得到所有扬声器的像声源坐标以及像声源坐标的偏差和协方差矩阵。本发明定位精度高、计算量小,可以进行实时定位。可以进行实时定位。可以进行实时定位。


    技术研发人员:沈勇 许凡 申雨晨
    受保护的技术使用者:南京大学
    技术研发日:2020.11.23
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-18641.html

    最新回复(0)