智能二维相位展开系统、应用、其训练及数据集构建方法

    专利查询2023-08-18  150



    1.本发明属于测量技术领域,更具体地,涉及一种智能二维相位展开系统、应用、其训练及数据集构建方法。


    背景技术:

    2.二维相位展开问题经常出现在各类测量技术中,如光学干涉测量、雷达干涉测量、磁共振成像以及条纹投影轮廓术(fpp)。这些方法得到的信号通常使用复指数的形式来表示,并使用反正切函数得到包裹的相位。通过反正切函数得到的包裹相位值被限制在(-π,π]的范围内,丢失了原相位的一部分信息。二维相位展开需要基于已知的包裹相位图来推断其原相位图。在对相位没有约束的情况下,这个问题是不适定的,主要原因是数据变化导致解的稳定性较差;在对原相位增加连续性的约束条件下,该问题变成了一个非常容易求解的适定问题。但是在实际应用中,相位的模态是无穷的,噪声、采样不足、相位突变等因素都会让相位失去连续性。因此,在现实场景中进行相位展开仍然是一个具有挑战性的不适定问题。为解决这一问题,人们提出了许多方法,主要有路径依赖的方法、路径无关的方法和基于深度学习的方法。
    3.对于路径依赖的方法,其总体思路是沿着某一路径进行积分从而对局部进行相位展开。常用的方法有枝切法(bc)、质量图导向法(qgpu)、最小不连续法(md)、非连续路径可靠性排序算法(srncp)等,这几种方法分别采取了不同的积分路径选择策略。路径依赖的方法在噪声较低的情况下通常有很好的展开结果,但是在噪声较高的情况下存在路径积分不一致的问题,从而导致一些点展开错误。而且某些点的错误会沿着一定的路径进行扩散,从而导致一块区域相位展开错误。一般来说,该类方法效率较高,但是其最大的缺点是对噪声缺乏鲁棒性。
    4.对于路径无关的方法,通常是将相位展开问题转换成全局的优化问题。其中,最常用的有最小二乘(ls)法和基于强度传输方程(tie)的方法,两者都是为了求解离散的泊松方程。ls法对噪声具有一定鲁棒性,但是其展开的相位过于平滑,求解效率也相对较低。在包裹相位存在噪声的情况下,使用ls法进行相位展开得到的相位图存在全局误差。guo等人对ls方法进行改进缓解了最小二乘法相位展开结果存在全局误差的问题。zhao等人的研究表明基于tie的迭代方法鲁棒性要优于迭代的ls方法,但是全局误差的问题依然存在。
    5.近几年深度学习的发展促进了诸多领域的进步。卷积神经网络(cnn)在解决计算机视觉的各类问题中超越了很多传统方法,尤其是在解决计算机视觉领域各种不适定问题中展现出传统方法不具备的能力。例如在图像分割、图像去噪、图像生成、图像修复、超分辨率等像素级别的问题,基于cnn的方法已经超过所有传统方法。相位展开也可以看作是一个图像到图像的映射问题,所以cnn也顺理成章地被应用在相位展开问题中并展现出强大的潜力。spoorthi等人最早将相位展开问题转化为图像语义分割问题,也就是将相位展开过程中的包裹数(wrap-count)矩阵作为语义分割的目标,并提出了一个结构相对简单的phasenet和基于合并互补信息的后处理方法。使用带有噪声的混合高斯模拟的相位数据集
    对phasenet进行训练后,利用该方法得到的相位展开结果远远优于qgpu和srncp。dardikman等人使用只包含卷积层的残差神经网络(resnet)模型来对包含陡峭空间梯度的包裹相位进行相位展开。zhang等人提出了卷积去噪分割网络进行相位展开,先使用去噪网络对包裹相位进行去噪,然后将去噪后的包裹相位送入分割网络,对分割结构进行后处理得到原相位。由于deeplabv3+在语义分割领域表现较好,zhang等人将其用来进行相位展开并获得了不错的效果。但是,如果只使用deeplabv3+进行分割而不进行后处理,最终的展开效果则会变差。wang等人利用u-net和残差块组成的网络进行鲁棒的单步相位展开。和论文不同的是,该方法直接使用u-net学习包裹相位到展开相位的映射。虽然在抗噪声和抗混叠方面优于传统方法,但是该方法需要庞大的数据集进行训练。wu等人提出了残差编解码网络(redn)来进行相位展开,redn有一个编码器解码器分支和一个高分辨率的残差分支,两个分支之间逐步进行信息融合,其在光学相干断层成像的应用中表现优于之前的深度学习方法。最近,spoorthi等人提出了phasenet2.0,设计了基于稠密块的卷积网络进行相位展开,该网络使用复合损失函数训练缓解了类别不平衡问题。phasenet2.0在相位图噪声极高的情况下取得了明显优于phasenet的结果,并且在对真实的三维模型进行相位展开中表现良好。
    6.虽然目前基于深度学习的相位展开方法都已经优于传统方法,但作为数据驱动的方法,数据、训练过程和模型有同样重要的地位。从模型结构、数据集以及训练这三个角度来看,我们认为现有的基于深度学习的二维相位展开方法仍然面临如下挑战:
    7.缺乏学习相对位置关系和非局部相关性的能力。在相位展开中,某个位置的包裹数通常依赖于其他区域。但是,cnn的感受野通常只能由局部逐渐扩大,若cnn的感受野不够大,则无法捕获某些非局部的依赖关系。虽然下采样和更多的卷积层可以扩大感受野,但是卷积的平移不变性导致cnn缺乏对相对位置的建模能力。
    8.在数据集较小时性能较差。当前使用深度学习来进行相位展开的方法通常使用了10k量级的数据进行训练。虽然大的数据集有利于模型学习更加泛化的特征,但是也说明了现有方法在少样本情况下学习能力不足。
    9.在实际情况中,相位的高度分布总是不均匀的,这导致了类别不平衡的问题。在这种情况下训练的网络通常存在整体错误率较低,但对某些样本少的类别错误率较高的现象。这会对整体的相位展开精度造成严重的影响。


    技术实现要素:

    10.针对现有技术的以上缺陷或改进需求,本发明提供了一种智能二维相位展开系统、应用、其训练及数据集构建方法,其目的在于采用对称的编码器和解码器构成的语义分割模块对二维相位进行语义分割,并对分割后的区域进行相位包裹数预测,从而将二维相位进行展开,对噪声较强的二维相位数据有着良好的准确度,由此解决现有技术在将二维相位展开方法应用于测量技术时,由于数据噪声较强导致的准确性不高的技术问题。
    11.为实现上述目的,按照本发明的一个方面,提供了一种智能二维相位展开系统,其包括语义分割模块、相位合成模块;
    12.所述语义分割模块,用于将输入的包裹相位,并对包裹相位进行语义分割为不同的区域,并对所述区域进行分类获得每个像素的包裹数,并提交给相位合成模块;所述语义
    分割模块,包括相连的编码器和解码器;所述编码器和解码器具有对称的结构;
    13.所述相位合成模块,用于将每个像素的包裹数乘以2π后与输入的包裹相位合成为相位的展开。
    14.优选地,所述智能二维相位展开系统,其所述编码器,用于使得特征图收缩,包括多个残差块和最大池化层组成的特征图收缩单元,所述多个特征图收缩单元级联;所述解码器,用于使得收缩的特征图扩大,包括多个转置卷积层和srb层组成的特征图扩大单元,所述多个特征图扩大单元级联。
    15.优选地,所述智能二维相位展开系统,其所述编码器的残差块输出的特征图,还与所述解码器中相应残差块输出的下采样之后的大小相同的特征图在通道上合并。
    16.优选地,所述智能二维相位展开系统,其所述编码器的输入端和解码器的输出端通过边缘增强块相连。
    17.优选地,所述智能二维相位展开系统,其所述编码器和解码器之间采用瓶颈相连;所述瓶颈,包括相连的残差块、多尺度融合块、和/或空间自注意力层。
    18.优选地,所述智能二维相位展开系统,其所述空间自注意力层,以特征图为输入,将特征图卷积后进行线性变换,得到锐化特征图;将锐化特征图与其转置图进行张量积,采用softmax函数处理为空间注意力矩阵,与锐化特征图进行张量积后进行线性变换与输入的特征图按像素相加后输出。
    19.优选地,所述智能二维相位展开系统,其所述边缘增强块,包括卷积层和线性变换层;所述线性变换层采用的线性变换函数为:
    20.o=r
    ·
    conv(ψ,kc)+b
    21.其中o为边缘增强模块的输出;r和b分别为可学习的比例参数和偏置参数,conv(ψ,kc)表示使用kc作为卷积核对包裹相位ψ进行卷积。
    22.优选地,所述智能二维相位展开系统,其所述残差块,包括多个依次相连的卷积层、bn层和激活层;所述激活层优选采用leakyrelu激活函数;优选首个依次相连的卷积层、bn层和激活层之后,每一层卷积层之前具有分支通道和相邻的bn层的输出相加。
    23.按照本发明的另一个方面,提供了一种所述的智能二维相位展开系统的训练方法,其包括以下步骤:
    24.构建数据集,所述数据集包括用作输出监督的未包裹相位,以及训练输入的包裹相位;所述未包裹相位优选包括连续相位和非连续相位;所述连续相位采用多个具有二维高斯分布叠加并加入噪声叠加生成;所述非连续相位,采用连续相位和随机数量的随机大小的矩形区域相位值置零获得,以模拟相位跳变;所述包裹相位,为未包裹相位使用反正切函数进行包裹得到;
    25.采用加权交叉熵损失作为损失函数,进行训练。
    26.优选地,所述智能二维相位展开系统的训练方法,其训练时,采用带动量的随机梯度下降算法作为优化器。
    27.按照本发明的另一个方面,提供了一种智能二维相位展开系统训练用数据集构建方法,其包括以下步骤:
    28.叠加多个二维高斯分布及高斯噪声生成未包裹的相位图像,作为连续相位类型的输出监督;叠加多个二维高斯分布及高斯噪声并将随机大小和个数的矩形区域的相位值置
    为零生成未包裹的相位图像,作为非连续相位类型的输出监督;
    29.将监督输出进行反正切函数运算后得到包裹相位图像,作为训练输入;
    30.将训练输入和相应输出监督组合为智能二维相位展开系统训练用数据集。
    31.按照本发明的另一个方面,提供了所述的智能二维相位展开系统的应用,其应用于测量,包括以下步骤:
    32.(1)获取以二维相位进行记录的测量数据;所述测量数据为采用复指数形式记录并采用反正切函数得到包裹的二维相位,例如光学干涉、雷达干涉、核磁共振成像、或条纹投影轮廓技术;
    33.(2)将步骤(1)获取的二维相位输入到所述智能二维相位展开系统,获得相位的展开;
    34.(3)根据步骤(2)获得的相位的展开,得到测量值。
    35.总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
    36.本发明提供了一种智能的二维相位展开系统及方法,采用对称的编解码器结构是由于对称的结构在相位展开任务上的表现优于其他网络结构。优选方案,使用更加密集的跳跃连接残差块作为网络的基础特征提取块,可以在不增加参数量的情况下使网络的特征表达能力大幅提升。针对相位展开任务,我们在网络中加入多尺度融合块、空间自注意力层以及边缘增强块来针对性地增强其性能。在实验部分,与两种优秀的传统方法和五种基于深度学习的方法相比,我们的方法有更高的精度和更强的鲁棒性,并且对不连续的相位也有较好的效果。最后的消融实验表明,多尺度融合块、空间自注意力层以及在相位连续条件下的边缘增强块可以有效提升网络性能。
    附图说明
    37.图1是本发明提供的智能二维相位展开系统结构示意图;
    38.图2是本发明提供的语义分割模块结构示意图;
    39.图3是本发明采用的模块细节结构图;
    40.图4是本发明实施例构建的数据集示意图;
    41.图5是本发明实施例对数据集的统计结果图;
    42.图6是本发明实施例消融实验结果图。
    具体实施方式
    43.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
    44.本发明提供的智能二维相位展开系统,包括语义分割模块、相位合成模块;
    45.所述语义分割模块,用于将输入的包裹相位,并对包裹相位进行语义分割为不同的区域,并对所述区域进行分类获得每个像素的包裹数,并提交给相位合成模块;所述包裹相位,为测量技术获得的经反正切函数包裹的二维相位;区域中的像素以其具有的包裹数
    进行分类;
    46.所述语义分割模块,包括相连的编码器和解码器,所述编码器和解码器之间采用瓶颈相连;所述编码器和解码器具有对称的结构,采用对称的编解码器结构是由于对称的结构在相位展开任务上的表现优于其他结构。
    47.所述编码器,用于使得特征图收缩,优选包括多个残差块和最大池化层组成的特征图收缩单元,所述多个特征图收缩单元级联;综合考虑提取特征的丰富程度和模型复杂度,一般1-10个特征图收缩单元级联,优选4个特征图收缩单元级联。
    48.所述解码器,用于使得收缩的特征图扩大,优选包括多个转置卷积层和srb(serried residual blocks)层组成的特征图扩大单元,所述多个特征图扩大单元级联;
    49.所述瓶颈,包括依次相连的残差块(serried residual blocks,srb)、多尺度融合块aspp(atrous spatial pyramid pooling)层、以及空间自注意力层(positional self-attention,psa);所述aspp层用于提取个尺度的特征图信息并融合,可以同时捕获大尺度空间语义特征和小尺度的细节特征并进行融合,让解码器可以有更丰富的特征可以利用;所述空间自注意力层用于增强空间维度中的有用信息并减弱无用信息的权重;
    50.所述编码器的残差块输出的特征图,还与所述解码器中相应残差块输出的下采样之后的大小相同的特征图在通道上合并;
    51.所述编码器的输入端和解码器的输出端通过边缘增强块相连;所述边缘增强块(edge reinforce block,erb),用于将边缘信息显式地引入,以增强每个类别域的边界,进一步提高图像中每个像素的分类精度。
    52.所述残差块(srb),包括多个依次相连的卷积层、bn层和激活层;优选包括1至10个,优选4个依次相连的卷积层、bn层和激活层;所述卷积层优选3
    ×
    3至5
    ×
    5的卷积;所述激活层优选采用leakyrelu激活函数,避免了特征丢失,在一定程度上避免了网络退化,实验显示相对于tanh和sigmoid激活函数,leakyrelu可以避免梯度爆炸和梯度消失,相对于relu函数,leakyrelu避免了网络在训练过程中出现梯度一直为零的权重,增加了网络的拟合能力;首个依次相连的卷积层、bn层和激活层之后,每一层卷积层之前具有分支通道并和激活层的输出相加,使得本发明的残差块相比传统的残差块,具有更加密集的跳跃连接,不仅有利于梯度的反向传播而且增加了特征流动的路径数量,提高了特征的丰富程度。另一方面,加入批量归一化使得训练更稳定且速度更快,对网络泛化能力也有一定帮助。
    53.所述空间自注意力层,以特征图为输入,将特征图卷积后进行线性变换,得到锐化特征图;将锐化特征图与其转置图进行张量积,采用softmax函数处理为空间注意力矩阵,与锐化特征图进行张量积后进行线性变换与输入的特征图按像素相加后输出;自注意力层的输入为特征图,特征图中特征的值越大代表这个特征越重要。空间注意力矩阵反映了空间中每个位置的特征相对于其他位置的重要程度,将其作为权重用来加强重要的特征,从而提高网络的精度。
    54.所述边缘增强块,包括卷积层和线性变换层;所述线性变换层采用的线性变换函数为:
    55.o=r
    ·
    conv(ψ,kc)+b
    56.其中o为边缘增强模块的输出;r和b分别为可学习的比例参数和偏置参数,conv(ψ,kc)表示使用kc作为卷积核对包裹相位ψ进行卷积。所述边缘增强模块得到的边缘信息
    会被添加在分类输出层之前的特征图中,显式地将包裹的边缘信息附加在分类输出层,从而提高对包裹边缘像素的分类正确率。
    57.所述相位合成模块,用于将每个像素的包裹数乘以2π后与输入的包裹相位合成为相位的展开。
    58.本发明提供的智能二维相位展开系统的训练方法,包括以下步骤:
    59.构建数据集,所述数据集包括用作输出监督的未包裹相位,以及训练输入的包裹相位;所述未包裹相位包括连续相位和非连续相位;所述连续相位采用多个具有不同均值和方差的二维高斯分布叠加并加入不同程度的噪声叠加生成;所述非连续相位,采用连续相位和随机数量的随机大小的矩形区域相位值置零获得,以模拟相位跳变;所述包裹相位,为未包裹相位使用反正切函数进行包裹得到;
    60.采用加权交叉熵损失作为损失函数,进行训练,以缓解类别不平衡带来的数量较少的样本类别分类正确率明显较低的问题;
    61.所述加权交叉熵损失写作:
    [0062][0063]
    其中,wc为类别c的权重,将该类别像素数的占比的倒数作为该类别的权重,n为像素的包裹数,像素以其具有的包裹数进行分类,分为n个类别;表示样本i的每个像素的分类类别c与其真实类别是否符合,当样本i在(x,y)处的像素属于类别c时,y
    ic
    (x,y)为1,否则为0;p
    ic
    样本i的每个像素属于类别c的预测概率,b为训练时的批量大小。分配权重以有效平衡所有类别的损失值,从而可以增加对少数类别像素分类的正确率。
    [0064]
    优选训练时,采用带动量的随机梯度下降算法(sgdm)作为优化器,以使模型具备更强的泛化能力。
    [0065]
    本发明提供的智能二维相位展开系统训练用数据集构建方法,包括以下步骤:
    [0066]
    叠加多个二维高斯分布及高斯噪声生成未包裹的相位图像,作为连续相位类型的输出监督;所述多个二维高斯分布具有不同的均值和方差,优选:
    [0067]
    叠加多个二维高斯分布及高斯噪声并将随机大小和个数的矩形区域的相位值置为零生成未包裹的相位图像,作为非连续相位类型的输出监督;
    [0068]
    将监督输出进行反正切函数运算后得到包裹相位图像,作为训练输入;
    [0069]
    将训练输入和相应输出监督组合为智能二维相位展开系统训练用数据集。
    [0070]
    本发明提供的测量方法,包括以下步骤:
    [0071]
    (1)获取以二维相位进行记录的测量数据;所述测量数据为采用复指数形式记录并采用反正切函数得到包裹的二维相位,例如光学干涉、雷达干涉、核磁共振成像、或条纹投影轮廓技术;
    [0072]
    (2)将步骤(1)获取的二维相位输入到本发明提供的二维相位展开系统,获得相位的展开;
    [0073]
    (3)根据步骤(2)获得的相位的展开,得到测量值,具体根据二维相位数据类型进行变换得到测量值;例如,条纹投影轮廓术需要利用相位-高度变换公式得到最终的表面高度。。
    [0074]
    以下为实施例:
    [0075]
    二维相位展开是指从被包裹的二维相位中恢复原相位的过程,可以认为这是对未包裹相位被进行包裹的逆过程。首先对相位包裹的过程进行分析。
    [0076]
    通常在各类测量应用中,我们会以公式(1)中的形式得到一个尺寸为h
    ×
    w的复数矩阵p:
    [0077]
    p(x,y)=e
    jφ(x,y)
    =cos(φ(x,y))+jsin(φ(x,y))
    ꢀꢀꢀꢀ
    (1)
    [0078]
    其中(x,y)为像素的坐标且x∈[1,h],y∈[1,w],φ为未包裹的二维相位。值得一提的是,由于三角函数的周期性,在φ的值域大于一定范围时,公式(1)所表示的函数是不可逆的。进一步来说,我们一般会使用反正切函数来获得复数场的相位ψ:
    [0079][0080]
    其中ψ(x,y)为(x,y)处的包裹相位,arctan2(
    ·
    )为四象限反正切,其值域为(-π,π],因此包裹相位ψ的值域为(-π,π]。我们将包裹操作记为wrap(
    ·
    )。公式(1)和公式(2)的共同作用导致相位被包裹,包裹相位丢失了原有相位的一部分信息使得相位包裹过程是不可逆的。
    [0081]
    虽然相位展开问题是不适定的,但是该问题在一定的假设条件的约束下是可以求解的。首先,我们将相位展开问题公式化。由公式(2)可知,未包裹相位φ和包裹相位ψ之间存在2π的整数倍的差值,即:
    [0082]
    φ(x,y)=ψ(x,y)+2πk(x,y)
    ꢀꢀꢀꢀꢀꢀꢀꢀ
    (3)
    [0083]
    其中k(x,y)为(x,y)处的包裹数(wrap-count)代表包裹相位和原相位差值除以2π的整数值。在只知道包裹相位ψ的情况下,只要求出包裹数矩阵k即可得到未包裹相位φ。求解k的过程可以解释为根据ψ提供的信息来推断k,即:
    [0084][0085]
    其中,代表相位展开方法,为相位展开方法的集合,为相位展开方法求解得到的包裹数。由公式(4)可知,的结果由ψ和f共同决定。在ψ固定的情况下,f决定了和k的接近程度。我们的目的是为了创造一个最优的相位展开方法f
    *
    使得尽可能地接近k,即:
    [0086][0087]
    其中m(
    ·

    ·
    )表示某种距离度量。
    [0088]
    在理想情况下,我们假设相位φ是连续的,这是一个很强的先验,此时的包裹相位ψ满足itoh条件并且可以直接按行(列)进行相位展开。但在实际情况中,ψ包含的先验信息因噪声和φ的不连续性的影响而减少。为了能具体分析先验信息的作用,在本文中我们定义先验信息如下:
    [0089]
    定义为ψ中包含的先验信息的数量。i
    ψ
    可以通过公式i
    ψ
    =g(ψ)计算得到,函数的定义如下:
    [0090][0091]
    其中,exp(
    ·
    )为以e为底的指数函数,为残点指示矩阵,其定义如下:
    [0092][0093]
    其中q(x,y)的值可以指示位置(x,y)处是否为残点[9],q(x,y)通过下式进行计算:
    [0094]
    q(x,y)=wrap[ψ(x+1,y)-ψ(x,y)]+wrap[ψ(x+1,y+1)-ψ(x+1,y)]-wrap[ψ(x+1,y+1)-ψ(x,y+1)]-wrap[ψ(x,y+1)-ψ(x,y)]
    ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
    8)
    [0095]
    其中wrap(
    ·
    )为公式(2)定义的包裹操作。
    [0096]
    可知:i
    ψ
    ∈[0,1],ψ中的残点越少,先验信息i
    ψ
    越大。当i
    ψ
    =1时,ψ中所有点都符合itoh条件,可以直接按行(列)进行相位展开;当i
    ψ
    接近0时,所有传统方法都无法使用。换句话说,先验信息i
    ψ
    反映了ψ中所有相位点整体违反itoh条件的程度。对于相位展开问题,i
    ψ
    是影响相位展开精度的重要因素之一。传统相位展开方法只能利用ψ中有限的先验信息(如残点或质量图),并以固定的规则进行展开。所以在噪声较大时,i
    ψ
    较小,传统的相位展开方法性能较差。而深度学习的方法通过训练学习到了相位展开的规则和大量的先验信息。在预测时,它通过训练学习到大量先验知识指导相位展开,从而可以对噪声有更强的鲁棒性。
    [0097]
    本实施例提供的智能二维相位展开系统,如图1所示,其输入为包裹相位,输出为展开的相位。其中,被包裹相位作为智能二维相位展开系统的输入,智能二维相位展开系统实现了语义分割的功能,将包裹相位分割为不同的区域并分类。自然地,智能二维相位展开系统的输出为每个像素的类别,不同的类别代表不同包裹数。智能二维相位展开系统经过大量样本的训练后就可以用来预测包裹相位展开所需的包裹数。最后,智能二维相位展开系统预测的包裹数乘以2π后再加上包裹相位得到展开的相位。
    [0098]
    智能二维相位展开系统包括语义分割模块、相位合成模块;
    [0099]
    所述语义分割模块,用于将输入的包裹相位,并对包裹相位进行语义分割为不同的区域,并对所述区域进行分类获得每个像素的包裹数,并提交给相位合成模块;所述包裹相位,为测量技术获得的经反正切函数包裹的二维相位;像素以其具有的包裹数进行分类;
    [0100]
    所述语义分割模块,其结构如图2所示,包括相连的编码器和解码器,所述编码器和解码器之间采用瓶颈相连;所述编码器和解码器具有对称的结构;
    [0101]
    所述编码器,用于使得特征图收缩,包括多个残差块和最大池化层组成的特征图收缩单元,所述多个特征图收缩单元级联;图2中,特征图不断收缩的部分被称为编码器,本实施例其由四个残差块(srb)和最大池化层交替组成。
    [0102]
    所述解码器,用于使得收缩的特征图扩大,包括多个转置卷积层和srb层组成的特征图扩大单元,所述多个特征图扩大单元级联;图2中,特征图不断扩大的部分被称为解码器,本实施例由四个转置卷积和srb交替组成。
    [0103]
    所述瓶颈,包括依次相连的残差块(srb)、aspp层、以及空间自注意力层(psa层);所述aspp层用于提取多个尺度的特征图信息并融合,可以同时捕获大尺度空间语义特征和小尺度的细节特征并进行融合,让解码器可以有更丰富的特征可以利用;所述空间自注意力层用于增强空间维度中的有用信息并减弱无用信息的权重;图2中,本实施例在编码器和解码器之间的称为瓶颈的部分包含一个srb、aspp以及psa。瓶颈模块中特征图的尺寸是整个网络中最小的并且其包含的特征也是最抽象的。为了能获得尽量大的感受野并保持原有的信息不丢失,我们借鉴了deeplab中的aspp结构来提取各个尺度的信息并融合。psa可以有效地增强空间维度中的有用信息并减弱无用信息的权重,因此我们将该模块添加到aspp之后达到对融合信息的进一步筛选。除此以外,本实施例所设计的语义分割模块,具有边缘增强和自注意力增强的特点,命名为边缘增强自注意力网络eesanet(edge-enhanced self-attention network)还包含一个连接输入图像和解码器输出的额外支路,该分支包含一个边缘增强块(edge reinforce block,erb),其输出最终和解码器输出在通道方向合并之后连接分类输出层。最后的分类输出层为通道数为16的1
    ×
    1卷积层,并使用softmax激活函数。
    [0104]
    所述编码器的输入端和解码器的输出端通过边缘增强块相连;所述边缘增强块(erb),每个残差块输出的特征图都需要额外引出一个分支和解码器中下采样之后大小相同的特征图在通道上合并,这样可以让解码器融合编码器端在不同尺度下的信息作为细节补充。
    [0105]
    所述残差块(srb),如图3(a)所示,分别包含四个卷积层、bn层和leakyrelu层,连接的顺序依次为:卷积、bn、leakyrelu。srb采用了更加密集的跳跃连接,除了第一层用于通道变换的3
    ×
    3卷积外,在之后每一层卷积之前都会分出一条支路和相邻bn层的输出相加。
    [0106]
    所述空间自注意力层(psa),如图3(b),输入特征图和输出特征图有相同的大小(h为高度,w为宽度,n为通道数)。将输入x分成四个支路,其中三个支路分别经过通道为n的1
    ×
    1卷积层进行线性变换后得到特征图b、c和d,其中将b、c和d重塑为的大小并将b进行转置后与c进行张量积,之后使用softmax来处理张量积的结果得到空间注意力矩阵
    [0107][0108]
    其中s
    ij
    为空间中第i个位置对第j个位置的影响(i,j=1,2,...,hw)。ci为c的第i行向量,为b的转置第j列向量。exp(
    ·
    )为以e为底的指数函数。同时,将s和重塑后的d进行张量积后得到的张量大小为将该结果重塑为的大小并乘以一个尺度参数α,之后再和原特征图按元素相加得到输出整个过程如下:
    [0109]
    z=α
    ·
    reshape(s
    ·
    d,{h,w,n})+x
    ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
    (11)
    [0110]
    其中α是一个可学习的参数,这里我们将其初始值设为0.1。reshape(a,{
    ·
    })表示将张量a重塑为{
    ·
    }的形状。
    [0111]
    本实施例多尺度融合块(aspp),其结构如图3(c)所示,输入特征图分为五个支路,其中一个支路经过1
    ×
    1的卷积层。另外三条支路分别经过扩张率分别为3、5、8的3
    ×
    3的扩张卷积层。最后一条支路先进行全局平均池化,再经过1
    ×
    1的卷积层后上采样(双线性插值)到原特征图大小。将五个支路输出的特征图在通道维度合并再经过一个1
    ×
    1的卷积层将通道数压缩到和输入特征图相同的数量。aspp结构可以同时捕获大尺度空间语义特征和小尺度的细节特征并进行融合,让解码器可以有更丰富的特征可以利用。
    [0112]
    所述边缘增强块,通过对包裹相位进行某种运算得到质量图并在质量图的指导下对像素进行分类。其结构如图3(d)所示,其输入是通道数为1的包裹相位图,经过一个通道数为1的固定参数的3
    ×
    3卷积后再对特征图整体进行线性变换,表示如下:
    [0113]
    o=r
    ·
    conv(ψ,kc)+b
    ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
    (12)
    [0114]
    其中o为erb模块的输出。r和b分别为可学习的比例参数和偏置参数,在训练之前分别初始化为1和0。conv(ψ,kc)表示使用kc作为卷积核对包裹相位ψ进行卷积。为了利用erb模块获得包裹相位的边缘信息,这里选择图像处理中常用的laplacian作为卷积核。erb得到的边缘信息会被添加在分类输出层之前的特征图中,显式地将包裹的边缘信息附加在分类输出层。
    [0115]
    每个残差模块和转置卷积的通道数取决于参数c,第一个残差块中每个卷积层的输出通道数为c,之后每经过最大池化层通道数翻倍,每经过转置卷积层通道数减半。同时第一个转置卷积层通道数为8c,之后每一层的通道数都减半。为了兼顾运行效率和精度,c被设定为48。
    [0116]
    所述相位合成模块,用于将每个像素的包裹数乘以2π后与输入的包裹相位合成为相位的展开。
    [0117]
    本发明提供的智能二维相位展开系统的训练方法,包括以下步骤:
    [0118]
    构建数据集:
    [0119]
    一般基于深度学习的方法都需要大量的数据对进行训练,要在实际的测量中获得大量的包裹相位和未包裹相位数据对是非常困难的。因此我们需要通过生成的方式来构建数据集。由于相位展开是相位包裹式的逆过程,根据公式(1)和公式(2)可以对任意的相位进行包裹操作,这样可以帮助我们生成训练所需的大量数据对。
    [0120]
    我们构建的数据集分为连续相位和非连续相位两类:如图4(a)所示,连续相位我们使用不同均值和方差的多个二维高斯分布叠加生成相位图像(h
    ×
    w:256
    ×
    256像素,相位在0rad到100rad的范围内),并且在未包裹相位中加入不同程度高斯噪声。如图4(d)所示,不连续相位是在连续相位的基础上将随机大小和个数的矩形区域的相位值置为零,以模拟相位跳变。将生成的相位数据带入公式(1)和公式(2)得到包裹相位,如图4(b)和4(e)所示。为了能训练像素分类网络,我们进一步使用生成的相位和包裹相位来计算得到包裹数k:
    [0121][0122]
    其中round(
    ·
    )表示向最接近的整数取整。图4(c)和4(f)展示了对应的包裹数图,不同颜色的区域代表不同的包裹数对应的类别。由于模拟的相位值动态范围为0rad到100rad,所以包裹数的值为0到15,即包裹数有16个类别。将包裹相位作为输入数据,包裹数作为输出数据,两者组合起来作为数据集的一对样本。
    [0123]
    为了更全面地验证我们提出的网络的性能,我们生成了不同特性的多个数据集。首先,我们生成信噪比为0db,3db,5db,10db和100db的第一类数据各1000个样本,并分别命名为wpdc0,wpdc3,wpdc5,wpdc10,wpdc100;随机生成0db到15db的第一类数据5000个样本并命名为wpdca。随机生成0db到15db的第二类数据10000个样本并命名为wpdcs。所有的数据集分别按0.8、0.1、0.1的比例划分训练集、验证集以及测试集。为了能更清楚地描述我们生成的数据集,我们将每个数据集的详细情况列在了表格1中。值得一提的是,由于本文提出的模型是分类模型,包裹数数据需要进行独热编码。
    [0124]
    表1.生成的数据集列表
    [0125][0126]
    现在已经公开发表的phasenet等方法使用二维高斯分布函数叠加生成未包裹的相位图,本发明也采用了类似的方法。除此以外,本发明在叠加多个二维高斯分布及高斯噪声的基础上并将随机大小和个数的矩形区域的相位值置为零生成未包裹的相位图,作为非连续相位的输出监督。非连续相位丰富了相位数据的分布,从而可以使训练的模型有更强的实用性。将输出的监督数据进行包裹函数运算得到包裹相位,作为训练输入。将训练输入和相应输出监督组合为智能二维相位展开系统训练用数据集样本。
    [0127]
    如图5所示,我们对所使用数据集的所有相位的真实类别进行了统计。可以明显地看出各个类别的比例是严重不平衡的,某一些类别的数量甚至是最少类别的百倍以上。为了缓解类别不平衡,该网络在训练阶段的损失函数使用加权交叉熵损失
    [0128][0129]
    其中,wc为类别c的权重;表示样本i的每个像素的真实类别,例如,当样本i在(x,y)处的像素属于类别c时,y
    ic
    (x,y)为1,否则为0;表示样本i的每个像素属于类别c的预测概率;b为训练时的批量大小。权重wc根据需要数据集来确定,在本文中我们对数据集所有图像每个像素的类别进行统计,将某一类别像素数的占比的倒数作为该类别的权重:
    [0130][0131]
    其中ωc∈[0,1]是所有类别为c的像素占总像素数的比例。在计算损失时,按照公式(12)分配的权重可以有效平衡所有类别的损失值,从而可以增加对少数类别像素分类的正确率。但是因为ωc的值取决于数据集,因此在训练中使用一个更大而且更加符合实际情况的数据集可以得到更好的结果。
    [0132]
    在训练开始之前,我们对所有卷积层参数进行初始化。在训练阶段,我们使用带动
    量的随机梯度下降算法(sgdm)作为优化器,因为在low-level的视觉任务上,使用sgdm比使用adam训练出来的网络有更强的泛化性能。其中,动量为0.9,初始学习率为0.02,训练的批量大小为10。针对不同样本数量的数据集,我们设置了不同的最大迭代次数。其中,wpdc0到wpdc100这五个包含1000对样本的数据集训练400epochs,数据集wpdca训练150epochs,数据集wpdcs训练75epochs。具体的训练集和测试集划分规则在第2.2节中给出。网络的输入为256
    ×
    256单通道包裹相位图像,输出为h
    ×w×
    class:256
    ×
    256
    ×
    16的独热编码分类数据。为了避免精度损失对结果造成过大的影响,我们将包裹图像数据使用16bit编码进行保存而不是常用灰度图像的8bit编码。由于卷积网络在空间共享参数的特性,在预测阶段输入图像的大小是可变的。但是由于卷积层深度、上/下采样以及aspp等结构的参数是固定的,在预测阶段输入图像的尺寸过大或过小都会引起性能的下降。
    [0133]
    我们提出的网络结构在基于matlab 2020b的deep learning toolbox中实现。网络的训练和测试均在一台cpu为intel xeno e5-2678,内存128gb,gpu为nvidia geforce gtx 1080ti的工作站上进行。
    [0134]
    本实施例中实现的相位展开系统与现有的相位展开方法进行了对比测试,用于对比的相位展开方法包括:srncp、tiepu、phasenet、deeplabv3+、dlpu、redn以及phasenet2.0。其中,srncp是路径依赖的方法,tiepu是路径无关的方法,其余均为深度学习的方法。
    [0135]
    对比了不同的网络结构在相位展开任务上的性能,结果现实具有对称结构的编码器和解码器具有更小的均方根误差(rmse)和更小的预测单个样本的运算量(#flops),从而具有优良的预测性能。在不同水平高斯噪声下进行实验使用含有不同水平的高斯噪声的包裹相位来对各个相位展开算法进行抗噪性能分析,结果显示在高噪声时srncp展开的相位会有大量错误,但在低噪声时则可以基本无误地进行相位展开。tiepu方法的结果中出现了整体的偏差,这是路径无关方法的特点。例如当snr=3db(i
    ψ
    =0.5713)时,虽然展开相位看上去只有零星的点出现了错误,但是整体上存在一个较大的偏差。phasenet和redn的结果有着相似的特性,它们在高噪声、相位包裹数小的情况下的展开结果要优于低噪声、相位包裹数大的情况。此外,phasenet2.0和deeplabv3+的结果具有较强的相似性,尤其是在低噪声(snr=100db,i
    ψ
    =1)时,它们展开的相位在包裹的边缘处总是出现错误。特殊的是,dlpu是直接学习包裹相位到真实相位映射的方法,所以其展开误差通常不是2π倍的跳变,而是相对连续的,并且误差分布范围较广。本发明在高噪声的情况下只会出现零星的展开错误,在低噪声的情况下几乎能无误地进行相位展开。
    [0136]
    对不连续相位进行实验:为了进一步验证所提出的方法展开不连续相位的性能,我们在有不连续相位的wpdcs数据集上进行实验。对每个方法相位展开结果的相位误差来看,srncp的结果中出现了纵向的线状的相位错误;tiepu的结果中出现了大面积的相位错误;deeplabv3+和phasenet2.0依然在包裹的边缘处出现相位错误;phasenet和redn的结果都在不连续相位的一部分边缘处出现了相位错误;dlpu的结果依然保持稳定,没有受到不连续边缘的影响;本发明的结果的误差零散地分布在相位包裹区域,在不连续的边缘并没有出现明显的误差。
    [0137]
    使用物体模型进行相位展开测试:实际物体的相位既有连续的部分也有不连续的部分,在实际的物体模型上对各个相位展开算法进行测试是非常重要的。对深度学习方法
    来说,我们必须了解所训练的网络在不同分布的新样本上的泛化能力,从而对网络的实用性进行估计。本实施例的方法是所有方法中相位展开精度最高的,尤其是对兔子模型的相位展开结果的rmse达到了0.54,是次优方法deeplabv3+的四分之一。说明本发明提供的相位展开系统及方法具有良好的泛化能力。
    [0138]
    条纹投影轮廓术中进行应用测试:条纹投影轮廓术(fpp)是一种应用广泛的主动式三维测量方法,其核心步骤是将一定规则的光栅条纹图像投影在被测物体表面,再使用图像采集设备获取投影图像并通过图像中被调制的变形条纹信息来还原被测物体的表面深度。以傅里叶轮廓术(ftp)为例,ftp通常包含包裹相位提取、相位展开、相位到高度映射三个主要步骤。由于图像有可能会有频谱混叠的现象,提取的包裹相位可能会出现间断以及条纹伪影。通过ftp得到的包裹相位有许多失真,模拟的测试结果现实本实施例提供的相位展开方法rmse为0.78,为所有测试相位展开方法中最优结果,其余较优结果为:srncp(rmse=1.22)和redn(rmse=1.10)。
    [0139]
    我们对提出的方法进行了消融研究,定量地分析组成网络的各个部分对网络性能的影响。消融实验的各个网络在不同噪声的数据集上的结果如图6所示。在高噪声水平时,去除erb的网络要优于包含erb的原网络,但是在低噪声水平时,情况则相反。这是由于erb直接产生包裹相位的边缘并直接合并到输出层之前的特征图中,在低噪声时,最终的输出层可以充分利用边缘信息,但是在高噪声时,噪声产生的严重干扰反而影响了输出层的性能。进一步去除aspp和psa的网络相比之前的两个网络在所有噪声水平下的性能都有较大的下降。这说明aspp增大感受野的能力和空间上的自注意力是有非常有效的。
    [0140]
    消融实验的各个网络在wpdca和wpdcs数据集上进行训练和测试结果在表3中给出。其中,在相位连续的wpdca数据集上的测试结果表明,有erb的网络要优于没有erb的网络,并且包含aspp和psa的网络和不包含两者的网络相差不大。在不连续的wpdcs数据集上的测试结果表明,去掉aspp和psa后误差上升大约25%。但是,在网络中包含aspp和psa基础上加入erb却让性能下降,这说明erb对不连续相位的展开有负面的影响。
    [0141]
    表2.消融实验的各个网络在wpdca和wpdcs数据集上测试的rmse
    [0142][0143]
    对于cnn来说,推理速度、分辨率敏感性以及抗噪声能力是极其重要的。首先,我们统计了基于深度学习的方法对单幅相位图像进行相位展开所需的时间并在表3中列出。提出的方法的速度比dlpu、deeplab v3+和phasenet 2.0要慢,但是要快于redn和phasenet。在分辨率为256
    ×
    256像素而且gpu为rtx 1080ti的情况下,相位展开的时间消耗为23.9ms。值得一提的是,通常cnn都是在gpu上运行,其他的传统方法由于只能在cpu上运行而没有被比较。第二,我们测试了eesanet在两种不均匀噪声的情况下的相位展开性能。结果表明在仅仅通过均匀噪声分布的样本训练的eesanet在不均匀噪声的情况下依然保持较高的精度。第三,在实际应用中获得的相位图像通常会有不同的分辨率,因此我们测试了eesanet在不同分辨率情况下的相位展开性能。结果表明当分辨率不接近256
    ×
    256像素时,网络的性能会大幅下降。然而,如果采用上采样/下采样的方式将相位图像的分辨率调整到256
    ×
    256像素时,网络的性能依然保持良好,将其结果进行对应的下采样/上采样即可恢复到原分辨率。
    [0144]
    表3在rtx 1080ti gpu上基于深度学习方法对256
    ×
    256像素的相位图像相位展开的时间
    [0145][0146]
    现有的基于深度学习的方法经过更大的数据集训练后精度和稳定性均有较大的提升。而本发明则提升量较小,说明本发明可以通过较小的样本数量就学习到不错的效果而无需大量的标注样本,从而在标注样本获取较为困难的实际情况下更具有实用性。另一方面,动态的噪声水平会使得样本多样性增强,更强的样本多样性有利于让卷积神经网络学习到更准确的归纳偏置,因此所有基于深度学习的方法性能均有提升。总体来看,本发明在不同的噪声水平下都有较好的效果,对噪声有较强的鲁棒性。
    [0147]
    实验结果表明了我们提出的方法相对于其他方法在不连续的相位展开问题上有比较明显的优势。这一优势主要得益于eesanet中的aspp和psa。psa可以以全局的感受野加强空间上的信息,从而能以全局的视野区分相位突变的边缘和包裹产生的边缘,这是我们的方法对不连续相位的展开有较好性能的原因之一。除此以外,新设计的srb也同样起到了关键的作用。一方面,更多的跳跃连接不仅有利于梯度的反向传播而且增加了特征流动的路径数量,提高了特征的丰富程度。另一方面,加入批量归一化使得训练更稳定且速度更快,对网络泛化能力也有一定帮助。值得一提的是,使用leakyrelu作为激活函数避免了特征丢失,在一定程度上避免了网络退化。
    [0148]
    本发明在对特征不同于训练集的样本进行相位展开的精度相对其他方法具有明显的优势。这说明了我们提出方法的泛化性较强,也验证了将其应用在fpp甚至其他需要相位展开的测量技术中是可行的。
    [0149]
    消融研究表明,在我们提出的网络中,aspp和psa能够给网络带来稳定的性能提升,并且erb在连续相位且噪声不严重的情况下对网络的性能有提升。aspp可以有效地增加特征图的感受野并在其中加入全局池化提供的全局信息。psa对特征图的空间维度进行加权,减小不重要的特征带来的干扰。因此,eesanet中的aspp和psa提供更加重要的全局特征。
    [0150]
    为了尽量接近实际应用中的相位分布,我们设计的数据集不可避免地存在类别不平衡的现象。在作为对照的基于深度学习的相位展开方法中,phasenet 2.0考虑了类别不平衡的问题并使用复合损失函数来缓解这一问题。我们为了缓解类别不平衡的问题采用了加权的交叉熵损失,而没有采用其他方法,例如focal loss。这主要是因为我们在使用focal loss训练时的loss不稳定,并且最终的效果也不如加权交叉熵损失。值得注意的是,权重是在训练之前对数据集进行统计得到的。当数据集的样本足够丰富且样本数量足够多时,在该权重下训练得到的网络才有较好的泛化能力。除了损失函数之外,一些卷积神经网络的训练手段以及知识蒸馏方法也可以应用在我们的网络上来进一步提升性能。
    [0151]
    利用wpdca训练本发明提供的系统并在测试集上进行预测,统计所有像素预测的类别以及其对应的真实类别得到分类矩阵。错误分类的像素主要集中于包裹数较小的情况,随着包裹数的增大,错分类的像素比例逐渐减少。但是由于存在类别不平衡的现象,随
    着包裹数逐渐增大,分类错误的可能性逐渐增大,并且错误的分类索引通常小于正确的类别索引并且只相差1。出现这种现象还是由于数据集样本类别不平衡导致的。
    [0152]
    本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

    技术特征:
    1.一种智能二维相位展开系统,其特征在于,包括语义分割模块、相位合成模块;所述语义分割模块,用于将输入的包裹相位,并对包裹相位进行语义分割为不同的区域,并对所述区域进行分类获得每个像素的包裹数,并提交给相位合成模块;所述语义分割模块,包括相连的编码器和解码器;所述编码器和解码器具有对称的结构;所述相位合成模块,用于将每个像素的包裹数乘以2π后与输入的包裹相位合成为相位的展开。2.如权利要求1所述的智能二维相位展开系统,其特征在于,所述编码器,用于使得特征图收缩,包括多个残差块和最大池化层组成的特征图收缩单元,所述多个特征图收缩单元级联;所述解码器,用于使得收缩的特征图扩大,包括多个转置卷积层和srb层组成的特征图扩大单元,所述多个特征图扩大单元级联。3.如权利要求2所述的智能二维相位展开系统,其特征在于,所述编码器的残差块输出的特征图,还与所述解码器中相应残差块输出的下采样之后的大小相同的特征图在通道上合并;优选,所述编码器的输入端和解码器的输出端通过边缘增强块相连。4.如权利要求1所述的智能二维相位展开系统,其特征在于,所述编码器和解码器之间采用瓶颈相连;所述瓶颈,包括相连的残差块、多尺度融合块、和/或空间自注意力层。5.如权利要求4所述的智能二维相位展开系统,其特征在于,所述空间自注意力层,以特征图为输入,将特征图卷积后进行线性变换,得到锐化特征图;将锐化特征图与其转置图进行张量积,采用softmax函数处理为空间注意力矩阵,与锐化特征图进行张量积后进行线性变换与输入的特征图按像素相加后输出。6.如权利要求4所述的智能二维相位展开系统,其特征在于,所述边缘增强块,包括卷积层和线性变换层;所述线性变换层采用的线性变换函数为:o=r
    ·
    conv(ψ,k
    c
    )+b其中o为边缘增强模块的输出;r和b分别为可学习的比例参数和偏置参数,conv(ψ,k
    c
    )表示使用k
    c
    作为卷积核对包裹相位ψ进行卷积。7.如权利要求1至4任意一项所述的智能二维相位展开系统,其特征在于,所述残差块,包括多个依次相连的卷积层、bn层和激活层;所述激活层优选采用leakyrelu激活函数;优选首个依次相连的卷积层、bn层和激活层之后,每一层卷积层之前具有分支通道和相邻的bn层的输出相加。8.如权利要求1至7任意一项所述的智能二维相位展开系统的应用,其特征在于,用于测量,包括以下步骤:(1)获取以二维相位进行记录的测量数据;所述测量数据为采用复指数形式记录并采用反正切函数得到包裹的二维相位,例如光学干涉、雷达干涉、核磁共振成像、或条纹投影轮廓技术;(2)将步骤(1)获取的二维相位输入到所述智能二维相位展开系统,获得相位的展开;(3)根据步骤(2)获得的相位的展开,得到测量值。9.如权利要求1至7任意一项所述的智能二维相位展开系统的训练方法,其特征在于,包括以下步骤:构建数据集,所述数据集包括用作输出监督的未包裹相位,以及训练输入的包裹相位;所述未包裹相位优选包括连续相位和非连续相位;所述连续相位采用多个二维高斯分布叠
    加并加入噪声叠加生成;所述非连续相位,采用连续相位和随机数量的随机大小的矩形区域相位值置零获得,以模拟相位跳变;所述包裹相位,为未包裹相位使用反正切函数进行包裹得到;采用加权交叉熵损失作为损失函数,进行训练。优选采用带动量的随机梯度下降算法作为优化器。10.一种智能二维相位展开系统训练用数据集构建方法,其特征在于,包括以下步骤:叠加多个二维高斯分布及高斯噪声生成未包裹的相位图像,作为连续相位类型的输出监督;叠加多个二维高斯分布及高斯噪声并将随机大小和个数的矩形区域的相位值置为零生成未包裹的相位图像,作为非连续相位类型的输出监督;将监督输出进行反正切函数运算后得到包裹相位图像,作为训练输入;将训练输入和相应输出监督组合为智能二维相位展开系统训练用数据集。

    技术总结
    本发明公开了智能二维相位展开系统、应用、其训练及数据集构建方法。其采用对称的编码器和解码器构成的语义分割模块对二维相位进行语义分割,并对分割后的区域进行相位包裹数预测,从而将二维相位进行展开,对噪声较强的二维相位数据有着良好的准确度,表现优于其他网络结构。本发明提供的训练方法,构建数据集,所述数据集包括用作输出监督的未包裹相位,以及训练输入的包裹相位;采用加权交叉熵损失作为损失函数,进行训练,以缓解类别不平衡,分配权重以有效平衡所有类别的损失值,从而可以增加对少数类别像素分类的正确率。从而可以增加对少数类别像素分类的正确率。从而可以增加对少数类别像素分类的正确率。


    技术研发人员:李清光 张峻康
    受保护的技术使用者:广西大学
    技术研发日:2022.02.11
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-18205.html

    最新回复(0)