基于域适应的异质异源sar目标识别方法
技术领域
1.本发明属于图像识别领域,涉及低分辨率sar图像识别技术,尤其是涉及引入特征分布对齐、风格图像增扩和语义图像增扩技术的一种基于域适应的异质异源sar目标识别方法。
背景技术:
2.合成孔径雷达(synthetic aperture radar,sar)是一种主动式微波成像传感器,能对光学隐蔽目标成像,且具有全天时、全天候、远距离持续观测能力,因而成为对地观测的手段之一。对sar图像的自动快速识别是提高雷达利用效率和价值的重要环节,也是当前sar图像解译领域的前沿热点。
3.当前,得益于深度学习的快速发展,各类复杂的视觉任务都取得重大突破,也因此在sar图像识别任务中占据着举足轻重的地位。与传统机器学习方法相比,深度学习模型更能识别到图像的高层语义信息,有效作用于下游的分类任务。然而,高效的性能依赖于广泛的数据收集和训练测试领域的分布一致性。一旦数据集来自不同的设备或成像质量不一(异源异质),其最终的结果也会大幅下降。
4.对于sar图像分辨率较低的情况,地面目标的像素信息被高度稀释,有时依靠人力也难以判断其所属类别。这使得可用于训练的可靠样本较少,因而模型很容易过拟合。另外,低分辨率的sar图像包含的语义信息更少,大大增加特征解耦难度。
技术实现要素:
5.本发明的目的在于针地现有技术存在的不同设备采集的图像质量不同,低分辨率sar图像样本少,难以标注和训练,准确率低等问题,提供通过高分辨率图像知识迁移来帮助训练低分辨率图像,提高低分辨率sar图像的分类精度,满足实际应用需求的一种基于域适应的异质异源sar目标识别方法。
6.本发明包括以下步骤:
7.1)风格图像增扩:图像输入网络后,先由浅层的卷积层提取出低阶特征;这些特征包含纹理、光照等风格信息,而这些风格信息可以表示为特征的统计量,因此,改变特征统计量可以变换低阶特征的风格,实现图片风格化增扩;
8.2)特征分布对齐:将步骤1)中经过处理的低阶特征进一步通过深层卷积层变为高阶特征(语义特征);高阶特征保留的域信息不利于对目标域sar图像的识别工作,因此,本发明采用对抗学习的方式对齐源域和目标域的特征表示;
9.3)语义图像增扩:该步骤和步骤2)同时进行,该步骤对高阶特征进行分类,从而识别图像是哪一个类别,并通过损失函数优化网络;相较于常用的交叉熵损失函数,本发明采用隐式语义增扩法isda,在分类的同时达到语义增扩的目的。
10.在步骤1)中,所述实现图片风格化增扩的具体步骤可为:图片输入网络后,先由浅层的卷积层提取出低阶特征,特征表示为x∈rc×h×w,其中c表示特征通道数,h(h)和w(w)分
别表示特征图的高和宽。低阶特征可以解耦为风格信息和内容信息,风格信息为图片特征图的统计量,包括均值和标准差。通过对网络各层中捕获的特征进行风格混合,隐式地扩增源域的风格数目,最终正则化网络。所述风格混合采用mixstyle增扩方法,使网络在训练过程接触到更多的风格特征,mixstyle基于实例归一化in,公式为:
[0011][0012][0013][0014]
式中,γ和β为学习参数,其统计量u(x)和σ(x)分别为低阶特征的均值和标准差,可以用以表示图像的风格信息。通过变换此信息可以改变图像的风格达到风格化增扩的目的。假设x和y分别表示图像a和b的低阶特征,那么对a进行增扩的公式如下:
[0015][0016]
式中,α表示调节参数,调节参数是从beta分布中采样得到。
[0017]
在步骤2)中,所述特征分布对齐基于对抗学习对齐特征分布,同步训练梯度反转层和特征提取层,其具体步骤可为:步骤1)中处理后的低阶特征会进一步通过深层卷积层,变成高阶特征(语义特征),特征表示为x∈rc×h×w,(c,h,w的含义同上);高阶特征包含图像的语义信息如形状、外貌等,可用以判别图像所属类别的信息。但高阶特征同时包含域独有的信息,这不利于对目标域的识别工作。因此,本发明使用梯度反转层(gradient reversal layer,grl)实现领域分类,以拉近源域和目标域的特征表示,消除特征的域独有信息。梯度反转层是一个领域分类器,用于判别样本来自源域还是目标域。高阶特征通过梯度反转层后得到分类结果,并通过损失函数计算梯度。在梯度传播的过程中,梯度反转层会将本层的误差乘以-1,也就是反转梯度,使得前面的网络层和梯度反转层学习相反的梯度。这样梯度反转层就会学习辨别高阶特征来自哪个域,而用于提取特征的卷积层会学习如何骗过梯度反转层,从而提取出和域无关的特征信息。这样的对抗训练是同步进行的,域分类损失l
adv
可以表示为如下公式:
[0018][0019]
式中,ns和n
t
分别表示来自源域和目标域的样本数量,f和d分别表示特征提取器(即卷积层)和域分类器(即梯度反转层)。
[0020]
在步骤3)中,所述语义图像增扩的具体步骤可为:该步骤和步骤2)同时进行。在步骤2)中所述的高阶特征需要通过分类层来识别图像的类别,并通过损失函数计算梯度,然后优化网络。通常,这一步骤的损失函数为交叉熵损失函数。为了进一步达到增扩的目的,
本发明使用隐式语义增扩法isda作为损失函数来优化网络。isda首先对每个类的深度特征的协方差矩阵进行估计,捕获类内的语义变化,然后从零均值正太分布中采样数据,通过最小化增扩数据集的交叉熵损失期望的上届来实现增扩。隐式语义增扩法isda可表示为如下公式:
[0021][0022]
其中,λ为超参数,n表示样本数量,w和b分别表示分类层的权重和偏置,∑表示特征的协方差矩阵。
[0023]
与现有技术相比,本发明的突出优点在于:
[0024]
(1)不同采集设备(异源)所收集的图像质量不同(异质),而低分辨率sar图像更难识别,数据标注困难,可靠样本少,因此更难训练。针对低分辨率sar图像的识别问题,本发明提出一种以域自适应为基础的网络模型框架,从高分辨率图像中学习更丰富的语义知识帮助识别低分辨率图像,通过高分辨率图像知识迁移来帮助训练低分辨率图像。本发明引入高分辨率图像协助训练,并充分挖掘高分辨率图像中的语义信息,以高分辨率图像作为源域,低分辨率图像作为目标域,应用域自适应技术有效地提高网络的鲁棒性和泛化性。由于高分辨率图像拥有更丰富的像素信息,且和低分辨率图像共享语义信息。因此,通过学习高分辨率图像中的分类知识可以有效地帮助识别低分辨率图像。
[0025]
(2)本发明在传统的对齐特征分布的域自适应策略的基础上,结合增扩策略。并在风格特征和语义特征两个不同的维度上实现增扩,从而使模型学习到更多风格的低层次特征和不同语义的高层次特征。这些方法使得特征提取器和分类器同时得到了正则化学习,提高鲁棒性能,在sar图像数据集上表现出色。
[0026]
(3)本发明采用isda隐式语义增扩法作为交叉熵函数的一种替代,在不引入大量额外计算开销的情况下,高效、隐式地达到数据增扩的目的。
[0027]
(4)本发明结合特征分布对齐和数据增扩,有效提高低分辨率图像识别准确率。并且每个步骤所对应的模块都是即插即用的,任意一个步骤都能便捷地从训练过程中添加或删除,以有效地应用于现实情况。
附图说明
[0028]
图1为低分辨率sar图像域自适应识别网络框架。
[0029]
图2为高分辨率和低分辨率图例。其中,上一行为高分辨率示例图,下一行为低分辨率示例图。
具体实施方式
[0030]
为使本发明的目的、技术方案和优点更加清楚,以下实施例将结合附图对本发明作进一步地详细描述。
[0031]
为应对实际问题中不同设备采集的图像质量不同,而低分辨率sar图像难以标注和训练的挑战,本发明的目的是通过高分辨率图像知识迁移来帮助训练低分辨率图像。由
layer,grl)实现领域分类。类似于对抗训练的思想,梯度反转层也可以视作一个领域分类器,它的功能仍然是判别样本的域并正常的计算损失函数。不同的是,在梯度传播的过程中,梯度反转层会将本层的误差乘以-1,也就是反转梯度,使得前面的网络层和梯度反转层学习相反的梯度,以实现对抗的效果。由于梯度反转层和特征提取层的训练是同步进行的,所以具有很高的效率。域分类损失可以表示为如下公式:
[0041][0042]
式中,x表示高阶(语义)特征,ns和n
t
分别表示来自源域和目标域的样本数量,f和d分别表示特征提取器(即卷积层)和域分类器(即梯度反转层)。
[0043]
3)基于语义特征的隐式增扩模块。低分辨率图像由于难以标注,错误率高,其可靠的样本数量较少。但低分辨率图像和高分辨率图像共享类信息,拥有相似的语义表征。因此本发明使用隐式语义增扩法(isda)在高层的语义特征层面对样本进行增扩。isda的思想源于对深层网络可解耦图像语义的观察。在高层语义特征中,特征向量的变化可以映射为图像语义的变化。因此,通过对特征进行有意义的改变可以达到增扩的目的。为了有效的实现有意义的增扩,isda对每个类的深度特征的协方差矩阵进行估计,这捕获了类内的语义变化。然后从零均值正太分布中采样数据。不过,值得注意是,该方法并非显式地增加样本,而是通过最小化增扩数据集的交叉熵损失期望的上届来实现增扩。最终,只需要用一个更鲁棒的损失函数就能实现语义增扩的目的。isda可以表示为如下公式:
[0044][0045]
其中,λ为超参数,n表示样本数量,w和b分别表示分类层的权重和偏置,∑表示特征的协方差矩阵。isda作为交叉熵函数的一种替代,在不引入大量额外计算开销的情况下,隐式地达到了数据增扩的目的。
[0046]
以下给出一个具体实施例。
[0047]
本实施例采用在imagenet上预训练的卷积神经网络框架resnet-18作为基础网络,使用随机梯度下降法进行优化。初始学习率为0.001,在训练到总周期的75%时下降到0.0001。每批次喂入32张样本,总共训练30个周期,每个周期训练100个批次。同时应用标准的数据增扩方法,包括随机裁剪,随机反转和颜色变动。
[0048]
为了验证本发明的有效性,采用公开sar图像数据集mstar数据集进行实验。将原始数据集的训练集分为两部分,一部分为源域共2000张图片,剩余746张图片作为目标域。为构建低分辨率的数据集的目标域,将训练集分为两部分,一部分保持不变作为高分辨率源域,另一部分下采样三倍以模拟1m x 1m的低分辨率图像。同时,测试集的所有样本均下采样至1m x 1m。高分辨率和低分辨率图像样本示意图见图2。
[0049]
以测试集top-1准确率作为标准。评测本发明的网络框架和基线的对比结果。实验结果如表1所示。罗马数字ⅰ代表只用源域数据训练,然后直接在测试集上测试的结果。ⅱ代表只用目标域数据进行训练。ⅲ代表同时使用源域和目标域数据训练。ⅳ代表使用源域和
目标域数据训练并应用本发明的方法。从结果中可以看到,本发明的方法相对于基线方法在对目标域sar图像的识别率上具有大幅的提升。
[0050]
表1 mstar数据集top-1准确率
[0051] 0123456789avg.ⅰ0.3626.043.823.673.53.650.06.120.031.819.4ⅱ13.122.477.042.169.49.1220.528.699.614.639.5ⅲ36.558.280.345.664.345.661.941.810020.455.9ⅳ88.069.990.554.982.188.395.652.697.159.579.5
[0052]
表2消融实验结果
[0053][0054]
为了验证各个模块的有效性,进行消融实验。结果如表2所示。可以看出,当去除任意一个模块时,结果都出现下降。证明各个模块的有效性。
[0055]
本发明聚焦于当前的热门前沿领域技术,结合域自适应理论知识,缓解样本少、易过拟合等问题,提高模型的鲁棒性能。更具体地说,本发明针对低分辨率sar图像的识别问题,将高分辨率sar图像引入到低分辨率sar图像的学习过程中,将前者视为源域,后者视为目标域,由此引入一种新的基于域自适应框架的异质异源sar目标识别方法来提高分类器对低分辨率图像的识别率。通过引入高分辨率图像协助训练,并充分挖掘高分辨率图像中的语义信息,有效地提高网络的泛化性能。本发明通过对抗学习对齐源域和目标域的特征分布,将两者拉入同一个特征空间,使高分辨率图像更好地帮助训练。在传统的对齐特征分布的域自适应策略的基础上,结合增扩策略。通过混合风格特征和增扩语义特征实现数据增扩,有效地缓解低分辨率样本稀少的情况。在风格特征和语义特征两个不同的维度上实现增扩,从而使模型学习到更多风格的低层次特征和不同语义的高层次特征。这些方法使得特征提取器和分类器同时得到了正则化学习,提高鲁棒性能,在sar图像数据集上表现出色。
[0056]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
技术特征:
1.基于域适应的异质异源sar目标识别方法包括以下步骤:1)风格图像增扩:图像输入网络后,先由浅层的卷积层提取出低阶特征;所述低阶特征包含纹理、光照等风格信息,风格信息表示为特征的统计量,通过改变特征统计量即变换低阶特征的风格,实现图片风格化增扩;2)特征分布对齐:将步骤1)中经过处理的低阶特征进一步通过深层卷积层变为高阶特征;高阶特征保留的域信息不利于对目标域sar图像的识别工作,采用对抗学习的方式对齐源域和目标域的特征表示;3)语义图像增扩:与步骤2)同时进行,对高阶特征进行分类,从而识别图像是哪一个类别,并通过损失函数优化网络;采用隐式语义增扩法isda,在分类的同时达到语义增扩的目的。2.如权利要求1所述基于域适应的异质异源sar目标识别方法在步骤1)中,所述实现图片风格化增扩的具体步骤为:图片输入网络后,先由浅层的卷积层提取出低阶特征,特征表示为x∈r
c
×
h
×
w
,其中c表示特征通道数,h(h)和w(w)分别表示特征图的高和宽;低阶特征解耦为风格信息和内容信息,风格信息为图片特征图的统计量,包括均值和标准差;通过对网络各层中捕获的特征进行风格混合,隐式地扩增源域的风格数目,最终正则化网络;所述风格混合采用mixstyle增扩方法,使网络在训练过程接触到更多的风格特征,mixstyle基于实例归一化in,公式为:实例归一化in,公式为:实例归一化in,公式为:式中,γ和β为学习参数,其统计量u(x)和σ(x)分别为低阶特征的均值和标准差,用以表示图像的风格信息;通过变换此信息改变图像的风格达到风格化增扩的目的;假设x和y分别表示图像a和b的低阶特征,那么对a进行增扩的公式如下:式中,α表示调节参数,调节参数是从beta分布中采样得到。3.如权利要求1所述基于域适应的异质异源sar目标识别方法在步骤2)中,所述特征分布对齐是基于对抗学习对齐特征分布,其具体步骤为:步骤1)中处理后的低阶特征会进一步通过深层卷积层,变成高阶特征(语义特征),特征表示为x∈r
c
×
h
×
w
,高阶特征包含图像的语义信息如形状、外貌,用以判别图像所属类别的信息;高阶特征同时包含域独有的信息,使用梯度反转层实现领域分类,以拉近源域和目标域的特征表示,消除特征的域独有信息;梯度反转层是一个领域分类器,用于判别样本来自源域还是目标域;高阶特征通过梯度反转层后得到分类结果,并通过损失函数计算梯度;在梯度传播的过程中,梯度反转层会将本
层的误差乘以-1,也就是反转梯度,使得前面的网络层和梯度反转层学习相反的梯度;这样梯度反转层就会学习辨别高阶特征来自哪个域,而用于提取特征的卷积层会学习如何骗过梯度反转层,从而提取出和域无关的特征信息;这样的对抗训练是同步进行的,域分类损失l
adv
表示为如下公式:式中,n
s
和n
t
分别表示来自源域和目标域的样本数量,f和d分别表示特征提取器(即卷积层)和域分类器(即梯度反转层)。4.如权利要求1所述基于域适应的异质异源sar目标识别方法在步骤3)中,所述语义图像增扩的具体步骤为:步骤2)中的高阶特征需要通过分类层来识别图像的类别,并通过损失函数计算梯度,然后优化网络;使用隐式语义增扩法isda作为损失函数来优化网络;isda首先对每个类的深度特征的协方差矩阵进行估计,捕获类内的语义变化,然后从零均值正太分布中采样数据,通过最小化增扩数据集的交叉熵损失期望的上届来实现增扩;隐式语义增扩法isda表示为如下公式:其中,λ为超参数,n表示样本数量,w和b分别表示分类层的权重和偏置,∑表示特征的协方差矩阵。
技术总结
基于域适应的异质异源SAR目标识别方法,属于图像识别领域。包括以下步骤:1)风格图像增扩:图像输入网络后,先由浅层的卷积层提取低阶特征,包含纹理、光照等风格信息,这些风格信息可表示为特征的统计量,改变特征统计量可变换低阶特征的风格,实现图片风格化增扩;2)特征分布对齐:将步骤1)中经处理的低阶特征进一步通过深层卷积层变为高阶特征;高阶特征保留的域信息不利于对目标域SAR图像的识别工作,采用对抗学习的方式对齐源域和目标域的特征表示;3)语义图像增扩:与步骤2)同时进行,对高阶特征进行分类,识别图像是哪一个类别,并通过损失函数优化网络。采用隐式语义增扩法ISDA,在分类的同时达到语义增扩的目的。在分类的同时达到语义增扩的目的。在分类的同时达到语义增扩的目的。
技术研发人员:黄悦 丁兴号 饶智杰
受保护的技术使用者:厦门大学
技术研发日:2022.02.18
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-8197.html