1.本发明涉及配电终端的数据监测领域,具体是涉及减少配电终端误告警的多源异构安全监测数据聚合方法。
背景技术:
2.随着传感器节点的大量部署,智能配电网中产生了海量的安全监测数据。由于安全监测节点、安全设备监测技术的不同导致了智能配电网安全监测数据呈现出多源异构的特点,大量冗余信息使得配电终端难以识别多源异构数据的类型,易发生误告警的问题。数据聚合技术可以对海量数据进行有效聚合,减少冗余信息,以实现配电终端对聚合数据的安全状态评估。
3.传统的数据聚合方法主要有基于本体的多源异构数据聚合方法、基于同态加密或差分隐私的隐私保护数据聚合方法、基于统计学的数据聚合方法等。传统的数据聚合方法存在以下问题:首先,不能挖掘数据的深度特征,精确性不足;其次,过于依赖领域专家的知识,泛化性不足;最后,对特定数据存在过拟合问题,鲁棒性不足。
4.对上述问题,有研究是引入领域自适应方法来解决,但传统的领域自适应方法局限于单一源域且数据特征一致的场景,然而在现实场景中,数据多呈现多源异构特征,传统方法很难适用于配电终端多源异构安全监测的数据分类聚合任务,极可能出现分类准确性不足、收敛度不高、训练较难、适配效果不佳等负迁移问题。
5.针对上述方法的问题,如何准确地识别并预测多源异构安全监测数据的类型,有效地减少配电终端误告警的概率,尤其是,如何屏蔽安全监测数据的异构性,并衡量多个安全监测数据源的贡献程度,解决安全监测数据的多源异构问题是目前研究的重点。此外,分类准确性不足、收敛度不高、训练较难、适配效果不佳等也是应当予以考虑并解决的问题。
技术实现要素:
6.为解决上述技术问题,本发明提供了提供减少配电终端误告警的多源异构安全监测数据聚合方法,在数据聚合技术中引入了迁移学习中的领域自适应的思想,识别并预测多源异构安全监测数据的类型,从而减少配电终端误告警概率,实现对整个智能配电网安全态势的有效监控。
7.本发明所述的减少配电终端误告警的多源异构安全监测数据聚合方法,其步骤为:s1、构建异构特征的映射神经网络;s2、构建对抗性领域自适应网络模型:将所述映射神经网络作为特征提取器输出特征,领域判别器分为全局领域判别器及局部领域判别器,将输出特征分别传入全局领域判别器及局部领域判别器,以分别对齐边缘概率分布和条件概率分布,最后将特征提取器输出的特征传入标签分类器进行训练,得到标签输出;s3、设计权重参数,将类级权重加权到局部领域判别器以最大程度匹配共享类别
空间中的数据分布,并将域间权重加权到标签分类器和领域判别器以衡量多个源域对目标域的贡献程度,最后综合各个部分的损失函数,得到最终的目标函数。
8.进一步的,s1中,所述映射神经网络由两层映射组合而成,首先将多个源域中标签已知的数据样本和目标域中标签未知的数据样本分别用对应的第一层映射函数对源域和目标域的特定特征建模,以屏蔽数据的异构性;然后分别用对应的第二层映射函数对源域和目标域间的联系建模,将源域和目标域映射到共享的特征子空间。
9.进一步的,s1中,构建异构特征的映射神经网络的具体步骤为:s11、获取已知个数据领域为源域,第个源域表示为,源域中包含个含标签的样本,未知数据领域为目标域,目标域中包含个含标签或不含标签的样本;s12、分别将输入的个源域的个样本以及目标域的个样本通过个双层组合映射神经网络与映射到共享的维子空间,其中,和分别是源域的映射神经网络和目标域的映射神经网络,和分别是源域和目标域的特征空间,是源域和目标域映射到的共享子空间。
10.进一步的,s2中,构建对抗性领域自适应网络模型的具体步骤为:s21、将异构特征映射神经网络作为对抗性领域适应网络模型的特征提取器,使用1-范数约束第二层映射中源域和目标域参数的不平衡性,特征提取器的损失函数为: (1)式中,为源域的数量,为第个源域的第二层映射函数,表示目标域的第二层映射函数;s22、将特征提取器输出的特征传入领域判别器,将领域判别器细化为全局领域判别器和个局部领域判别器,以分别对齐边缘概率分布和条件概率分布,损失函数为: (2)
ꢀ
(3)式中,为第个源域的样本数,为目标域的样本数,为源域和目标域的类别数,为第个类别,为全局领域判别器的交叉熵损失,为第个局部领域判别器的交叉熵损失,为输入的源域和目标域样本,为领域判别器输出的样本领域标签,源域表示为0,目标域表示为1,为输入样本属于第类的标签的预测概率分布;为全局领域判别器的损失函数,为局部领域判别器的损失函数;s23、将特征提取器输出的特征传入标签分类器,得到标签输出,损失函数为交叉熵损失,标签分类器的损失函数表示为: (4)式中,为输入源域和目标域样本,为标签分类器输出的样本类别标签。
11.进一步的,s3中,设计权重参数,得到最终目标函数的具体步骤为:s31、为减小多源域无关标签对目标域分类造成的影响,最大程度匹配共享类别空间中的数据分布,引入类级权重参数: (5)s32、为衡量第个源域对目标域产生的贡献,加权范围与域间相似度相关,并且不会大量丢失特征,引入域间权重参数:(6)(7)式中,和分别为目标域和源域中属于类别的样本,和分别为目标域和源域中属于类别的样本的总个数;表示第个源域和目标域之间的分布差
异;表示第个源域和目标域之间的分布差异;s33、结合公式(1)到公式(7),得到最终的目标函数: (8)式中,为特征提取器损失和领域判别器损失的权重参数。
12.本发明所述的有益效果为:1.本发明针对当前智能配电网海量多源异构安全监测数据的聚合需求,提出基于迁移学习的多源异构安全监测数据聚合方法,解决了传统数据聚合方法无法挖掘数据深度特征、过于依赖领域专家知识以及对特定数据的过拟合问题,本发明方法能够在现实场景中,识别并预测多源异构安全监测数据的类型,从而减少配电终端误告警概率,实现对整个智能配电网安全态势的有效监控;2.本发明所述的方法,首先通过构建异构特征的映射神经网络,屏蔽配电终端安全监测数据的异构性,其次加入权重参数,衡量配电终端多源安全监测数据的贡献程度与类别影响,最后利用对抗性领域自适应网络模型,对配电终端安全监测数据进行有效的分类聚合,与现有的迁移学习方法相比,能够更加适用于多源异构安全监测数据的场景;3.本发明所述的方法,通过构建多数据源的配电网安全监测数据的对抗性域适应网络模型,有利于解决大量冗余信息使得配电终端难以识别多源异构数据的类型,易发生误告警的问题;该种减少配电终端误告警的多源异构安全监测数据聚合技术,针对配电终端安全监测数据的多源异构特征,以及智能配电网安全态势监控环境下易发生误告警的数据聚合需求,提出的多源异构安全监测数据聚合技术,具有分类准确率高、训练容易、收敛效果稳定的优点,能够识别并预测多源异构安全监测数据的类型,从而减少配电终端误告警概率,实现对整个智能配电网安全态势的有效监控。
附图说明
13.图1是本发明所述方法的流程示意图;图2是本发明所述方法的收敛效果图;图3(a)是领域自适应前源域1的数据和目标域数据分布示意图;图3(b)是领域自适应前源域2的数据和目标域数据分布示意图;图3(c)是领域自适应后源域1的数据和目标域数据分布示意图;图3(d)是领域自适应后源域2的数据和目标域数据分布示意图;图4是本发明所述方法的数据聚合效果。
具体实施方式
14.为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明。
15.如图1所示,本发明所述的减少配电终端误告警的多源异构安全监测数据聚合方法,包括以下步骤:s1、构建异构特征的映射神经网络,具体为,首先将多个源域已知的数据样本和一个目标域的未知数据样本分别用对应的第一层映射函数对特定特征建模,以屏蔽数据的异构性,然后分别用对应的第二层映射函数对域间的联系建模,以映射到共享的特征子空间。具体为,s11、获取已知个数据领域为源域,第个源域表示为,源域中包含个含标签的样本,未知数据领域为目标域,目标域中包含个含标签或不含标签的样本;s12、分别将输入的个源域的个样本以及目标域的个样本通过个双层组合映射神经网络与映射到共享的维子空间,其中,和分别是源域的映射神经网络和目标域的映射神经网络,和分别是源域和目标域的特征空间,是源域和目标域映射到的共享子空间。
16.s2、构建对抗性领域自适应网络模型,具体为,首先将s1步骤中的映射神经网络作为特征提取器输出特征,然后将输出的特征传入全局领域判别器和局部领域判别器,分别对齐边缘概率分布和条件概率分布,最后将特征传入标签分类器进行训练以实现类别输出。具体为:s21、将异构特征映射神经网络作为对抗性领域适应网络模型的特征提取器,使用1-范数约束第二层映射中源域和目标域参数的不平衡性,特征提取器的损失函数为: (1)式中,为源域的数量,为第个源域的第二层映射函数,表示目标域的第二层映射函数;s22、将特征提取器输出的特征传入领域判别器,将领域判别器细化为全局领域判别器和个局部领域判别器,以分别对齐边缘概率分布和条件概率分布,损失函数为:
ꢀ
(2) (3)式中,为第个源域的样本数,为目标域的样本数,为源域和目标域的类别数,为第个类别,为全局领域判别器的交叉熵损失,为第个局部领域判别器的交叉熵损失,为输入的源域和目标域样本,为领域判别器输出的样本领域标签,源域表示为0,目标域表示为1,为输入样本属于第类的标签的预测概率分布;为全局领域判别器的损失函数,为局部领域判别器的损失函数;s23、将特征提取器输出的特征传入标签分类器,得到标签输出,损失函数为交叉熵损失,标签分类器的损失函数表示为: (4)式中,为输入源域和目标域样本,为标签分类器输出的样本类别标签。
17.s3、设计权重参数,得到最终目标函数,具体为,首先将类级权重加权到局部领域判别器以最大程度匹配共享类别空间中的数据分布,其次将域间权重加权到标签分类器和领域判别器以衡量多个源域对目标域的贡献程度,最后综合各个部分的损失函数,得到最终的目标函数。具体为:s31、为减小多源域无关标签对目标域分类造成的影响,最大程度匹配共享类别空间中的数据分布,引入类级权重:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)s32、为衡量第个源域对目标域产生的贡献,加权范围与域间相似度相关,并且不会大量丢失特征,引入域间权重参数:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)式中,和分别为目标域和源域中属于类别的样本,和分别为目标域和源域中属于类别的样本的总个数;表示第个源域和目标域之间的分布差异(利用最大均值差异公式进行计算),这个包括了(总源域数)的范围;表示第个源域和目标域之间的分布差异,中的表示(总源域数)不包括在内的范围;公式(7)是域间权重的计算公式,当第个源域和目标域进行领域自适应时,为了不丢弃其他源域信息,通过公式(7)根据其他源域(除自身外)和目标域的差异进行权重参数的计算,其他源域和目标域间的差异越大,需要给到第个源域的权重就越大。
18.s33、结合公式(1)到公式(7),得到最终的目标函数: (8)式中,为特征提取器损失和领域判别器损失的权重参数。
19.通过本发明所述的方法,能够有效解决多源异构问题,在特征提取器与领域判别器的对抗下,源域数据和目标域数据能够实现数据分布的自适应特征对齐,从而源域数据训练出的标签分类器能够很好地适用于目标域数据,能够有效实现数据分类聚合,识别预测未知领域数据类型,以减少误告警率。
20.本发明所述的一种减少配电终端误告警的多源异构安全监测数据聚合方法,通过构建多数据源的配电网安全监测数据的对抗性域适应网络模型,有利于解决大量冗余信息使得配电终端难以识别多源异构数据的类型,易发生误告警的问题。该方法能够建立在更加真实的场景下,通过构建异构特征的映射神经网络,屏蔽配电终端安全监测数据的异构性,同时加入权重参数,衡量配电终端多源安全监测数据的贡献程度与类别影响,最后利用对抗性领域自适应网络模型,对配电终端安全监测数据进行有效的分类聚合。
21.实验验证对实施例方法的有效性验证说明如下:在智能配电网终端收集了三种数据源的不同特征维度的异构安全监测数据,分别将两个数据领域作为含有标签的源域,一个数据领域作为不含标签的目标域,将异构特征映射到公共的特征空间,组成九种分类聚合任务。
22.根据实验结果,不同任务中,各类安全监测数据在本发明提出的多源异构安全监
测数据聚合技术下得到的识别预测准确度(%)如表1所示:从表1的实验结果可以看出,实施例方法能够表现出较高的识别预测准确率。
23.对实施例方法中的收敛效果、数据分布和数据聚合效果进一步进行分析如下:对实施例中收敛效果进行分析:从图2中可以看出,本发明模型从第20个循环轮次开始快速收敛至稳定值,准确率随着循环轮次的增加逐渐达到稳定。本发明不仅能达到较高的准确率,训练也容易,效果稳定。
24.对实施例中数据分布进行分析,图3(a)-图3(d)是本发明所述的领域自适应前后数据分布对比图;其中,图3(a)表示领域自适应前,源域1数据和目标域数据分布,图3(b)表示领域自适应前,源域2数据和目标域数据分布,图3(c)表示领域自适应后,源域1数据和目标域数据分布,图3(d)表示领域自适应后,源域2的数据和目标域数据分布;从图3(a)-图3(d)中可以看出,源域数据在领域自适应前,数据分布差异很大;源域数据在领域自适应后,数据分布差异被拉近,实现数据分布自适应,经过对抗性域适应自动进行的数据特征分布调整,很大程度上拉近了源域和目标域的距离,数据分布有了显著的对齐。
25.对实施例中数据聚合效果进行分析:图4中,每个数字代表了一种类别,相同类别的数据被归为一类,实现了数据聚合;从图4中可以看出,本发明可以有效地对配电终端多源异构安全监测数据进行分类聚合。
26.以上所述仅为本发明的优选方案,并非作为对本发明的进一步限定,凡是利用本发明说明书及附图内容所作的各种等效变化均在本发明的保护范围之内。
技术特征:
1.减少配电终端误告警的多源异构安全监测数据聚合方法,其特征在于,所述方法的步骤为:s1、构建异构特征的映射神经网络;s2、构建对抗性领域自适应网络模型:将所述映射神经网络作为特征提取器输出特征,领域判别器分为全局领域判别器及局部领域判别器,将输出特征分别传入全局领域判别器及局部领域判别器,以分别对齐边缘概率分布和条件概率分布,最后将特征提取器输出的特征传入标签分类器进行训练,得到标签输出;s3、设计权重参数,将类级权重加权到局部领域判别器,并将域间权重加权到标签分类器和领域判别器,最后综合各个部分的损失函数,得到最终的目标函数。2.根据权利要求1所述的减少配电终端误告警的多源异构安全监测数据聚合方法,其特征在于,s1中,所述映射神经网络由两层映射组合而成,首先将多个源域中标签已知的数据样本和目标域中标签未知的数据样本分别用对应的第一层映射函数对源域和目标域的特定特征建模,以屏蔽数据的异构性;然后分别用对应的第二层映射函数对源域和目标域间的联系建模,将源域和目标域映射到共享的特征子空间。3.根据权利要求2所述的减少配电终端误告警的多源异构安全监测数据聚合方法,其特征在于,s1中,构建异构特征的映射神经网络的具体步骤为:s11、获取已知个数据领域为源域,第个源域表示为,源域中包含个含标签的样本,未知数据领域为目标域,目标域中包含个含标签或不含标签的样本;s12、分别将输入的个源域的个样本以及目标域的个样本通过个双层组合映射神经网络与映射到共享的维子空间,其中,和分别是源域的映射神经网络和目标域的映射神经网络,和分别是源域和目标域的特征空间,是源域和目标域映射到的共享子空间。4.根据权利要求3所述的减少配电终端误告警的多源异构安全监测数据聚合方法,其特征在于,s2中,构建对抗性领域自适应网络模型的具体步骤为:s21、将异构特征映射神经网络作为对抗性领域适应网络模型的特征提取器,使用1-范数约束第二层映射中源域和目标域参数的不平衡性,特征提取器的损失函数为: (1)式中,为源域的数量,为第个源域的第二层映射函数,表示目标域的第二层映射函数;
s22、将特征提取器输出的特征传入领域判别器,将领域判别器细化为全局领域判别器和个局部领域判别器,以分别对齐边缘概率分布和条件概率分布,损失函数为: (2) (3)式中,为第个源域的样本数,为目标域的样本数,为源域和目标域的类别数,为第个类别,为全局领域判别器的交叉熵损失,为第个局部领域判别器的交叉熵损失,为输入的源域和目标域样本,为领域判别器输出的样本领域标签,源域表示为0,目标域表示为1,为输入样本属于第类的标签的预测概率分布;为全局领域判别器的损失函数,为局部领域判别器的损失函数;s23、将特征提取器输出的特征传入标签分类器,得到标签输出,损失函数为交叉熵损失,标签分类器的损失函数表示为: (4)式中,为输入源域和目标域样本,为标签分类器输出的样本类别标签。5.根据权利要求4所述的减少配电终端误告警的多源异构安全监测数据聚合方法,其特征在于,s3中,设计权重参数,得到最终目标函数的具体步骤为:s31、为减小多源域无关标签对目标域分类造成的影响,最大程度匹配共享类别空间中的数据分布,引入类级权重参数: (5)s32、为衡量第个源域对目标域产生的贡献,加权范围与域间相似度相关,并且不会大量丢失特征,引入域间权重参数:
ꢀ
(6)(7)式中,和分别为目标域和源域中属于类别的样本,和分别为目标域和源域中属于类别的样本的总个数;表示第个源域和目标域之间的分布差异;表示第个源域和目标域之间的分布差异;s33、结合公式(1)到公式(7),得到最终的目标函数: (8)式中,为特征提取器损失和领域判别器损失的权重参数。
技术总结
本发明提供一种减少配电终端误告警的多源异构安全监测数据聚合方法,通过构建异构特征的映射神经网络,屏蔽配电终端安全监测数据的异构性;加入权重参数,衡量配电终端多源安全监测数据的贡献程度与类别影响;利用对抗性领域自适应网络模型,对配电终端安全监测数据进行有效的分类聚合。该方法具有分类准确率高、训练容易、收敛效果稳定的优点,本发明方法能够识别并预测多源异构安全监测数据的类型,从而减少配电终端误告警概率,实现对整个智能配电网安全态势的有效监控。配电网安全态势的有效监控。配电网安全态势的有效监控。
技术研发人员:张腾飞 湛杰 马福民 刘建 于洋 蔡子贇 刘明祥 吴巨爱 蔡月明 邹花蕾 徐俊俊 朱三立
受保护的技术使用者:南京邮电大学
技术研发日:2022.04.24
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-7056.html