1.本发明涉及设备故障诊断领域,具体涉及一种基于知识和数据融合驱动的设备故障诊断方法。
背景技术:
2.工业4.0背景下,机械设备日趋大型化、结构复杂化、运行自动化和智能化,一旦某些部件出现异常故障可能导致整个设备出现问题,因此准确及时的故障诊断和预测日益重要,成为智能制造领域的研究热点。
3.目前设备故障诊断通常分为机理建模方法和数据驱动方法,其中基于机理建模的方法仅需要少量检测数据即可进行分析诊断,对单一故障判断准确率高。例如文章[郑近德等.基于自适应经验傅里叶分解的机械故障诊断方法[j].机械工程学报,2020,56(09):125-136.]提出一种自适应经验傅里叶分解函数进行振动数据故障诊断,能够将一个非平稳信号自适应地分解为若干个瞬时频率具有物理意义的傅里叶本征模态函数之和。[林荣等.适用于轴承故障诊断的数据增强算法[j].计算机工程与应用,2021,57(07):269-278.]对原始振动信号进行时域重采样从而生成模拟信号,随后重新计算信号的幅值来抵消时域重采样以及环境噪声对原始信号能量的影响。上述方法很好的解决了显型单一故障,但是由于现代设备越来越复杂,其混合故障频发、成因机理复杂,因此单纯依靠机理建模难以建立其准确的数学模型;而基于数据驱动的方法不需要清楚机械等故障原理,直接从状态数据挖掘,随着物联网发展状态数据获取越来越容易,基于数据驱动的设备故障诊断得到了很好的发展。例如[long et al.a new convolutional neural network-based data-driven fault diagnosis method[j].ieee transactions on industrial electronics,2017.]提出了一种基于lenet-5的卷积神经网络(cnn)进行故障诊断,该方法将信号转换为二维(2-d)图像,提取转换后的二维图像的特征,消除手工特征的影响。[刘晶等.数据融合驱动的余热锅炉阀门调节方法[j].燕山大学学报,2021,45(01):76-86 94.]提出基于过采样决策树的冷风阀调节预测模型和基于lstm-bp共享权值神经网络入口阀&旁通阀调节预测模型,实现了数据融合驱动的余热锅炉阀门调节。上述方法都取得了较好的效果,但是在实际应用中基于数据驱动的方法要求数据覆盖工况全面,在实际的应用中有效数据积累需要的时间长,难以满足。
技术实现要素:
[0004]
为了解决现有技术问题,本发明提供一种基于知识和数据融合驱动的设备故障诊断方法(fault diagnosis method for equipment driven by knowledge and data fusion,简称fdm-kdf),首先,提取设备机理知识中的规则并符号化指标,组合作为故障图谱的规则节点;其次,通过优化的双向长短时记忆网络模型(optimized bidirectional long-short memory network model,简称obilstm),融合卷积神经网络和注意力机制,进行故障分类预测并作为规则节点关系的抽取。最后,建立设备机理知识和运行数据的故障
图谱,实现设备故障诊断领域的图谱构建,结合知识与数据对设备故障进行准确识别的效果。
[0005]
为解决上述技术问题,本发明所采取的技术方案是:一种基于知识和数据融合驱动的设备故障诊断方法,包括下述步骤:s1:收集有关诊断目标设备的文本信息和时序样本数据,其中文本信息作为设备机理知识,时序样本数据作为设备运行数据;s2:对设备机理知识提取规则,将规则符号化提取出可作为分类依据的指标1(f1)、指标2(f2)直到指标n(fn);s3:将提取的各项指标进行组合分类,得到知识图谱的不同层级及不同类型的规则节点,包括一级规则节点(f1),二级规则节点f
1-f2,...,n级规则节点(f
1-f
2-...-fn);s4:将规则节点作为分类依据,对设备运行数据进行标注,并分成长度大小统一的数据段;s5:通过改进的长短时记忆网络模型进行分类训练,抽取图谱中不同层级规则节点对应的设备运行数据的分类关系;s6:将根据机理知识提取的规则节点与根据设备运行数据提取的节点关系构建关系三元组,并将规则节点、节点关系以csv文件的形式导入neo4j数据库生成故障图谱;s7:将设备故障数据输入故障图谱进行故障诊断,得到故障诊断结果和故障相关信息。
[0006]
进一步的,所述步骤s3中,将提取的各项指标进行组合分类,得到知识图谱的不同层级的规则节点为:针对设备机理知识,将设备数据的尺寸、位置、损伤深度等特征作为分类指标进行总结,并将总结出的指标进行符号化,对指标符号进行组合作为规则节点。一级规则节点f1取最小数量的指标(如f1)作为节点划分的依据,在f1基础上增加指标数量(如f1,f2)得到分类划分更细致的二级规则节点f
1-f2,乃至加入所有指标组合(如f1,f2,...,fn)的n级规则节点f
1-f
2-...-fn,相同等级的规则节点划分为同一层级,下级规则节点(如f
1-f2)和上级规则节点(如f1)是属于(belongsto)的关系,belongsto指下级规则节点属于上级规则节点,是上级规则节点的分类类型之一,多个层级的节点组合形成树型结构。
[0007]
进一步的,所述步骤s5中,通过改进的长短时记忆网络模型进行分类训练,抽取图谱中不同层级规则节点对应的设备运行数据的分类关系,包括以下步骤:1-1)采用独热编码(one-hot encoding)对故障类别进行标记;1-2)加入一维卷积神经网络(1d-cnn)对原始的设备运行数据的局部非相关性特征和弱周期性规律进行提取;1-3)加入双向长短期记忆网络(bilstm)模型,对1d-cnn处理后的振动信号的时序性数据的上下文数据特征进行提取,与此同时加入批归一化(bn)层和dropout层防止过拟合;1-4)将bilstm通道中所有特征值取全局平均值,经sigmoid激活函数得到每个通道的权重。最终不同通道乘上不同权重,实现对关键特征通道域的注意力机制;1-5)重复1-3),进一步提取时序性数据的上下文数据特征;1-6)最后分类层采用softmax多分类器得到故障样本分别为指定分类数目的不同
故障的概率分布,采用交叉熵代价函数(cross-entropy cost function)作为模型的验证损失函数,输出分类结果。
[0008]
进一步的,所述步骤s6中,将根据机理知识提取的规则节点与根据设备运行数据提取的节点关系构建关系三元组,并将规则节点、节点关系以csv文件的形式导入neo4j数据库生成故障图谱,具体步骤如下:2-1)通过关系连接各规则节点,构建关系三元组(f
1-f
2-...-fn,rn,f
1-f
2-...-f
n-1
),表示n级规则节点f
1-f
2-...-fn与n-1级规则节点f
1-f
2-...-f
n-1
之间的关系为rn;2-2)将关系三元组通过csv表格文件的形式保存,表格列有起点节点id(start_id)、起点节点名称(start_name)、终点节点id(end_id)、终点节点名称(end_name)、关系(relation)列;2-3)使用py2neo编写cypher数据库语句,包括新建节点、新建节点属性、新建节点关系、删除节点与关系、查询节点、查询关系等,以此生成图谱构建模型,其中py2neo是neo4j数据库的python驱动包,cypher是适用于neo4j数据库的描述性的图形查询语言;2-4)读取规则节点和节点关系csv文件,通过图谱构建模型导入neo4j数据库,生成知识图谱节点、属性、关系,其中neo4j是图形数据库,可生成并展示知识图谱。
[0009]
采用上述技术方案所产生的有益效果在于:本发明提出的一种基于知识和数据融合驱动的设备故障诊断方法方法针对设备故障诊断中现存的存在的复杂故障类型难以建立机理模型,纯数据驱动忽略机理知识等问题,本发明基于知识图谱和改进的长短时记忆网络融合驱动的设备故障诊断方法对设备故障机理建模、故障类型诊断这两个过程进行改进。本发明改进后知识图谱和长短时记忆网络算法称为一种基于知识和数据融合驱动的设备故障诊断方法,该方法实现了从单纯依赖于机理知识或数据驱动的模型到数据驱动与知识引导相融合驱动的故障诊断;并设计了适用于多故障分类的模型,满足提高多分类准确率以故障信息展示的需求。
[0010]
本发明与传统长短时记忆网络算法相比:(1)提出一种基于知识和数据融合驱动的设备故障诊断方法,该方法结合设备机理知识和设备运行数据进行故障诊断,提供了一种设备故障诊断领域图谱的构建思路,有效解决了混合故障机理难以描述和状态大数据处理困难等问题;(2)构建融合设备机理知识和设备运行数据的知识图谱模型,将知识实体化、提取数据特征关系,实现了机理知识和设备运行数据的融合;(3)对多分类故障数据提出优化的双向长短时记忆网络模型obilstm,融合卷积神经网络和注意力机制,优化传统lstm模型层级结构,提升了在多故障分类场景下的准确率和收敛速度。
[0011]
将本发明提出的方法应用于美国西储大学故障轴承数据集,通过试验分析,验证了提出的基于知识和数据融合驱动的设备故障诊断方法方法的有效性,对比1dcnn-lstm模型,故障诊断精度在故障分类97类时提高2.52%,同时相较于未加入1dcnn模块的lstm模型,精度明显提高并且模型收敛速度提升,并且可实现故障信息和关联故障的展示,能够实现工业领域中机械设备轴承部件的精确故障诊断。
附图说明
[0012]
图1是一种基于知识和数据融合驱动的设备故障诊断方法流程图;图2是优化的双向长短时记忆网络模型框架结构图;
图3是故障图谱构建过程图;图4是故障图谱查询结果展示图;图5是不同分类数下lstm模型的准确率对比图;图6是不同分类数下obilstm模型的准确率对比图;图7是97类故障情况下obilstm模型与其他模型的准确率对比图;图8是97类故障情况下obilstm模型与其他模型的loss对比图。
具体实施方式
[0013]
下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0014]
本发明以工业机械设备故障诊断为载体,以知识图谱和lstm算法作为主要的算法框架,其方法流程如图1所示,包括下述步骤:s1:收集有关诊断目标设备的文本信息和时序样本数据,其中文本信息作为设备机理知识,时序样本数据作为设备运行数据;s2:对设备机理知识提取规则,将规则符号化提取出可作为分类依据的指标1(f1)、指标2(f2)直到指标n(fn);s3:将提取的各项指标进行组合分类,得到知识图谱的不同层级及不同类型的规则节点,包括一级规则节点(f1),二级规则节点f
1-f2,...,n级规则节点(f
1-f
2-...-fn);针对设备机理知识,将设备数据的尺寸、位置、损伤深度等特征作为分类指标进行总结,并将总结出的指标进行符号化,对指标符号进行组合作为规则节点。一级规则节点f1取最小数量的指标(如f1)作为节点划分的依据,在f1基础上增加指标数量(如f1,f2)得到分类划分更细致的二级规则节点f
1-f2,乃至加入所有指标组合(如f1,f2,...,fn)的n级规则节点f
1-f
2-...-fn,相同等级的规则节点划分为同一层级,下级规则节点(如f
1-f2)和上级规则节点(如f1)是属于(belongsto)的关系,belongsto指下级规则节点属于上级规则节点,是上级规则节点的分类类型之一,多个层级的节点组合形成树型结构。
[0015]
s4:将规则节点作为分类依据,对设备运行数据进行标注,并分成长度大小统一的数据段;s5:通过改进的长短时记忆网络模型进行分类训练,抽取图谱中不同层级规则节点对应的设备运行数据的分类关系,图2展示了obilstm模型结构图,具体的模型层以及参数如表1所示;表1 obilstm模型结构参数
层输出参数输入input_1(inputlayer)[(none,100,3)]0 conv1d(conv1d)(none,91,16)496input_1[0][0]bilstm_1(none,91,60)11280conv1d[0][0]batch_normalization_1(none,91,60)240bidirectional[0][0]dropout_1(dropout)(none,91,60)0batch_normalization[0][0]attention_vec(permute)(none,91,60)0dropout[0][0]attention_mul(multiply)(none,91,60)0attention_vec[0][0]bilstm_2(none,60)21840attention_mul[0][0]batch_normalization_2(none,60)240bidirectional_1[0][0]
dropout_2(dropout)(none,60)0batch_normalization_1[0][0]dense(dense)(none,83)5063dropout_1[0][0]
具体的计算过程如下:1-1)采用独热编码(one-hot encoding)对故障类别进行标记;1-2)加入一维卷积神经网络(1d-cnn)对原始的设备运行数据的局部非相关性特征和弱周期性规律进行提取;1-3)加入双向长短期记忆网络(bilstm)模型,对1d-cnn处理后的振动信号的时序性数据的上下文数据特征进行提取,与此同时加入批归一化(bn)层和dropout层防止过拟合;1-4)将bilstm通道中所有特征值取全局平均值,经sigmoid激活函数得到每个通道的权重。最终不同通道乘上不同权重,实现对关键特征通道域的注意力机制;1-5)重复1-3),进一步提取时序性数据的上下文数据特征;1-6)最后分类层采用softmax多分类器得到故障样本分别为指定分类数目的不同故障的概率分布,采用交叉熵代价函数(cross-entropy cost function)作为模型的验证损失函数,输出分类结果。
[0016]
s6:将根据机理知识提取的规则节点与根据设备运行数据提取的节点关系构建关系三元组,并将规则节点、节点关系以csv文件的形式导入neo4j数据库生成故障图谱,过程如图3所示,具体步骤如下:2-1)通过关系连接各规则节点,构建关系三元组(f
1-f
2-...-fn,rn,f
1-f
2-...-f
n-1
),该三元组表示n级规则节点f
1-f
2-...-fn与n-1级规则节点f
1-f
2-...-f
n-1
之间的关系为rn;2-2)将关系三元组通过csv表格文件的形式保存,表格列有起点节点id(start_id)、起点节点名称(start_name)、终点节点id(end_id)、终点节点名称(end_name)、关系(relation)列;2-3)使用py2neo编写cypher数据库语句,包括新建节点、新建节点属性、新建节点关系、删除节点与关系、查询节点、查询关系等,以此生成图谱构建模型,其中py2neo是neo4j数据库的python驱动包,cypher是适用于neo4j数据库的描述性的图形查询语言;2-4)读取规则节点和节点关系csv文件,通过图谱构建模型导入neo4j数据库,生成知识图谱节点、属性、关系,其中neo4j是图形数据库,可生成并展示知识图谱。
[0017]
s7:将设备故障数据输入故障图谱进行故障诊断,得到故障诊断结果和故障相关信息。
[0018]
基于上述步骤,本发明有效解决机械设备故障诊断问题,首先,该方法总结设备机理知识中的规则与指标,实体化故障机理知识,构建规则节点;其次,通过优化的双向长短时记忆网络模型,融合卷积神经网络和注意力机制,进行故障分类预测作为规则节点关系抽取。最后,建立融合设备机理知识和设备运行数据的故障图谱,达到设备故障诊断领域的图谱构建,结合知识与数据对实现故障振动信号的精确分类。本发明结合机理与数据构建了设备故障诊断领域图谱,并显著提高机械设备故障诊断精度,有效提高了模型训练的收敛速度。
[0019]
本发明基于知识和数据融合驱动的设备故障诊断方法的试验验证:
1、试验环境本实验主要分为故障图谱的构建和obilstm分类预测两部分。故障图谱方面采用neo4j图数据库进行存储,并通过py2neo实现python程序对neo4j的操作。obilstm方面使用tensorflow-cpu和keras包进行模型训练。
[0020]
2、数据描述实验采用美国凯斯西储大学(cwru)滚动轴承故障数据集。该数据集的机理知识主要为对振动数据的介绍,振动数据为分别通过加速度传感器在轴承驱动端(drive end)和风扇端(fan end)以及电机基座(base)采集振动信号数据,机理知识中的设备特征包括分别在电机负载分别为0、1、2、3马力(hp),所对应的电机旋转速度分别为1797、1772、1750、1730(r/min)。通过人为电火花加工分别在轴承内圈(inner race)、滚珠(ball)、轴承外圈(out race)制作出单点损伤故障,每种故障包含故障尺寸为0.007inches(轻度损伤)、0.014inches(中度损伤)、0.021inches(重度损伤)。其中,轴承外圈的损伤点分别设在3点钟、6点钟、12点钟三个位置,振动频率有12khz和48khz两种。本次实验将以上振动数据的机理知识作为fdm-kdf方法的文本描述部分进行图谱实体抽取,不同特征下对应的轴承振动数据作为结构化数据进行故障分类以及关系抽取。轴承正常数据只提取了驱动端加速度传感器和风扇端加速度传感器样本,传感器的采样频率分别为12khz,包括正常数据以及滚动体、内圈、外圈3种不同故障位置。
[0021]
试验一:故障图谱的构建本次实验只选取12khz数据,分类指标包括振动端(end)、轴承零件位置(location)、损伤深度(size)、电机旋转速度(电机负载load)、损伤点钟(clock)共计5种轴承特征,根据轴承数据集进行规则总结,总结的规则如下:
①
故障分为驱动端和风扇端两大部分;
②
驱动端和风扇端都有着滚动体、内圈、外圈故障;
③
滚动体、内圈、外圈故障数据都有损伤深度、损伤点钟、运转负载指标;
④
每份振动数据都是由轴承驱动端和风扇端以及电机基座三通道数据组成,每个通道数据都可计算得到最值、平均值以及标准偏差。
[0022]
根据上述规则进行名称符号化,分别为驱动端(de)、风扇段(fe)、滚动体(bo)、内圈(ir)、外圈(or)、深度7(size7)、深度14(size14)、深度21(size21)、载荷0(load0)、载荷1(load1)、载荷2(load2)、载荷3(load3)、点钟3(clock3)、点钟6(clock6)、点钟12(clock12)。
[0023]
根据以上规则以及指标,则有五层规则节点如下:一级规则节点(fault_level_1):end,共分2类;二级规则节点(fault_level_2):end_location,共计6类;三级规则节点(fault_level_3):end_location_size,共计18类;四级规则节点(fault_level_4):end_location_size_load,共计72类;五级规则节点(fault_level_5):end_location_size_load_clock,共计97类;另外加入故障(fault)节点作为所有节点的最上级节点。
[0024]
录入知识图谱的属性有节点id(nodeid),名字(name),节点类型(type)和节点描述(describe)。如名字为de_or_size14_load0_clock6的规则节点,其id为75,节点类型为
fault_level_5,节点描述为驱动端外圈故障_深度14_载荷0_点钟6。
[0025]
根据分类导入cwru数据并进行初步处理,分别提取三个通道数据的最小值、最大值、平均值以及标准偏差。将提取的特征作为规则节点属性存入节点表格,并将表格存入csv文件。
[0026]
轴承设备的不同特征组成多层级的特征节点,obilstm进行准确故障分类获得不同层级间节点分类和从属关系。
[0027]
抽取的规则节点关系通过三元组进行表达,同样转化为csv表格存储,关系节点属性有起始实体节点(start_entity)、起始节点标签(start_label)、结束实体节点(end_entity)、结束节点标签(end_label)、关系类型(relationship)。该csv文件其中一行如下,起始实体节点为de_or_size14_load0_clock6,起始节点标签为fault_level_5,结束实体节点为de_or_size14_load0,结束节点标签为fault_level_4,关系类型为belongsto,此关系表示名字为de_or_size14_load0_clock6的五级规则节点属于名字为de_or_size14_load0的四级规则节点。
[0028]
使用python程序读取规则节点和节点关系csv文件,通过py2neo包操作neo4j导入neo4j数据库。通过py2neo和cypher语言进行图谱数据库的相关操作,将csv文件形式存储的三元组导入neo4j构建故障图谱。
[0029]
查询举例如图4所示,上传输入故障时序数据后点击查询,通过obilstm模型进行分类得到故障类型,将类型输入故障图谱进行查询,将查询结果进行展示。举例结果展示包括此故障的数据可视化,图谱节点展示,设备为风扇端,位置为轴承外圈,深度为0.0014inches,电机负载为3马力,电机速度为1730(r/min),方向为12点钟,同级相关故障展示。
[0030]
试验二:obilstm模型关系分类效果通过obilstm模型对故障类型进行准确分类,并根据分类结果作为图谱关系。根据规则节点类型,将训练集分别划分为6类、18类、72类、97类并进行标注,取100个数据点为一个时序片段。每个类型数据量约有12000,即每个训练集取1200个时序片段进行训练。
[0031]
针对分类类别多、收敛速度慢以及训练时间长问题,提出改进的lstm模型obilstm,进行对比的传统模型有:单层lstm和cnn 单层lstm。以上模型进行训练时采用各项参数均一致,训练模型时将训练集分为多个批次,批次大小(batch_size)为128,每轮迭代训练输入一个批次的数据,损失函数为softmax的交叉熵,以adam作为优化器来调整训练参数,一共迭代70轮。
[0032]
训练集、验证集和测试集的比例分别为6:2:2,抽取的时候采取随机采样的方式进行切割各个集合;并采取从多余的样本中随机采样的方式进行数据平衡,使得每种分类训练样本量相同。
[0033]
评价标准采用以下参数:
①
准确率(accuracy),表示在预测结果中,正确预测的数量/样本总数。
[0034]
②
损失(loss),损失函数在训练最后一轮时的大小。
[0035]
③
收敛速度(convergence rate),训练过程中准确率提高的速度,本文以达到准确率90%的迭代次数作为评判收敛速度的标准,\表示不曾达到90%的准确率。
[0036]
图5和图6分别为不同分类数下lstm与obilstm模型的准确率,其中曲线名称中的
端代表故障端,位置表示损伤位置,深度表示损伤深度,负载表示电机负载,点钟表示损伤的点钟方向,最后面的数字表示分类数量。可知分类数越多时分类效果越差,lstm模型收敛速度慢、分类数多时准确率降低明显。模型准确率数字对比如表2所示,对比可知obilstm模型表现出不同分类下准确率相近的稳定性,分类数量对准确率的影响较低,收敛速度快且准确率高。其原因在于obilstm使用双层双向lstm强化特征学习,使得多分类下效果同样明显,并使用cnn和注意力机制提升收敛速度。并且obilstm模型在训练集和测试集最多分类数(97类)时分类结果良好,波动较小并无较大差异,则此模型无过拟合、欠拟合等问题。
[0037]
表2各分类准确率对比模型2类6类18类72类97类obilstm10.99680.99390.94060.9490lstm10.97160.94410.74560.7699选取分类数最多层(97类)进行比较,obilstm模型与其他模型的准确率与loss如图7和图8所示,图中曲线名称代表进行对比的各个分类模型名称,包括obilstm模型、cnn lstm模型,lstm模型。各个模型的相应评价如表3示。
[0038]
表3各模型参数评价模型准确率损失收敛速度obilstm0.95030.126518cnn lstm0.92330.192133lstm0.76990.6169\由图7、图8及表3可知,与传统的cnn lstm以及lstm模型相比,obilstm模型准确率最高,loss最小,收敛速度最快。
[0039]
由此可知,obilstm模型在多分类问题上有着准确率高、loss小、收敛速度快、分类稳定的综合优点,解决了上文提出的分类问题。具体分析,开始的cnn层起到了特征提取的作用,从而提高收敛速度和准确率;第二层的bilstm层起到了分类划分训练作用,在保证高准确率同时提高训练速度;第三层的注意力机制层通过分配权重进行特征提取,从而提高训练速度和收敛速度;第四层的bilstm层对注意力层的结果进行强化训练,在准确率和loss方面优化;两层bilstm层后的正则化与dropout有效减轻过拟合问题,提高模型的泛化能力,保证了方法的稳定性。
[0040]
结论针对传统设备故障诊断难以将设备机理知识与设备运行数据有效结合的问题,提出一种基于知识和数据融合驱动的设备故障诊断方法。该方法主要分为两部分,其中第一部分针对设备机理知识,提取规则并符号化指标,组合作为故障图谱的规则节点,并结合规则节点和节点关系构建故障图谱。第二部分将规则节点作为分类依据,结合设备运行数据进行数据标注,通过obilstm模型进行分类训练,完成规则节点的关系抽取。利用cwru轴承故障数据进行实验验证,通过试验分析,构建了设备故障诊断领域图谱,对于轴承故障诊断多分类的准确率平均达到95.03%,提高了故障诊断准确率和收敛速度,并且可实现故障信息和关联故障的展示。
技术特征:
1.一种基于知识和数据融合驱动的设备故障诊断方法,其特征在于,包括下述步骤:s1:收集有关诊断目标设备的文本信息和时序样本数据,其中文本信息作为设备机理知识,时序样本数据作为设备运行数据;s2:对设备机理知识提取规则,将规则符号化提取出可作为分类依据的指标1(f1)、指标2(f2)直到指标n(f
n
);s3:将提取的各项指标进行组合分类,得到知识图谱的不同层级及不同类型的规则节点,包括一级规则节点(f1),二级规则节点f
1-f2,...,n级规则节点(f
1-f
2-...-f
n
);s4:将规则节点作为分类依据,对设备运行数据进行标注,并分成长度大小统一的数据段;s5:通过改进的长短时记忆网络模型进行分类训练,抽取图谱中不同层级规则节点对应的设备运行数据的分类关系;s6:将根据机理知识提取的规则节点与根据设备运行数据提取的节点关系构建关系三元组,并将规则节点、节点关系以csv文件的形式导入neo4j数据库生成故障图谱;s7:将设备故障数据输入故障图谱进行故障诊断,得到故障诊断结果和故障相关信息。2.根据权利要求1所述的一种基于知识和数据融合驱动的设备故障诊断方法,其特征在于:所述步骤s5中,通过改进的长短时记忆网络模型进行分类训练,抽取图谱中不同层级规则节点对应的设备运行数据的分类关系,步骤具体为:1-1)采用独热编码(one-hot encoding)对故障类别进行标记;1-2)加入一维卷积神经网络(1d-cnn)对原始运行状态数据的局部非相关性特征和弱周期性规律进行提取;1-3)加入双向长短期记忆网络(bilstm)模型,对1d-cnn处理后的振动信号的时序性数据的上下文数据特征进行提取,与此同时加入批归一化(bn)层和dropout层防止过拟合;1-4)将bilstm通道中所有特征值取全局平均值,经sigmoid激活函数得到每个通道的权重,最终不同通道乘上不同权重,实现对关键特征通道域的注意力机制;1-5)重复1-3),进一步提取时序性数据的上下文数据特征;1-6)最后分类层采用softmax多分类器得到故障样本分别为指定分类数目的不同故障的概率分布,采用交叉熵代价函数(cross-entropy cost function)作为模型的验证损失函数,输出分类结果。3.根据权利要求1所述的一种基于知识和数据融合驱动的设备故障诊断方法,其特征在于:所述步骤s6中,将根据机理知识提取的规则节点与根据设备运行数据提取的节点关系构建关系三元组,并将规则节点、节点关系以csv文件的形式导入neo4j数据库生成故障图谱,步骤如下:2-1)通过关系连接各规则节点,构建关系三元组(f
1-f
2-...-fn,r
n
,f
1-f
2-...-f
n-1
),表示n级规则节点f
1-f
2-...-fn与n-1级规则节点f
1-f
2-...-f
n-1
之间的关系为rn;2-2)将关系三元组通过csv表格文件的形式保存,表格列有起点节点id(start_id)、起点节点名称(start_name)、终点节点id(end_id)、终点节点名称(end_name)、关系(relation)列;2-3)使用py2neo编写cypher数据库语句,包括新建节点、新建节点属性、新建节点关系、删除节点与关系、查询节点、查询关系等,以此生成图谱构建模型,其中py2neo是neo4j
数据库的python驱动包,cypher是适用于neo4j数据库的描述性的图形查询语言;2-4)读取规则节点和节点关系csv文件,通过图谱构建模型导入neo4j数据库,生成知识图谱节点、属性、关系,其中neo4j是图形数据库,可生成并展示知识图谱。
技术总结
本发明公开了一种基于知识和数据融合驱动的设备故障诊断方法包括下述步骤:S1.收集有关诊断目标设备的设备机理知识和设备运行数据;S2.提取设备机理知识中的分类指标,并进行组合得到图谱的规则节点;S3.将规则节点作为分类依据,对设备运行数据进行标注;S4.通过改进的长短时记忆网络模型进行分类,抽取规则节点间关系;S5.将规则节点与节点关系结合构建故障图谱;S6.故障设备数据输入故障图谱进行分类,输出故障类型和相关故障。本发明针对传统故障诊断方法依赖单一知识或数据的问题,结合设备机理知识和设备运行数据构建故障图谱进行诊断,保证了知识和数据的充分利用,以及在多分类下设备故障诊断的准确率。及在多分类下设备故障诊断的准确率。及在多分类下设备故障诊断的准确率。
技术研发人员:刘晶 高立超 季海鹏 魏磊
受保护的技术使用者:河北工业大学
技术研发日:2021.07.27
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-12506.html