本发明涉及轴承剩余寿命预测领域,具体涉及一种可解释的跨工况的轴承剩余使用寿命预测方法。
背景技术:
1、phm(故障预测与健康管理)聚焦于复杂工程健康状态的监测、预测和管理,其起源于上世纪欧美发达国家,最早应用于航空航天领域,是从工程领域提炼,并且不断系统化、体系化的一门系统工程学科。phm能降低设备维护成本,减少设备故障给生产和管理带来的损失,保障产品生产过程的流畅进行。目前在各个领域的设备维护过程中都会用到phm技术,比如制动装置、发动机、传动装置等。rul(剩余使用寿命)预测是其主要任务之一,对设备的rul进行预测,从而对设备的健康状态进行定量描述,形成最终维护策略。一种好的rul预测方法可以保障工业生产有序高效地运行。轴承是许多重要设备的关键部件,它的寿命衰减情况在生产作业中极为重要,故对其剩余寿命的研究具有较大的价值。基于数据驱动的rul预测方法通过数据获取、数据预处理、特征工程、模型建立、模型训练与预测,建立一个有效的rul预测模型对监测数据进行处理以实现rul预测。
2、在实际生产的rul预测中,如何使用数据驱动的方法准确预测设备部件的寿命,仍然面临很多挑战。首先,在不同的工作条件下,轴承寿命衰减行为不尽相同,即,轴承寿命受运行环境影响,其退化特征分布情况也不同;其次,在模型训练过程中,模型中间过程的不可见对模型调优带来了困难,对特征及预测结果的可视化就具有重要意义。
3、现有的的预测框架camtcn(remaining useful life prediction of bearingsbased on convolution attention mechanism and temporal convolution network),该框架设计了高效自适应收缩模型,自适应消除噪声影响。采用注意力机制设计卷积注意力子网,之后结合时序卷积实现rul预测。在数据集上进行了大量实验。但是实验未考虑不同工作条件下的轴承衰减寿命趋势问题,只是分别对单一工作条件的轴承进行研究,模型的泛化能力没有体现。而若是每个单一工作条件都单独训练模型,则由于模型较为复杂,训练耗时较多,不适用于在线预测。本发明采用结合轴承真实工作条件信息和采样信息筛选合适数据集进行迁移训练,减少训练时长,充分利用已有信息,提高模型泛化能力。
4、现有的可迁移的卷积神经网络并采用多核最大均值差异衡量不同分布之间的差异(transferable convolutional neural network based remaining useful lifeprediction of bearing under multiple failure behaviors),提高模型的泛化能力。但是,也只考虑了单一工况下的不同轴承,未考虑不同工况,没有利用轴承工作环境已知信息。另外在超参数选取方面进行了大量的实验选择最优参数,费时费力。本发明对训练过程中的特征及特征差异进行可视化,根据差异变化情况动态调整平衡系数,使得模型优化具有可解释性,提高优化效率。
技术实现思路
1、本发明的目的在于提供一种可解释的跨工况的轴承剩余使用寿命预测方法,根据工业实际生产中生产设备传感器采集到的完整寿命周期轴承振动信号数据构成多源域数据集,对于不同运行工况的目标域数据集,计算相应的相似度指标,筛选合适的源域数据集。可视化迁移训练过程中提取的特征分布变化情况,优化迁移训练。在线预测时,在合适时刻对模型进行迁移训练更新。
2、本发明至少通过如下技术方案之一实现。
3、一种可解释的跨工况的轴承剩余使用寿命预测方法,包括以下步骤:
4、(1)、根据采集到的数据信息,计算数据集相似度指标,筛选出与目标域数据集最相似的源域数据集作为迁移训练源域训练数据集;
5、(2)、构建并训练时间步多通道时频域特征提取网络模型,提取时间步多通道时频域信息;
6、(3)、结合特征分布可视化和模型评价指标平衡优化目标;
7、(4)、指标记录展示及确定在线训练模型更新时刻。
8、进一步地,计算数据集相似度指标包括:
9、根据工业轴承和所部署传感器采集到的数据信息计算影响数据集相似度指标的数据因子,记为其中k为数据因子的个数,根据轴承的运行工况确定的环境因子为其中m为环境因子的个数,factori为和数据集相关的影响因子,对于不同的数据集,其相似度指标为:
10、
11、其中factori(s)为源域数据(s)第i个影响因子,factori(t)为目标域数据(t)第i个影响因子,diff(·,·)为计算因子差异函数,且进行归一化处理,αf为数据因子所占权重,则相似度为sim=1-diffs,t。
12、进一步地,所述时间步多通道时频域特征提取网络为多通道卷积和双向lstm构成的特征提取器,其中多通道卷积在不影响时域信息的情况下提取频域特征,双向lstm承接前面频域信息并且提取时域信息,最终输出时频域特征f,之后由rul预测器学习时频域特征到rul标签的映射。
13、进一步地,在训练之前,将筛选出的源域数据集和目标域数据集进行快速傅里叶变换,将变换后获得的频域信息按特定时间步划分作为时间步多通道时频域特征提取网络模型的输入数据;
14、进一步地,在模型训练时,先对模型进行预训练,只用带标签的源域数据集进行对模型监督训练,保存训练后的模型参数,之后添加用于迁移学习特征分布对齐的分布对齐映射器,结合特征提取器和rul预测器进行迁移训练;迁移训练时训练数据为源域数据和目标域数据,且特征提取器和rul预测器的模型参数初始化为预训练保存的模型参数。
15、进一步地,对迁移学习,其源域和目标域数据分属于不同的分布,时间步多通道时频域特征提取网络模型在无标签目标域数据上的预测误差存在上界:
16、ed(fd,f)≤ed(fd,f★)+ed(f,f★)≤λ+es(fs,f)+|et(f,f★)-es(f,f★)| (2)
17、其中,ed(·,·)表示两个模型在数据域d上的预测误差,fd为数据域d上数据到特征的真实映射,d∈(s、t)分别表示源域数据集和目标域数据集,es(fs,f)表示模型f和源域数据真实的特征映射fs在源域数据集上的预测误差,f★表示在源域和目标与数据集上总体预测误差最小的模型,此时最小误差记为λ,通过缩小源于数据和目标域数据的分布差异提高模型预测性能,在迁移训练时,模型的总优化目标为:
18、ltotal=lrul+λltransfer (3)
19、即总优化目标ltotal包括预测损失lrul和迁移损失ltransfer,其中λ用来平衡两个损失。
20、进一步地,对于特征分布可视化,具体实现为:记单个样本经时间步多通道时频域特征提取网络模型提取的特征为fi={fi1,fi2,...,fil},fij表示第i个数据的第j个特征分量,l表示特征向量长度,选择特定映射g:rl→r,rl表示,维欧几里得空间,g表示从,维欧几里得空间到一维欧几里得空间的映射,对每个特征进行映射得g(fi)表示对高维特征进行降维映射所得结果,n表示数据集中的样本量,绘制此分布的直方图观察具体分布情况。
21、进一步地,对于模型评价指标差异,选择四个评价指标,分别为:
22、
23、
24、
25、其中mae为平均绝对误差的英文首字母缩写,rmse为均方根误差的缩写,score为特定的得分,yi表示实际剩余使用寿命,表示预测所得的剩余使用寿命,qi为ieee phm2012给出的不同衰减速率的分段指数函数:
26、
27、
28、将上述四个指标依次为为训练模型所得指标,为期望指标,根据四个指标公式,mae和rmse指标越小,模型性能越好,而对于score和r2来说,则是数值越大,模型越小,总的模型指标差异为:
29、
30、差异越大说明模型越差,而若为负数时,说明此时模型性能比期望的性能更好。进一步地,根据分布差异对平衡系数进行动态调节,具体为:
31、λ=λ(1+pct)
32、其中λ表示预测损失和迁移损失之间的平衡系数,pct为根据分布差异数值确定的分段函数。
33、进一步地,所述根据分布差异数值确定的分段函数为:
34、
35、其中dffeature表示特征分布之间的差异。
36、与现有技术相比,本发明具有如下有益效果:
37、(1)本发明结合实际自适应计算数据集相似度指标。将相似度指标划分为两类,一类为根据采样数据计算所得的数据因子,一类为和轴承运行相关的环境因子。其中数据量足够时,数据因子包含的信息更为准确、丰富;而环境因子则更明确、易得。根据数据情况,自适应调整两类因子的权重,可以更准确的获得不同数据集之间的相似度。根据相似度指标从多源域数据集中筛选出合适的数据集有利于模型快速收敛,提高模型训练效率。
38、(2)本发明对高维特征进行可视化和分析。对时间步多通道卷积+双向lstm网络提取所得的高维特征进行可视化,通过绘制特征向量的二范数分布直方图和平面散点图展示网络模型的效果,对模型的作用提供直观了解的途径,对优化模型提供参考依据。
39、(3)本发明动态调节损失平衡系数并对定量评价指标进行展示。计算高维特征的分布差异,根据分布差异值动态调整在迁移训练过程中平衡构成总优化目标的rul预测损失和迁移损失的系数,结合特征变化情况制定最合适的调节方案。计算每轮训练获得的模型定量评价指标并记录,训练结束绘制变化折线图。结合特征分布可视化及平衡系数变化和评价指标变化分析参数对结果的影响,确定模型优化方向。
1.一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,计算数据集相似度指标包括:
3.根据权利要求1所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,所述时间步多通道时频域特征提取网络为多通道卷积和双向lstm构成的特征提取器,其中多通道卷积在不影响时域信息的情况下提取频域特征,双向lstm承接前面频域信息并且提取时域信息,最终输出时频域特征f,之后由rul预测器学习时频域特征到rul标签的映射。
4.根据权利要求3所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,在训练之前,将筛选出的源域数据集和目标域数据集进行快速傅里叶变换,将变换后获得的频域信息按特定时间步划分作为时间步多通道时频域特征提取网络模型的输入数据。
5.根据权利要求4所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,在模型训练时,先对模型进行预训练,只用带标签的源域数据集进行对模型监督训练,保存训练后的模型参数,之后添加用于迁移学习特征分布对齐的分布对齐映射器,结合特征提取器和rul预测器进行迁移训练;迁移训练时训练数据为源域数据和目标域数据,且特征提取器和rul预测器的模型参数初始化为预训练保存的模型参数。
6.根据权利要求5所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,对迁移学习,其源域和目标域数据分属于不同的分布,时间步多通道时频域特征提取网络模型在无标签目标域数据上的预测误差存在上界:
7.根据权利要求1所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,对于特征分布可视化,具体实现为:记单个样本经时间步多通道时频域特征提取网络模型提取的特征为fi={fi1,fi2,…,fil},fij表示第i个数据的第j个特征分量,l表示特征向量长度,选择特定映射g:rl→r,rl表示l维欧几里得空间,g表示从l维欧几里得空间到一维欧几里得空间的映射,对每个特征进行映射得g(fi)表示对高维特征进行降维映射所得结果,n表示数据集中的样本量,绘制此分布的直方图观察具体分布情况。
8.根据权利要求1所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,对于模型评价指标差异,选择四个评价指标,分别为:
9.根据权利要求1所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,根据分布差异对平衡系数进行动态调节,具体为:
10.根据权利要求9所述的一种可解释的跨工况的轴承剩余使用寿命预测方法,其特征在于,所述根据分布差异数值确定的分段函数为: