1.本发明属于智能交通领域,涉及一种面向共享式自行车数据不平衡的故障诊断方法。
背景技术:
2.共享式自行车系统(bike sharing system,bss)在世界各地得到了广泛的应用,目前分为锁桩式bss(公共自行车系统)和无锁桩式bss(共享单车)。随着共享式自行车数量的不断增加,出现了许多故障的共享式自行车,需要一种准确的共享式自行车的故障诊断方法来诊断故障。传统的共享式自行车故障诊断方法主要通过用户上报和工人巡检的方式。但这种方法在实际应用中会出现诊断被动、效率低下等问题,出现了故障自行车在道路上堆积的现象。针对上述现象,部分研究者结合共享式自行车运营数据和机器学习算法,提出了共享式自行车的故障诊断方法,改善了共享式自行车故障诊断被动、效率低下等问题,但缺乏了对共享式自行车数据不平衡问题的考虑,诊断的精度、召回率不高。共享式自行车好车数量大于坏车数量,是一个典型的数据不平衡问题。数据不平衡问题,会导致预测精度、召回率的降低。
技术实现要素:
3.为了提高共享式自行车故障识别率,本发明提出了面向共享式自行车数据不平衡的故障诊断方法。
4.面向共享式自行车数据不平衡的故障诊断方法,其具体技术方案如下:
5.步骤一:从共享式自行车历史运营数据、维修数据和用户故障上报数据中提取特征:
6.共享自行车故障的主要原因是用户的不合理运用、长期的使用等。因此,从bss历史运营数据和维修数据中进行筛选,选择更易于和bss自行车故障联系起来的特征,将bss自行车的总使用次数c、服役时长ts、总使用时长tu、异常次数n
abnormal
、维修次数n
repair
共5个原始数据作为bss故障诊断的初始特征。
7.其中,c表示bss自行车总使用次数。
8.ts表示bss自行车服役时长,以天为单位。
9.tu表示bss自行车总使用时间,以分钟为单位。
10.n
abnormal
表示bss自行车历史异常使用次数。
11.n
repair
表示bss自行车历史维修次数。
12.通过用户上报数据集作为数据标签集,将用户上报故障的当日车辆作为故障车,用y={-1,1}表示(1:故障样本或小样本数据,-1:非故障样本或大样本数据)。
13.步骤二:进行特征组合:
14.为了进一步提升bss故障诊断方法故障识别的准确率,对共享自行车的原始数据进行了特征组合。特征组合如下:
15.c
avg
表示bss自行车日平均使用次数:
[0016][0017]
p
ravg
表示bss自行车每次维修率:
[0018][0019]
p
aavg
表示bss自行车每次异常使用率:
[0020][0021]rus
表示bss自行车使用服役比:
[0022][0023]
t
uavg
表示bss自行车平均使用时长,单位为分钟:
[0024][0025]
通过特征组合,得到特征数据集x={c,ts,tu,n
abnormal
,n
repair
,c
avg
,p
ravg
,p
aavg
,r
us
,t
uavg
},每一个样本用xi表示。
[0026]
步骤三:对特征数据集进行smote-enn改进算法操作,改善数据不平衡问题:
[0027]
1.通过提取原始特征和特征组合,获取bss样本不平衡特征数据x={x1,x2,
…
xm}及标签yi∈y={-1,1},组成数据集s={x,y}。
[0028]
2.通过smote算法,重采样数据集s={x,y},得到数据集s
′
={x
′
,y
′
}。
[0029]
3.初始化粒子群种群,粒子种群参数n、l,
[0030]
4.更新粒子群算法中的速度vi,
[0031]
5.对于每一个参数k,有k=2n 1,...,2n 1 4l,k=k 2,做如下循环:
[0032]
6.使用式yk′
=knn(s
′
),用knn预测每个样本的类,记录在yk′
中。
[0033]
7.使用公式通过多个k进行分类决策,将每一条数据最终决策的结果记录在y
″
中。
[0034]
其中,
[0035]
8.将决策后的y
″
与原数据集标签y进行比较,若两者的标签不一样,则数据被判定为异常样本,进行删除。获得删除异常样本数据集后的s
″
。
[0036]
9.将数据集输入支持向量机中进行建模,输入故障识别的准确率。
[0037]
10.当未满足粒子群算法的迭代条件时,更新粒子群的速度和种群参数n、l。
[0038]
11.重复5-10的步骤,直到满足迭代条件。
[0039]
12.最终输出种群参数n、l以及故障识别的准确率。
[0040]
步骤四:构建共享式自行车故障诊断的算法模型:
[0041]
把svm运用到共享自行车故障诊断方法中,将其分类曲线构造为如下函数:
[0042]
f(xi)=《ωφ(xi)》 b
ꢀꢀꢀ
(6)
[0043]
式中,xi表示10维的共享自行车特征数据集,f(xi)为共享自行车分类的分割曲线,ω和b分别为法向量和偏移量,通过引入拉格朗日乘子αi和αi,采用拉格朗日乘子法进行求解得到的回归函数:
[0044][0045]
其中,为核函数。选用高斯核函数作为预测模型的核函数。
[0046]
通过svm算法的计算,最终即可通过共享式自行车实时数据对共享式自行车是否故障做出判断。
[0047]
本发明的优点是:改进smote-enn算法,提出面向共享式自行车故障车的故障诊断方法,提升了故障识别率。
附图说明
[0048]
图1是本发明方法的流程图。
[0049]
图2是本发明方法的效果图。
具体实施方式
[0050]
下面结合附图进一步说明本发明的技术方案。
[0051]
面向共享自行车数据不平衡的故障诊断方法,其方法流程如图1所示,具体技术方案如下:
[0052]
步骤一:从共享式自行车历史运营数据、维修数据和用户故障上报数据中提取特征:
[0053]
共享自行车故障的主要原因是用户的不合理运用、长期的使用等。因此,从bss历史运营数据和维修数据中进行筛选,选择更易于和bss自行车故障联系起来的特征,将bss自行车的总使用次数c、服役时长ts、总使用时长tu、异常次数n
abnormal
、维修次数n
repair
共5个原始数据作为bss故障诊断的初始特征。
[0054]
其中,c表示bss自行车总使用次数。
[0055]
ts表示bss自行车服役时长,以天为单位。
[0056]
tu表示bss自行车总使用时间,以分钟为单位。
[0057]nabnormal
表示bss自行车历史异常使用次数。
[0058]nrepair
表示bss自行车历史维修次数。
[0059]
通过用户上报数据集作为数据标签集,将用户上报故障的当日车辆作为故障车,用y={-1,1}表示(1:故障样本或小样本数据,-1:非故障样本或大样本数据)。
[0060]
步骤二:进行特征组合:
[0061]
为了进一步提升bss故障诊断方法故障识别的准确率,对共享自行车的原始数据进行了特征组合。特征组合如下:
[0062]cavg
表示bss自行车日平均使用次数:
[0063][0064]
p
ravg
表示bss自行车每次维修率:
[0065][0066]
p
aavg
表示bss自行车每次异常使用率:
[0067][0068]rus
表示bss自行车使用服役比:
[0069][0070]
t
uavg
表示bss自行车平均使用时长,单位为分钟:
[0071][0072]
通过特征组合,得到特征数据集x={c,ts,tu,n
abnormal
,n
repair
,c
avg
,p
ravg
,p
aavg
,r
us
,t
uavg
},每一个样本用xi表示。
[0073]
步骤三:对特征数据集进行smote-enn改进算法操作,改善数据不平衡问题:
[0074]
1.通过提取原始特征和特征组合,获取bss样本不平衡特征数据x={x1,x2,
…
xm}及标签yi∈y={-1,1},组成数据集s={x,y}。
[0075]
2.通过smote算法,重采样数据集s={x,y},得到数据集s
′
={x
′
,y
′
}。
[0076]
3.初始化粒子群种群,粒子种群参数n、l,
[0077]
4.更新粒子群算法中的速度vi,
[0078]
5.对于每一个参数k,有k=2n 1,...,2n 1 4l,k=k 2,做如下循环:
[0079]
6.使用式yk′
=knn(s
′
),用knn预测每个样本的类,记录在yk′
中。
[0080]
7.使用公式通过多个k进行分类决策,将每一条数据最终决策的结果记录在y
″
中。
[0081]
其中,
[0082]
8.将决策后的y
″
与原数据集标签y进行比较,若两者的标签不一样,则数据被判定为异常样本,进行删除。获得删除异常样本数据集后的s
″
。
[0083]
9.将数据集输入支持向量机中进行建模,输入故障识别的准确率。
[0084]
10.当未满足粒子群算法的迭代条件时,更新粒子群的速度和种群参数n、l。
[0085]
11.重复5-10的步骤,直到满足迭代条件。
[0086]
12.最终输出种群参数n、l以及故障识别的准确率。
[0087]
步骤四:构建共享式自行车故障诊断的算法模型:
[0088]
把svm运用到共享自行车故障诊断方法中,将其分类曲线构造为如下函数:
[0089]
f(xi)=《ωφ(xi)》 b
ꢀꢀꢀ
(6)
[0090]
式中,xi表示10维的共享自行车特征数据集,f(xi)为共享自行车分类的分割曲线,ω和b分别为法向量和偏移量,通过引入拉格朗日乘子αi和αi,采用拉格朗日乘子法进行求解得到的回归函数:
[0091][0092]
其中,为核函数。选用高斯核函数作为预测模型的核函数。
[0093]
通过svm算法的计算,最终即可通过共享式自行车实时数据对共享式自行车是否故障做出判断。
[0094]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
转载请注明原文地址:https://tc.8miu.com/read-703.html