1.本发明涉及医疗器械的技术领域,更具体地,涉及一种基于平滑处理及融合的血糖预测方法、系统及医疗设备。
背景技术:
2.近年来,随着人们生活水平的提升,人们生活方式也在不断改变,工作强度增大,体力活动明显减少,生活节奏的加快也使得人们长期处于应激环境,导致糖尿病患者的人数激增,糖尿病从少见病变成了一种流行病。
3.糖尿病是一个终身疾病,目前医学水平无法根除治愈,因此,对糖尿病患者的血糖的监测就显得尤为重要。糖尿病患者的血糖调节能力差,当其外源性碳水化合物的摄入行为发生变化时,可能引起体内血糖的大幅波动,而血糖波动会造成机体器官的损害,加速并发症的发生。由此引发思考,若能对糖尿病患者的外源性摄入行为进行积极的人为干预,及时提醒糖尿病患者在有效时间内摄入碳水化合物,对糖尿病患者能享受正常生活而言相当重要,而准确地对血糖进行预测,是实现上述目的的前提,从而为糖尿病患者在日常生活中方便的提供血糖依据。
4.现有技术中公开了一种无创血糖测量方法,该方案以随机森林算法以及神经网络预测算法为基础,首先测量待测个体指端的能量代谢参数,并发送至测量主机,测量主机调用随机森林算法预测待测个体指端的能量代谢参数的血糖类别,并调取对应的神经网络预测算法计算待测个体指端的血糖值,实现了血糖的无创预测,对于同一个人,该方案在血糖变化比较平稳阶段具有较高准确度,但在血糖波动较大的阶段其血糖预测准确度明显降低,无法适应个体饮食行为的变化。
技术实现要素:
5.为解决当前采用传统血糖预测方法无法适应个体饮食行为变化,导致血糖预测准确度低的问题,本发明提出一种基于平滑处理及融合的血糖预测方法、系统及医疗设备,降低个体饮食行为变化对预测结果产生的偏差,提高血糖预测结果的准确度,为糖尿病患者在日常生活中自我监测血糖水平并采取自我干预措施提供参考。
6.为了达到上述技术效果,本发明的技术方案如下:
7.一种基于平滑处理及融合的血糖预测方法,包括:
8.s1.确定个体饮食行为及数据采集时段,采集n次个体在不同饮食行为下的生理指标数据作为原始特征值,并实测生理指标数据同步对应的血糖值,作为血糖参考值;
9.s2.基于原始特征值形成原始特征值矩阵,对原始特征值矩阵中的原始特征值进行归一化处理,得到新特征值,形成新特征值矩阵;
10.s3.计算新特征值的相关系数,基于相关系数对新特征值进行平滑处理,得到平滑特征值,并将平滑特征值划分为训练集、验证集和测试集;
11.s4.引入随机森林模型,利用随机森林模型计算平滑特征值的特征贡献率并排序,
并选择特征贡献率大于零的平滑特征值;
12.s5.从训练集中选择排序在前e位的平滑特征值并抽取,作为固定集合,剩余的平滑特征值均分为f组集合,将均分的f组集合与e位平滑特征值组合成新的特征向量,并形成f个特征矩阵;
13.s6.利用f个特征矩阵以及其同步对应的血糖参考值训练随机森林模型,得到f个血糖预测模型;
14.s7.将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵;
15.s8.基于第一血糖预测结果矩阵,计算f个血糖预测模型的最优相关系数;
16.s9.将测试集依次输入f个血糖预测模型,得到第二血糖预测结果矩阵,利用s8得到的最优相关系数对第二血糖预测结果矩阵进行融合,得到最终的血糖预测值。
17.优选地,步骤s1所述的个体饮食行为包括:正常饮食、空腹行为、生酮饮食、高糖饮食;所述的数据采集时段包括:早上、中午、下午及晚上;个体的生理指标数据包括:个体体重、血压、血脂、心率、ppg心电信号、ecg脉电信号,这些生理指标数据作为反映个体生理特性的原始特征值,参与血糖预测,n次采集的数据组成n个样本数据集。
18.优选地,设原始特征值组成n
×
k的原始特征值矩阵:
[0019][0020]
其中,原始特征值矩阵中每一行代表n个数据样本中每一个数据样本含有k个特征值,设某一列代表n个数据样本的相同类型特征值,记为y;对每一个y进行归一化,归一化公式为:
[0021][0022]
其中,y
′
表示某一列代表n个数据样本的相同类型特征值归一化后的新特征值,归一化后形成新特征值矩阵x':
[0023][0024]
在此,考虑不同生理指标数据会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性,有利于保证后续血糖预测的准确度。
[0025]
优选地,某一列代表n个数据样本的相同类型特征值归一化后的新特征值为y
′
,y
′
∈irn×1,设新特征值矩阵x'中不同数据样本下相同类型特征值的相关系数为w1,y
′
对应的该列代表n个数据样本的相同类型特征值平滑处理后得到的平滑特征值为x,x∈irn×1利用x=y
′
·
w1将n个数据样本的相同类型特征值y
′
平滑处理,过程为:
[0026]
建立目标函数:在最大时,即:时,x
ty′
t
w1》0,w
1ty′y′
t
w1=c成立,c是常数,求解出相关系数为w1,根据x=y
′
·
w1求得该列平滑特征值x,重复以上过程,直至求出新特征值矩阵中所有列代表的相同类型特征值的平滑特征值,形成平滑特征值矩阵x,表式为:
[0027][0028]
将n个样本数据集平滑处理后的n个平滑样本数据集划分为含a个平滑样本的训练集、含b个平滑样本的验证集及含c个平滑样本的测试集,即n=a+b+c。
[0029]
在此,通过相关系数将特征值进行平滑处理,使特征值与对应血糖实测值的关系更具相关性。
[0030]
优选地,设随机森林模型中共n棵决策树,计算第j个特征值在第i棵决策树的重要性值,计算表达式为:
[0031][0032]
其中,表示第j个平滑特征值的重要性值,表示第j个平滑特征值在第i棵决策树的重要性值,表达式为:
[0033][0034]
其中,ginim、gini
l
、ginir分别表示随机森林模型中节点m、节点l、节点r的基尼指数,任意一个节点的基尼指数计算表达式为:
[0035][0036]
其中,gini表示随机森林模型中节点m的基尼指数;k表示平滑特征值的个数,k表示当前计算的第k个平滑特征值;p
mk
表示随机森林模型中节点m中第k个平滑特征值所占的比例;平滑特征值的特征贡献率的表达式为:
[0037][0038]
其中,k表示平滑特征值的个数;vimj表示第j个平滑特征值的贡献率,表示所有平滑特征值的重要性之和;
[0039]
设d表示每个数据样本中平滑特征值大于零的个数,挑选出d个特征值组成的原平滑特征值矩阵x表示为x
″
:
[0040][0041]
优选地,在步骤s5中,从训练集中选择排序在前e位的平滑特征值抽取,作为固定集合表征为:[x1,x2,
…
,xe],剩余的平滑特征值为d-e个表征为[x
e+1
,
…
,xd],均分为f组集合,表征为:
[0042][0043]
将均分的f组集合与e位平滑特征值组合成新的特征向量,形成f个特征矩阵x1,
…
,xu,
…
,xf,其中,任意一个特征矩阵xu表达为:
[0044][0045]
特征矩阵x1,
…
,xu,
…
,xf中的每一个均有同步对应的a个实测的血糖值,在步骤s6中,特征矩阵x1,
…
,xu,
…
,xf中的每一个特征矩阵及其同步对应的a个实测的血糖值分别输入随机森林模型,特征矩阵中的每一个数据样本对一个实测的血糖值,以实际血糖值作为输出,以每一个特征矩阵作为输入,将输出与输入之间的误差作为训练目标,在训练目标收敛最优时,每一个特征矩阵对应的随机森林模型训练完成,作为f个血糖预测模型。
[0046]
在此,将特征贡献率不同的特征值进行组合,充分考虑了特征值对预测结果的影响。
[0047]
优选地,在步骤s7中,验证集中含有b个数据样本,将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵的过程为:
[0048]
将验证集中按特征贡献率从大到小排序得到前个数据样本的特征值,形成的特征矩阵,表达为:
[0049][0050]
将该特征矩阵依次输入f个血糖预测模型中,得到b
×
f的第一血糖预测结果矩阵f,表达为:
[0051][0052]
其中,每一个血糖预测模型输出的预测向量结果表达为:[f
h1
,f
h2
,
…
,f
hf
],h=1,
…
,b;
[0053]
设f个血糖预测模型的相关系数为w2,设r为b个平滑样本验证集对应的实测血糖值组成的矩阵,在步骤s8中,基于第一血糖预测结果矩阵f,f∈irb×f,r∈irb,利用f
·
w2=r的关系,得到w2∈irf,求解2范数取得最小值时的相关系数w2,求得的w2即为最佳相关系数w
2*
。
[0054]
优选地,步骤s9的具体过程为:
[0055]
将含c个平滑样本的测试集依次输入f个血糖预测模型,每一个血糖预测模型得到的第二预测结果矩阵表征为:[f
g1
,f
g2
,
…
,f
gf
],g=1,
…
,c;
[0056]
将每一个血糖预测模型得到的第二预测结果矩阵组合,得到整体的第二血糖预测结果矩阵,表征为:
[0057][0058]
利用s8得到的最优相关系数w
2*
对整体的第二血糖预测结果矩阵进行融合,得到最终的血糖预测值,表达式为:
[0059][0060]
其中,z1,
…
,zc表示含c个平滑样本的测试集对应的最终的血糖预测值。
[0061]
在此,利用最优相关系数对不同预测模型得到的结果矩阵进行融合,得到最终血糖预测结果,大幅减小了行为变化对预测结果产生的偏差,提高了血糖值预测结果的准确度。
[0062]
本发明内容中还提出一种基于平滑处理及融合的血糖预测系统,所述系统用于实现所述的血糖预测方法,包括:
[0063]
数据采集单元,用于确定个体饮食行为及数据采集时段,采集n次个体在不同饮食行为下的生理指标数据作为原始特征值,并实测生理指标数据同步对应的血糖值,作为血糖参考值;
[0064]
归一化单元,基于原始特征值形成原始特征值矩阵,对原始特征值矩阵中的原始特征值进行归一化处理,得到新特征值,形成新特征值矩阵;
[0065]
平滑处理单元,用于计算新特征值的相关系数,基于相关系数对新特征值进行平滑处理,得到平滑特征值,并将平滑特征值划分为训练集、验证集和测试集;
[0066]
特征贡献率计算单元,引入随机森林模型,利用随机森林模型计算平滑特征值的特征贡献率并排序,并选择特征贡献率大于零的平滑特征值;
[0067]
特征组合单元,用于从训练集中选择排序在前e位的平滑特征值并抽取,作为固定集合,剩余的平滑特征值均分为f组集合,将均分的f组集合与e位平滑特征值组合成新的特征向量,并形成f个特征矩阵;
[0068]
训练单元,利用f个特征矩阵以及其同步对应的血糖参考值训练随机森林模型,得到f个血糖预测模型;
[0069]
验证单元,将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵;
[0070]
相关系数求解单元,基于第一血糖预测结果矩阵,计算f个血糖预测模型的最优相关系数;
[0071]
测试单元,将测试集依次输入f个血糖预测模型,得到第二血糖预测结果矩阵,利用最优相关系数对第二血糖预测结果矩阵进行融合,得到最终的血糖预测值。
[0072]
本发明内容中还提出一种医疗设备,所述医疗设备包括所述的基于平滑处理及融合的血糖预测系统。
[0073]
与现有技术相比,本发明技术方案的有益效果是:
[0074]
本发明提出一种基于平滑处理及融合的血糖预测方法、系统及医疗设备,首先从不同饮食行为出发,采集个体的原始数据特征值,为消除数据之间的量纲影响,对原始数据特征值进行归一化处理,然后通过相关系数将归一化后的特征值进行平滑处理,使特征值与对应血糖实测值的关系更具相关性,形成的特征矩阵作为数据集,并将其划分为训练集、验证集与测试集,将特征贡献率不同的特征值进行组合,充分考虑了特征值对血糖预测结果的影响,并且利用最优相关系数对不同血糖预测模型得到的血糖预测结果矩阵进行融合,得到最终血糖预测结果,充分考虑到行为变化带来的影响,大幅减小了饮食行为变化对预测结果产生的偏差,提高了血糖值预测结果的准确度,该方法可封装于系统,进一步形成医疗设备的应用,可为糖尿病患者在日常生活中自我预测血糖并采取自我干预措施提供指导,具有现实意义。
附图说明
[0075]
图1表示本发明实施例1中提出的基于平滑处理及融合的血糖预测方法的流程示意图;
[0076]
图2表示本发明实施例1中提出的f个血糖预测模型形成的过程示意图;
[0077]
图3表示本发明实施例2中提出的基于平滑处理及融合的血糖预测系统的示意图;
[0078]
图4表示本发明实施例3中提出的医疗设备的结构示意图。
具体实施方式
[0079]
附图仅用于示例性说明,不能理解为对本专利的限制;
[0080]
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
[0081]
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
[0082]
下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0083]
附图中描述位置关系的仅用于示例性说明,不能理解为对本专利的限制;
[0084]
实施例1
[0085]
如图1所示,本实施例提出一种基于平滑处理及融合的血糖预测方法,参见图1,该方法的出发点是考虑糖尿病患者的血糖调节能力差,当其外源性碳水化合物的摄入行为发生变化时,可能引起体内血糖的大幅波动,而血糖波动会造成机体器官的损害,加速并发症的发生,考虑如何贴近糖尿病患者的生活,设计一种方式,使得糖尿病在生活中能在血糖预测准确度有保证的前提下,自我预测血糖水平并采取自我干预措施,最根本的,本方法围绕以下实施步骤展开:
[0086]
s1.确定个体饮食行为及数据采集时段,采集n次个体在不同饮食行为下的生理指标数据作为原始特征值,并实测生理指标数据同步对应的血糖值,作为血糖参考值;
[0087]
其中,个体饮食行为包括:正常饮食、空腹行为、生酮饮食、高糖饮食;所述的数据采集时段包括:早上、中午、下午及晚上;个体的生理指标数据包括:个体体重、血压、血脂、心率、ppg心电信号、ecg脉电信号,这些生理指标数据作为反映个体生理特性的原始特征值,参与血糖预测,n次采集的数据组成n个样本数据集,这里n次采集的数据即采集n次个体在不同饮食行为下的生理指标数据(原始特征值),还有实测生理指标数据同步对应的血糖值。
[0088]
s2.基于原始特征值形成原始特征值矩阵,对原始特征值矩阵中的原始特征值进行归一化处理,得到新特征值,形成新特征值矩阵;
[0089]
设原始特征值组成n
×
k的原始特征值矩阵:
[0090][0091]
其中,原始特征值矩阵中每一行代表n个数据样本中每一个数据样本含有k个特征值,设某一列代表n个数据样本的相同类型特征值,记为y;考虑不同生理指标数据会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性,有利于保证后续血糖预测的准确度,具体的,对每一个y进行归一化,归一化公式为:
[0092][0093]
其中,y
′
表示某一列代表n个数据样本的相同类型特征值归一化后的新特征值,归一化后形成新特征值矩阵x':
[0094][0095]
s3.计算新特征值的相关系数,基于相关系数对新特征值进行平滑处理,得到平滑特征值,并将平滑特征值划分为训练集、验证集和测试集;
[0096]
通过相关系数将特征值进行平滑处理,使特征值与对应血糖实测值的关系更具相关性,某一列代表n个数据样本的相同类型特征值归一化后的新特征值为y
′
,y
′
∈irn×1,具体做法为:
[0097]
设新特征值矩阵x'中不同数据样本下相同类型特征值的相关系数为w1,y
′
对应的该列代表n个数据样本的相同类型特征值平滑处理后得到的平滑特征值为x,x∈irn×1利用x=y
′
·
w1将n个数据样本的相同类型特征值y
′
平滑处理,过程为:
[0098]
建立目标函数:在最大时,即:时,x
ty′
t
w1》0,w
1ty′y′
t
w1=c成立,c是常数,求解出相关系数为w1,根据x=y
′
·
w1求得该列平滑特征值x,更具体的:
[0099]
设sb=y
′y′
t
,并设j(w1)=w
1t
saw
1-λw
1t
sbw1,得到s
b-1
saw=λw,设q=s
b-1
sa,由于sa以及sb均为满秩矩阵,则可令q=uv
t
,uv
t
ξ=λξ,u=ξ,v
t
ξ=λ
[0100]
设u1=1
[0101]
v=q(1,:)
t
[0102]
m=2,
…
,m
[0103]
综合c与d可解出w1,并根据x=y
′
·
w1,求得x。
[0104]
重复以上过程,直至求出新特征值矩阵中所有列代表的相同类型特征值的平滑特征值,形成平滑特征值矩阵x,表式为:
[0105][0106]
将n个样本数据集平滑处理后的n个平滑样本数据集划分为含a个平滑样本的训练集、含b个平滑样本的验证集及含c个平滑样本的测试集,即n=a+b+c。
[0107]
s4.引入随机森林模型,利用随机森林模型计算平滑特征值的特征贡献率并排序,并选择特征贡献率大于零的平滑特征值;
[0108]
在本实施例中,随机森林模型通过自助法重采样技术构建,利用bootstrap法从训练集中分别有放回地重复随机抽取若干个训练集样本生成新的训练集样本,对于每个新的训练集样本都建立决策树,随机森林模型的每颗决策树的预测结果作为一次预测投票,以少数服从多数作为预测结果。
[0109]
计算第j个特征值在第i棵决策树的重要性值,计算表达式为:
[0110][0111]
其中,表示第j个平滑特征值的重要性值,表示第j个平滑特征值在第i棵决策树的重要性值,表达式为:
[0112][0113]
其中,ginim、gini
l
、ginir分别表示随机森林模型中节点m、节点l、节点r的基尼指数,任意一个节点的基尼指数计算表达式为:
[0114][0115]
其中,gini表示随机森林模型中节点m的基尼指数;k表示平滑特征值的个数,k表示当前计算的第k个平滑特征值;p
mk
表示随机森林模型中节点m中第k个平滑特征值所占的比例;平滑特征值的特征贡献率的表达式为:
[0116][0117]
其中,k表示平滑特征值的个数;vimj表示第j个平滑特征值的贡献率,表示所有平滑特征值的重要性之和;
[0118]
设d表示每个数据样本中平滑特征值大于零的个数,挑选出d个特征值组成的原平滑特征值矩阵x表示为x
″
:
[0119][0120]
s5.从训练集中选择排序在前e位的平滑特征值并抽取,作为固定集合,剩余的平滑特征值均分为f组集合,将均分的f组集合与e位平滑特征值组合成新的特征向量,并形成f个特征矩阵;
[0121]
在本实施例中,将特征贡献率不同的特征值进行组合,充分考虑特征值对预测结果的影响,在步骤s5中,从训练集中选择排序在前e位的平滑特征值抽取,作为固定集合表征为:[x1,x2,
…
,xe],剩余的平滑特征值为d-e个表征为[x
e+1
,
…
,xd],均分为f组集合,表征为:
[0122]
[0123]
将均分的f组集合与e位平滑特征值组合成新的特征向量,形成f个特征矩阵x1,
…
,xu,
…
,xf,其中,任意一个特征矩阵xu表达为:
[0124][0125]
特征矩阵x1,
…
,xu,
…
,xf中的每一个均有同步对应的a个实测的血糖值,即假设n为10,每个样本含有14个特征值,将前5个特征值作为固定集合,剩余9个特征值平均分为3组,再组合成3个特征矩阵:
[0126][0127]
s6.利用f个特征矩阵以及其同步对应的血糖参考值训练随机森林模型,得到f个血糖预测模型;
[0128]
如图2所示,特征矩阵x1,
…
,xu,
…
,xf中的每一个特征矩阵及其同步对应的a个实测的血糖值分别输入随机森林模型,特征矩阵中的每一个数据样本对一个实测的血糖值,以实际血糖值作为输出,以每一个特征矩阵作为输入,将输出与输入之间的误差作为训练目标,在训练目标收敛最优时,每一个特征矩阵对应的随机森林模型训练完成,作为f个血糖预测模型。
[0129]
s7.将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵;
[0130]
验证集中含有b个数据样本,将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵的过程为:
[0131]
将验证集中按特征贡献率从大到小排序得到前个数据样本的特征值,形成的特征矩阵,表达为:
[0132][0133]
将该特征矩阵依次输入f个血糖预测模型中,得到b
×
f的第一血糖预测结果矩阵f,表达为:
[0134][0135]
其中,每一个血糖预测模型输出的预测向量结果表达为:[f
h1
,f
h2
,
…
,f
hf
],h=1,
…
,b;
[0136]
s8.基于第一血糖预测结果矩阵,计算f个血糖预测模型的最优相关系数;
[0137]
设f个血糖预测模型的相关系数为w2,设r为b个平滑样本验证集对应的实测血糖值组成的矩阵,在步骤s8中,基于第一血糖预测结果矩阵f,f∈irb×f,r∈irb,利用f
·
w2=r的关系,得到w2∈irf,求解2范数取得最小值时的相关系数w2,求得的w2即为最佳相关系数w
2*
,具体的:
[0138]
设j(w2)=w
2tft
fw
2-2r
t
fw2+r
t
r,令得w
2*
=(f
t
f)-1
fr。
[0139]
s9.将测试集依次输入f个血糖预测模型,得到第二血糖预测结果矩阵,利用s8得到的最优相关系数对第二血糖预测结果矩阵进行融合,得到最终的血糖预测值。
[0140]
在该步骤实施时,利用最优相关系数对不同预测模型得到的结果矩阵进行融合,得到最终血糖预测结果,可减小行为变化对预测结果产生的偏差,提高血糖值预测结果的准确度,具体过程为:
[0141]
将含c个平滑样本的测试集依次输入f个血糖预测模型,每一个血糖预测模型得到的第二预测结果矩阵表征为:[f
g1
,f
g2
,
…
,f
gf
],g=1,
…
,c;
[0142]
将每一个血糖预测模型得到的第二预测结果矩阵组合,得到整体的第二血糖预测结果矩阵,表征为:
[0143][0144]
利用s8得到的最优相关系数w
2*
对整体的第二血糖预测结果矩阵进行融合,得到最终的血糖预测值,表达式为:
[0145][0146]
其中,z1,
…
,zc表示含c个平滑样本的测试集对应的最终的血糖预测值。
[0147]
实施例2
[0148]
如图3所示,本实施例提出一种基于平滑处理及融合的血糖预测系统,所述系统用于实现实施例1所述的血糖预测方法,参见图3,所述系统包括:
[0149]
数据采集单元1,用于确定个体饮食行为及数据采集时段,采集n次个体在不同饮食行为下的生理指标数据作为原始特征值,并实测生理指标数据同步对应的血糖值,作为
血糖参考值;
[0150]
归一化单元2,基于原始特征值形成原始特征值矩阵,对原始特征值矩阵中的原始特征值进行归一化处理,得到新特征值,形成新特征值矩阵;
[0151]
平滑处理单元3,用于计算新特征值的相关系数,基于相关系数对新特征值进行平滑处理,得到平滑特征值,并将平滑特征值划分为训练集、验证集和测试集;
[0152]
特征贡献率计算单元4,引入随机森林模型,利用随机森林模型计算平滑特征值的特征贡献率并排序,并选择特征贡献率大于零的平滑特征值;
[0153]
特征组合单元5,用于从训练集中选择排序在前e位的平滑特征值并抽取,作为固定集合,剩余的平滑特征值均分为f组集合,将均分的f组集合与e位平滑特征值组合成新的特征向量,并形成f个特征矩阵;
[0154]
训练单元6,利用f个特征矩阵以及其同步对应的血糖参考值训练随机森林模型,得到f个血糖预测模型;
[0155]
验证单元7,将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵;
[0156]
相关系数求解单元8,基于第一血糖预测结果矩阵,计算f个血糖预测模型的最优相关系数;
[0157]
测试单元9,将测试集依次输入f个血糖预测模型,得到第二血糖预测结果矩阵,利用最优相关系数对第二血糖预测结果矩阵进行融合,得到最终的血糖预测值。
[0158]
本实施例所提出的系统,各单元用于封装实施例1所提出的方法对应的算法实施过程,再进一步将系统整合,可实现医疗领域的辅助应用。
[0159]
实施例3
[0160]
参见图4,本实施例提出一种医疗设备,所述医疗设备包括实施例2提出的基于平滑处理及融合的血糖预测系统,在糖尿病患者的日常生活中,该医疗设备进行的血糖预测结果可为糖尿病患者在日常生活中自我监测血糖水平并采取自我干预措施提供指导。
[0161]
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
技术特征:
1.一种基于平滑处理及融合的血糖预测方法,其特征在于,包括:s1.确定个体饮食行为及数据采集时段,采集n次个体在不同饮食行为下的生理指标数据作为原始特征值,并实测生理指标数据同步对应的血糖值,作为血糖参考值;s2.基于原始特征值形成原始特征值矩阵,对原始特征值矩阵中的原始特征值进行归一化处理,得到新特征值,形成新特征值矩阵;s3.计算新特征值的相关系数,基于相关系数对新特征值进行平滑处理,得到平滑特征值,并将平滑特征值划分为训练集、验证集和测试集;s4.引入随机森林模型,利用随机森林模型计算平滑特征值的特征贡献率并排序,并选择特征贡献率大于零的平滑特征值;s5.从训练集中选择排序在前e位的平滑特征值并抽取,作为固定集合,剩余的平滑特征值均分为f组集合,将均分的f组集合与e位平滑特征值组合成新的特征向量,并形成f个特征矩阵;s6.利用f个特征矩阵以及其同步对应的血糖参考值训练随机森林模型,得到f个血糖预测模型;s7.将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵;s8.基于第一血糖预测结果矩阵,计算f个血糖预测模型的最优相关系数;s9.将测试集依次输入f个血糖预测模型,得到第二血糖预测结果矩阵,利用s8得到的最优相关系数对第二血糖预测结果矩阵进行融合,得到最终的血糖预测值。2.根据权利要求1所述的基于平滑处理及融合的血糖预测方法,其特征在于,步骤s1所述的个体饮食行为包括:正常饮食、空腹行为、生酮饮食、高糖饮食;所述的数据采集时段包括:早上、中午、下午及晚上;个体的生理指标数据包括:个体体重、血压、血脂、心率、ppg心电信号、ecg脉电信号,这些生理指标数据作为反映个体生理特性的原始特征值,参与血糖预测,n次采集的数据组成n个样本数据集。3.根据权利要求2所述的基于平滑处理及融合的血糖预测方法,其特征在于,设原始特征值组成n
×
k的原始特征值矩阵:其中,原始特征值矩阵中每一行代表n个数据样本中每一个数据样本含有k个特征值,设某一列代表n个数据样本的相同类型特征值,记为y;对每一个y进行归一化,归一化公式为:其中,y
′
表示某一列代表n个数据样本的相同类型特征值归一化后的新特征值,归一化后形成新特征值矩阵x':
4.根据权利要求3所述的基于平滑处理及融合的血糖预测方法,其特征在于,某一列代表n个数据样本的相同类型特征值归一化后的新特征值为y
′
,y
′
∈ir
n
×1,设新特征值矩阵x'中不同数据样本下相同类型特征值的相关系数为w1,y
′
对应的该列代表n个数据样本的相同类型特征值平滑处理后得到的平滑特征值为x,x∈ir
n
×1利用x=y
′
·
w1将n个数据样本的相同类型特征值y
′
平滑处理,过程为:建立目标函数:在最大时,即:时,x
t
y
′
t
w1>0,w
1t
y
′
y
′
t
w1=c成立,c是常数,求解出相关系数为w1,根据x=y
′
·
w1求得该列平滑特征值x,重复以上过程,直至求出新特征值矩阵中所有列代表的相同类型特征值的平滑特征值,形成平滑特征值矩阵x,表式为:将n个样本数据集平滑处理后的n个平滑样本数据集划分为含a个平滑样本的训练集、含b个平滑样本的验证集及含c个平滑样本的测试集,即n=a+b+c。5.根据权利要求4所述的基于平滑处理及融合的血糖预测方法,其特征在于,设随机森林模型中共n棵决策树,计算第j个特征值在第i棵决策树的重要性值,计算表达式为:其中,表示第j个平滑特征值的重要性值,表示第j个平滑特征值在第i棵决策树的重要性值,表达式为:其中,gini
m
、gini
l
、gini
r
分别表示随机森林模型中节点m、节点l、节点r的基尼指数,任意一个节点的基尼指数计算表达式为:其中,gini表示随机森林模型中节点m的基尼指数;k表示平滑特征值的个数,k表示当前计算的第k个平滑特征值;p
mk
表示随机森林模型中节点m中第k个平滑特征值所占的比例;平滑特征值的特征贡献率的表达式为:
其中,k表示平滑特征值的个数;vim
j
表示第j个平滑特征值的贡献率,表示所有平滑特征值的重要性之和;设d表示每个数据样本中平滑特征值大于零的个数,挑选出d个特征值组成的原平滑特征值矩阵x表示为x
″
:6.根据权利要求5所述的基于平滑处理及融合的血糖预测方法,其特征在于,其中,在步骤s5中,从训练集中选择排序在前e位的平滑特征值抽取,作为固定集合表征为:[x1,x2,
…
,x
e
],剩余的平滑特征值为d-e个表征为[x
e+1
,
…
,x
d
],均分为f组集合,表征为:将均分的f组集合与e位平滑特征值组合成新的特征向量,形成f个特征矩阵x1,
…
,x
u
,
…
,x
f
,其中,任意一个特征矩阵x
u
表达为:特征矩阵x1,
…
,x
u
,
…
,x
f
中的每一个均有同步对应的a个实测的血糖值,在步骤s6中,特征矩阵x1,
…
,x
u
,
…
,x
f
中的每一个特征矩阵及其同步对应的a个实测的血糖值分别输入随机森林模型,特征矩阵中的每一个数据样本对一个实测的血糖值,以实际血糖值作为输出,以每一个特征矩阵作为输入,将输出与输入之间的误差作为训练目标,在训练目标收敛最优时,每一个特征矩阵对应的随机森林模型训练完成,作为f个血糖预测模型。7.根据权利要求6所述的基于平滑处理及融合的血糖预测方法,其特征在于,在步骤s7中,验证集中含有b个数据样本,将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵的过程为:将验证集中按特征贡献率从大到小排序得到前个数据样本的特征值,形成的特征矩阵,表达为:
将该特征矩阵依次输入f个血糖预测模型中,得到b
×
f的第一血糖预测结果矩阵f,表达为:其中,每一个血糖预测模型输出的预测向量结果表达为:[f
h1
,f
h2
,
…
,f
hf
],h=1,
…
,b;设f个血糖预测模型的相关系数为w2,设r为b个平滑样本验证集对应的实测血糖值组成的矩阵,在步骤s8中,基于第一血糖预测结果矩阵f,f∈ir
b
×
f
,r∈ir
b
,利用f
·
w2=r的关系,得到w2∈ir
f
,求解2范数取得最小值时的相关系数w2,求得的w2即为最佳相关系数w
2*
。8.根据权利要求7所述的基于平滑处理及融合的血糖预测方法,其特征在于,步骤s9的具体过程为:将含c个平滑样本的测试集依次输入f个血糖预测模型,每一个血糖预测模型得到的第二预测结果矩阵表征为:[f
g1
,f
g2
,
…
,f
gf
],g=1,
…
,c;将每一个血糖预测模型得到的第二预测结果矩阵组合,得到整体的第二血糖预测结果矩阵,表征为:利用s8得到的最优相关系数w
2*
对整体的第二血糖预测结果矩阵进行融合,得到最终的血糖预测值,表达式为:其中,z1,
…
,zc表示含c个平滑样本的测试集对应的最终的血糖预测值。9.一种基于平滑处理及融合的血糖预测系统,其特征在于,所述系统用于实现权利要求1~8任意一项所述的血糖预测方法,包括:数据采集单元,用于确定个体饮食行为及数据采集时段,采集n次个体在不同饮食行为下的生理指标数据作为原始特征值,并实测生理指标数据同步对应的血糖值,作为血糖参考值;归一化单元,基于原始特征值形成原始特征值矩阵,对原始特征值矩阵中的原始特征
值进行归一化处理,得到新特征值,形成新特征值矩阵;平滑处理单元,用于计算新特征值的相关系数,基于相关系数对新特征值进行平滑处理,得到平滑特征值,并将平滑特征值划分为训练集、验证集和测试集;特征贡献率计算单元,引入随机森林模型,利用随机森林模型计算平滑特征值的特征贡献率并排序,并选择特征贡献率大于零的平滑特征值;特征组合单元,用于从训练集中选择排序在前e位的平滑特征值并抽取,作为固定集合,剩余的平滑特征值均分为f组集合,将均分的f组集合与e位平滑特征值组合成新的特征向量,并形成f个特征矩阵;训练单元,利用f个特征矩阵以及其同步对应的血糖参考值训练随机森林模型,得到f个血糖预测模型;验证单元,将验证集依次输入f个血糖预测模型,得到第一血糖预测结果矩阵;相关系数求解单元,基于第一血糖预测结果矩阵,计算f个血糖预测模型的最优相关系数;测试单元,将测试集依次输入f个血糖预测模型,得到第二血糖预测结果矩阵,利用最优相关系数对第二血糖预测结果矩阵进行融合,得到最终的血糖预测值。10.一种医疗设备,其特征在于,所述医疗设备包括权利要求9所述的基于平滑处理及融合的血糖预测系统。
技术总结
本发明提出一种基于平滑处理及融合的血糖预测方法、系统及医疗设备,涉及医疗器械的技术领域,首先采集原始数据特征值,对其进行归一化处理,通过相关系数将归一化后的特征值进行平滑处理,使特征值与血糖实测值的关系更具相关性,形成特征矩阵作为数据集,并划分为训练集、验证集与测试集,将特征贡献率不同的特征值组合,利用最优相关系数对不同血糖预测模型得到的血糖预测结果矩阵进行融合,得到最终血糖预测结果,充分考虑饮食行为变化,降低饮食行为变化对预测结果产生的偏差,提高了血糖值预测结果的准确度,该方法可封装于系统,进一步形成医疗设备的应用,为糖尿病患者在日常生活中采取自我干预措施提供指导。常生活中采取自我干预措施提供指导。常生活中采取自我干预措施提供指导。
技术研发人员:韦怡婷 刘佳鑫 刘庆 凌永权 温璐宁 陈丹妮
受保护的技术使用者:广东工业大学
技术研发日:2022.01.28
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-25247.html