1.本发明属于光谱分析技术领域,具体涉及一种针对光谱标准化情况的评价方法。
背景技术:
2.近红外光谱分析技术具有快速、准确和绿色的优点,广泛应用于食品、药品等领域。但是近红外光谱分析模型在使用过程中,由于检测条件、检测环境或仪器设备发生变化时,近红外光谱的吸光度会出现差异,进而导致建成的分析模型失效,而重新建立模型又需要耗费大量的人力、物力。
3.针对上述问题,当前普遍采用光谱标准化方法来予以应对。光谱标准化即对同一样品在不同仪器或不同条件所采集的光谱数据进行校正,以此消除测量过程中由于仪器、环境等外在因素不同所造成的差异性,使得不同条件下采集的光谱可以适用同一个模型,实现模型共享。
4.然而目前对于光谱标准化工作执行的好坏情况,缺乏一个较好的评价方法。当前应用中,通常只有等到将标准化后的光谱,实际输入至光谱分析模型中,进而通过模型输出预测结果 (相当于测量值),并将预测结果与真实结果(也即真实值)相比较,通过测量值与真实值之间的误差大小,来间接性反推光谱标准化的好坏。此种评价方法无法做到事前评价,需要将所有工作完整地执行一遍才可知道好坏,因而所需花费的时间较长;同时除了标准化之外,影响最终预测误差的因素还有很多,也即预测误差的大小并不能一定指明标准化的好坏。
技术实现要素:
5.针对现有技术中存在的不足,本发明提供了一种针对光谱标准化情况的评价方法,用以解决光谱标准化的评判问题。
6.本发明通过以下技术手段实现上述技术目的。
7.一种针对光谱标准化情况的评价方法,包括如下步骤:
8.步骤1,计算得分矩阵:从主机光谱xm中分解出主成分载荷矩阵pm和主成分得分矩阵tm,将从机光谱x
′
t
以及所述pm代入公式x=tp
t
e
x
,其中e
x
为残差矩阵,计算得到从机的主成分得分矩阵t
′
t
;
9.步骤2,计算主成分得分误差率:将所述tm和所述t
′
t
代入下述公式,计算主成分得分误差率pcser:
[0010][0011]
其中t
m,i
为tm中第i个主成分的得分率,t
′
t,i
为t
′
t
中第i个主成分的得分率,wi为第i个主成分在光谱分析模型中的贡献率,n为主成分的数量。
[0012]
进一步地,通过pcser值的大小判断光谱标准化的好坏,pcser的数值越小则光谱标准化越好。
[0013]
进一步地,基于主成分分析法对主机光谱xm进行分解。
[0014]
进一步地,测试多组数据,并在多个pcser结果之中取均值pcserave或最大值 pcsermax。
[0015]
进一步地,光谱波段范围为近红外光段。
[0016]
进一步地,所述光谱分析模型通过偏最小二乘法建立。
[0017]
进一步地,通过经归一化和多元散射校正对光谱进行预处理。
[0018]
本发明的有益效果为:
[0019]
本发明提供了一种针对光谱标准化情况的评价方法,能够根据偏最小二乘法建立的校正模型,评价光谱之间的差异性,提高光谱的相似度,从而实现不同仪器间的模型共享。此外相比传统的评价手段,本发明评价方法无需完整地执行完一整套模型预测工作,因此能够节省大量时间成本。
具体实施方式
[0020]
下面详细描述本发明的实施例,所示实施例的示例示出,其中自始至终相通或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0021]
一、基本概念说明
[0022]
设有两台光谱仪,分别是主机和从机,其中以主机的光谱数据为基准,建立光谱分析模型。为使从机的光谱数据能够直接套用上述(基于主机所建立的)光谱分析模型,则需要对从机的光谱数据进行标准化处理。
[0023]
须注意:上述主机和从机的概念并非狭义的认定为两台不同机器;如果同一台机器在两处不同的使用环境下,所测光谱数据产生了变化,则同样可套用上述主机和从机的概念,也即认定其中一个使用环境下的机器为主机,另一个使用环境下的机器为从机。
[0024]
为表述方便,分别使下标m和t代表主机和从机,则相应地设主机光谱为xm,从机原始光谱为x
t
,从机标准化后的光谱为x
′
t
,具体xm、x
t
和x
′
t
的数据形式都为矩阵,因而也可称为光谱矩阵。显然,最理想的标准化结果是x
′
t
=xm。此外,如何进行光谱标准化,也即光谱的标准化方法,并非本发明内容;本领域技术人员可以采用任何已知的光谱标准化方法,来进行相应光谱标准化操作。本发明仅是对光谱标准化结果的好坏,提供了一种评价判定方法。
[0025]
在光谱分析领域中,最常选用近红外光段的光谱来检测分析物质成分,因而以下实施例中也基于近红外光谱,来说明本论述发明技术方案。
[0026]
二、评价方法
[0027]
步骤1,计算得分矩阵
[0028]
基于主成分分析法对光谱矩阵进行分解,分解出主机光谱xm中的主成分载荷矩阵pm和主成分得分矩阵tm。
[0029]
主成分载荷矩阵p、主成分得分矩阵t和光谱矩阵x之间存在如下运算关系:
[0030]
x=tp
t
e
x
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0031]
其中e
x
为残差矩阵,同样由主成分分解时得到,p
t
为p的转置。
[0032]
之后将从机标准化后的光谱x
′
t
以及主机的主成分载荷矩阵pm代入公式(1),计算得到从机的主成分得分矩阵t
′
t
。
[0033]
步骤2,计算主成分得分误差率
[0034]
将主机的主成分得分矩阵tm和从机的主成分得分矩阵t
′
t
代入如下公式:
[0035][0036]
其中pcser为本发明定义的主成分得分误差率;t
m,i
为主机的主成分得分矩阵tm中第i 个主成分的得分率,类似地,t
′
t,i
为t
′
t
中第i个主成分的得分率;wi为第i个主成分在光谱分析模型中的贡献率;n为主成分的数量。
[0037]
最后,本发明通过pcser值的大小来判断光谱标准化的好坏,pcser的数值越小则说明光谱标准化越好;为保证结果的可靠性,可以采集多份样品,相应测试多组数据,并在多个pcser结果之中取均值pcserave或最大值pcsermax来判断。
[0038]
三、效果测试
[0039]
1)收集样品
[0040]
收集不同品种或品牌的小麦粉共计154份,包括高筋小麦粉、中筋小麦粉、低筋小麦粉、自发粉和全麦粉等品种。本次测试以小麦粉中粗蛋白含量作为检测对象。
[0041]
2)近红外光谱采集
[0042]
分别选用两台不同型号的光谱仪作为主机和从机,其中主机为上海棱光科技有限公司出产的光栅扫描型s450近红外光谱仪,波段范围900~2500nm,波长间隔2nm,波长点共801 个,为与从机波段保持一致,在实际使用时将波段范围裁剪成1550~1950nm;从机为济南海能仪器股份有限公司出产的法布里-珀罗干涉仪型n500近红外光谱仪,波段范围 1550~1950nm,波长间隔2nm,波长点共201个。
[0043]
分别使用上述主机和从机对154份小麦粉进行近红外光谱采集。
[0044]
3)小麦粉粗蛋白含量测定
[0045]
对154份小麦粉样品进行粗蛋白含量检测,检测方法依照gb/t 31578-201《粮油检验
‑ꢀ
粮食及制品中粗蛋白测定-杜马斯燃烧法》中所规定的方法,具体仪器采用济南海能仪器股份有限公司出产的d500杜马斯定氮仪。
[0046]
4)建立光谱分析模型
[0047]
基于主机采集的光谱数据,以及相应小麦粉所测定的粗蛋白含量数据,通过偏最小二乘法建立光谱分析模型;其中为消除光谱数据中的无关信息以及噪音的干扰,使用归一化 多元散射校正,对光谱进行预处理。
[0048]
5)光谱标准化
[0049]
分别使用
①
直接标准化(direct standardization,ds)、
②
分段直接标准化(piecewise directstandardization,pds)和
③
一元线性回归直接标准化(simple linear regression directstandardization,slrds)这三种标准化方法对从机光谱进行标准化处理,相应得到三组从机标准化后的光谱。
[0050]
6)计算主成分得分误差率
[0051]
根据前文步骤1至2,分别计算上述三种标准化处理结果所对应的主成分得分误差率 pcser,并且为增加对照,将未经标准化处理的从机原始光谱也按步骤1至2,计算主成分得分误差率pcser。相应结果如下表所示:
[0052]
表1:主成分得分误差率
[0053][0054]
7)模型预测
[0055]
将标准化前的从机光谱,以及经三种方式标准化处理后的从机光谱,分别套用所建立的光谱分析模型,利用模型对小麦粉粗蛋白含量进行预测,并与实际测定值相比较,计算各自的预测误差,最终结果如表2所示,其中rp为预测相关系数、rmsep为预测标准偏差、rpd 为相对预测偏差,rp的值越接近1、rmsep的值越小、rpd的值越大,则说明相应的模型预测精度越高。
[0056]
表2:模型预测效果
[0057][0058]
综合比较表1和表2的数据,无论是本发明标准化评价方法,还是经实际模型预测结果检验,都评判出本次试验中,ds算法标准化效果最好,之后依次是pds算法标准化、slrds 算法标准化。由此可证明本发明标准化评价方法能够有效且准确地评判出光谱标准化的好坏。
[0059]
基于与上述光谱标准化评价方法相同的发明构思,本发明还提供了一种电子设备,该电子设备包括一个或多个处理器和一个或多个存储器,存储器中存储了计算机可读代码,其中,计算机可读代码当由一个或多个处理器执行时,便可进行相应主成分得分误差率pcser的计算。其中,存储器可以包括非易失性存储介质和内存储器;非易失性存储介质可存储操作系统和计算机可读代码。该计算机可读代码包括程序指令,该程序指令被执行时,可使得处理器执行试题相似度计算。处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器为非易失性存储介质中的计算机可读代码的运行提供环境,该计算机可读代码被处理器执行时,可使得处理器执行本发明基于解题思路和知识点的试题相似度计算方法。应当理解的是,处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路 (application specific integrated circuit,asic)、现场可编程门阵列 (field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0060]
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有
特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0061]
本发明并不限于上述实施方式,在不背离本发明的实质内容的情况下,本领域技术人员能够做出的任何显而易见的改进、替换或变形均属于本发明的保护范围。
转载请注明原文地址:https://tc.8miu.com/read-498.html