本发明涉及服务器机柜,具体涉及一种基于大数据的服务器机柜故障监测系统。
背景技术:
1、随着信息技术的迅猛发展,数据中心作为信息处理和存储的核心设施,其稳定性和可靠性对业务连续性至关重要。服务器机柜是数据中心的重要组成部分,其内部温度直接影响到服务器硬件的性能和寿命。过高或过低的温度都可能导致硬件故障,甚至引发系统宕机,给企业带来巨大的经济损失。因此,实时监测服务器机柜内部温度并及时发现潜在问题显得尤为重要。
2、传统的机柜温度监测方法主要依赖于热电偶、热敏电阻等温度传感器,这些传感器虽然能够提供基本的温度数据,但存在诸多不足。首先,由于服务器运行时会产生一定的热量,从而导致机柜内部的温度分布并不均匀,因此常规位置安装的传感器只能测量特定点的温度,无法全面反映整个机柜内部的温度分布情况;其次由于传感器自身的精度限制以及长时间工作的影响,测量结果可能存在较大误差;从而影响了对服务器温度的判断,无法保证服务器的正常稳定运行,需要对存在问题的传感器位置进行分析。
技术实现思路
1、本发明的目的在于提供一种基于大数据的服务器机柜故障监测系统,解决以下技术问题:
2、温度传感器的常规设置无法全面反映整个机柜内部的温度分布情况;且传感器自身的精度限制以及长时间工作的影响,测量结果可能存在较大误差,需要对存在问题的传感器位置进行分析。
3、本发明的目的可以通过以下技术方案实现:
4、一种基于大数据的服务器机柜故障监测系统,包括:
5、温度采集模块,用于通过设置于服务器机柜内部的温度传感器测量机柜内部温度,将温度传感器的数量标记为n;
6、激光发射模块,用于控制激光在机柜内部的发射与关闭,包括发射端、接收端和m个反射板,m=n-1,所有m个反射板与前m个温度传感器的位置一一对应,所述反射板用于使激光在机柜内按照设定路径进行传播,所述接收端与最后一个温度传感器的位置对应;
7、光强采集模块,用于通过反射板或接收端的光电传感器测量经过机柜空气后激光的实际透射光强;
8、数据处理模块,用于根据所述内部温度获取对应的空气吸光系数,并基于激光的入射光强计算对应的预计透射光强,将所述预计透射光强与实际透射光强进行对比,计算两者的差值,当所述差值大于误差阈值时,则判断机柜内部温度传感器存在故障或安装位置不合理;
9、故障报警模块,用于将数据处理模块判断的故障结果通过设定形式进行提示;
10、长期监测模块,用于设定固定周期,每隔固定周期对比激光经过机柜空气后的预计透射光强与实际透射光强。
11、作为本发明进一步的方案:所述数据处理模块中,预计透射光强的计算公式为:
12、;
13、;
14、其中,i0表示发射端的激光入射光强,in表示预计透射光强,n为温度传感器的数量,ak表示第k个温度传感器采集的温度数据下空气的吸光系数,c表示空气浓度,lk表示激光在第k-1个温度传感器到第k个温度传感器之间传播的距离。
15、作为本发明进一步的方案:每个所述反射板用于依次将激光反射至相邻的下一个反射板,形成激光在机柜内部空间的反射路径。
16、作为本发明进一步的方案:所述光电传感器设置于反射板的背面,每个光电传感器、反射板和温度传感器共同构成一个测量点。
17、作为本发明进一步的方案:判断温度传感器存在故障或安装位置不合理的具体过程为:
18、步骤1:通过光强采集模块控制反射板旋转,露出光电传感器,反射板旋转的顺序依次为m,m-1,...,1,每次旋转均测量此时激光的实际透射光强,并计算出对应的预计透射光强,计算对应的差值,获得差值序列dm,dm-1,...,d1;
19、步骤2:将数据处理模块中的所述误差阈值标记na,并设定差值序列dm,dm-1,...,d1中对应的误差阈值序列为ma,(m-1)a,...,a,筛选出首个小于对应误差阈值的差值,选取该差值对应的测量点,标记为正常测量点;
20、步骤3:将光线传播方向标记为正方向,将该测量点沿正反向之后的所有测量点标记为待定测量点,对于待定测量点,计算每个待定测量点的差值di与反方向的相邻待定测量点的差值di-1的差值|di-di-1|;
21、步骤4:若|di-di-1|≥1.1a,则表示第i个测量点的温度传感器存在故障或安装位置不合理,依次对待定测量点进行筛选直至正常测量点。
22、作为本发明进一步的方案:若|di-di-1|<1.1a,则表示第i个测量点的温度传感器为正常传感器。
23、作为本发明进一步的方案:所述光强采集模块通过步进电机控制反射板旋转。
24、作为本发明进一步的方案:所述故障报警模块的设定方式包括但不限于声音、灯光和用户界面提示。
25、本发明的有益效果:
26、本发明基于温度升高会影响气体对光的吸收特性这一点,创造性地在服务器机柜中设置激光发射器,并通过反射板控制激光的传输路径,通过温度传感器测量得到的机柜内部温度,以及设定的参数,计算出激光在经过传输路径后的预计强度,并将预计强度与测量得到的预计强度进行比对,当两者之间的差值较大时,则说明温度传感器可能出现了故障,抑或是由于机柜内部的空气温度不均匀,温度传感器并未能反映出部分区域的实际温度情况,存在安装位置不合理的问题,因此,本发明再通过测量点的逐个分析,从而能够准确地定位出存在问题的温度传感器的位置,从而提示运维人员对机柜进行监控系统进行优化,能够显著提高数据中心的运维效率和设备的可靠性,减少故障发生的概率,保障服务器的稳定运行。
1.一种基于大数据的服务器机柜故障监测系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,所述数据处理模块中,预计透射光强的计算公式为:
3.根据权利要求1所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,每个所述反射板用于依次将激光反射至相邻的下一个反射板,形成激光在机柜内部空间的反射路径。
4.根据权利要求1所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,所述光电传感器设置于反射板的背面,每个光电传感器、反射板和温度传感器共同构成一个测量点。
5.根据权利要求4所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,判断温度传感器存在故障或安装位置不合理的具体过程为:
6.根据权利要求5所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,若|di-di-1|<1.1a,则表示第i个测量点的温度传感器为正常传感器。
7.根据权利要求5所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,所述光强采集模块通过步进电机控制反射板旋转。
8.根据权利要求1所述的一种基于大数据的服务器机柜故障监测系统,其特征在于,所述故障报警模块的设定方式包括但不限于声音、灯光和用户界面提示。
