本技术涉及计算机应用,特别是涉及一种硬件故障巡检方法、装置、设备及可读存储介质。
背景技术:
1、在云计算时代,存储设备飞速发展,无论是软件功能和存储性能都越来越强大,强大的软件功能和存储性能依赖众多硬件集成和配合。由于存储设备集成了大量的电子元器件,存储设备长时间运行就可能会出现老化、高温异常等情况,因此对硬件故障进行检测是必不可少的。
2、但是,目前对硬件故障进行检测,往往不能根据实际需求进行检测,缺乏灵活性,而人工进行硬件巡检又存在非常耗时的问题。
3、综上所述,如何有效地解决硬件自动化检测等问题,是目前本领域技术人员急需解决的技术问题。
技术实现思路
1、本技术的目的是提供一种硬件故障巡检方法、装置、设备及可读存储介质,能够对硬件平台进行自动化巡检,且巡检过程高效、灵活且稳定。
2、为解决上述技术问题,本技术提供如下技术方案:
3、一种故障巡检方法,包括:
4、获取故障巡检列表;其中,所述故障巡检列表中记录故障巡检流程的索引;
5、利用故障巡检流程对应的索引,确定出目标故障巡检流程;
6、执行所述目标故障巡检流程,在所述目标故障巡检流程需要执行耗时任务的情况下,记录所述目标故障巡检流程的中断位置,并切换硬件线程执行所述耗时任务;
7、在所述耗时任务执行完毕后,从所述中断位置继续执行所述目标故障巡检流程;
8、在执行完所述目标故障巡检流程后,重新确定所述目标故障巡检流程,直到执行完所述故障巡检列表对应的硬件巡检流程,确定完成本次硬件巡检。
9、优选地,确定所述耗时任务执行完毕,包括:
10、在切换硬件线程执行所述耗时任务时,启动故障巡检定时器;
11、对所述故障巡检定时器进行监测;
12、在所述故障巡检定时器的时间耗尽后,确定所述耗时任务执行完毕。
13、优选地,获取故障巡检列表,包括:
14、获取本地硬件平台的硬件巡检需求信息;
15、利用所述硬件巡检需求信息,创建故障巡检流程,并确定执行顺序;
16、按照所述执行顺序,将所创建的故障巡检流程的索引添加至所述故障巡检列表中。
17、优选地,利用故障巡检流程对应的索引,确定出目标故障巡检流程,包括:
18、按序从所述故障巡检列表中读取所述索引;
19、将所述索引对应的故障巡检流程确定为所述目标故障巡检流程。
20、优选地,执行所述目标故障巡检流程,包括:
21、执行所述目标故障巡检流程过程中,触发底层硬件访问线程;
22、利用所述底层硬件访问线程,采集硬件信息;
23、利用所述硬件信息,进行故障检测;
24、其中,利用所述硬件信息进行故障检测,包括:
25、利用所述硬件信息,进行告警检测,并进行告警处理;
26、利用所述硬件信息,进行事件检测,并进行事件上报;
27、利用所述硬件信息,进行故障检测,并在检测到故障后,进行故障消除处理;
28、其中,进行告警处理,包括:
29、输出告警事件;其中,所述告警事件携带告警信息;所述告警信息包括告警事件描述信息、事件修复信息和告警详情信息;
30、其中,所述告警事件描述信息,包括:事件描述编号和描述事件信息及事件分类;
31、所述事件修复信息,包括:事件修复编号和修复描述信息;
32、所述告警详情信息,包括:故障位置信息和故障原因信息。
33、优选地,还包括:
34、利用所述硬件信息判断是否满足耗时动作的触发条件;
35、如果是,则启动故障巡检定时器,对所述故障巡检定时器进行监测;
36、在所述故障巡检定时器的时间耗尽后,继续执行目标故障巡检流程。
37、优选地,所述故障巡检列表中记录故障巡检流程支持的硬件平台;
38、相应的,利用故障巡检流程对应的索引,确定出目标故障巡检流程,包括:
39、访问本地硬件平台,并利用硬件采集线程采集硬件状态信息;
40、利用所述硬件状态信息,安装硬件分类,并得到硬件信息;
41、利用所述硬件信息,确定是否满足硬件巡检的触发条件;
42、如果是,则利用所述故障巡检列表中记录故障巡检流程支持的硬件平台,从所述故障巡检列表中筛选出支持所述本地硬件平台的故障巡检流程,并将确定出的故障巡检流程确定为所述目标故障巡检流程。
43、一种故障巡检装置,包括:
44、列表获取模块,用于获取故障巡检列表;其中,所述故障巡检列表中记录故障巡检流程的索引;
45、流程确定模块,用于利用故障巡检流程对应的索引,确定出目标故障巡检流程;
46、流程执行模块,用于执行所述目标故障巡检流程;
47、线程切换模块,用于在所述目标故障巡检流程需要执行耗时任务的情况下,记录所述目标故障巡检流程的中断位置,并切换硬件线程执行所述耗时任务;
48、断点继续模块,用于在所述耗时任务执行完毕后,从所述中断位置继续执行所述目标故障巡检流程;
49、巡检完成确定模块,用于在执行完所述目标故障巡检流程后,重新确定所述目标故障巡检流程,直到执行完所述故障巡检列表对应的硬件巡检流程,确定完成本次硬件巡检。
50、一种电子设备,包括:
51、存储器,用于存储计算机程序;
52、处理器,用于执行所述计算机程序时实现上述硬件故障巡检方法的步骤。
53、一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述硬件故障巡检方法的步骤。
54、一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时,实现上述硬件故障巡检方法的步骤。
55、应用本技术实施例所提供的方法,获取故障巡检列表;其中,故障巡检列表中记录故障巡检流程的索引;利用故障巡检流程对应的索引,确定出目标故障巡检流程;执行目标故障巡检流程,在目标故障巡检流程需要执行耗时任务的情况下,记录目标故障巡检流程的中断位置,并切换硬件线程执行耗时任务;在耗时任务执行完毕后,从中断位置继续执行目标故障巡检流程;在执行完目标故障巡检流程后,重新确定目标故障巡检流程,直到执行完故障巡检列表对应的硬件巡检流程,确定完成本次硬件巡检。
56、在本技术中,在获取到故障巡检列表之后,基于其记载的故障巡检流程的索引,可以确定出目标故障巡检流程,然后执行目标巡检流程。在故障巡检流程需要执行耗时任务的情况(如检出故障)下,记录下目标故障巡检流程的中断位置,并切换硬件线程来执行耗时任务(如故障修复逻辑)。在耗时任务执行完成之后,从中断位置继续执行该目标故障巡检流程。当执行完故障巡检列表对应的故障巡检流程之后,便可确定完成本次硬件巡检。
57、技术效果:在本技术中,可以基于故障巡检列表来确定待执行的故障巡检流程及其顺序,在遇到需要执行耗时任务时,可以通过记录中断位置的方式,切换硬件线程来执行耗时任务,在耗时任务执行完毕之后,基于中断位置,继续执行目标故障巡检流程,可以断点处继续运行,避免因检出故障中断,而无法继续完成硬件巡检。即本技术可以保障巡检的灵活性、稳定性和高效性。
58、相应地,本技术实施例还提供了与上述硬件故障巡检方法相对应的硬件故障巡检装置、设备、可读存储介质及计算机程序产品,具有上述技术效果,在此不再赘述。
1.一种硬件故障巡检方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定所述耗时任务执行完毕,包括:
3.根据权利要求1所述的方法,其特征在于,获取故障巡检列表,包括:
4.根据权利要求3所述的方法,其特征在于,利用故障巡检流程对应的索引,确定出目标故障巡检流程,包括:
5.根据权利要求1所述的方法,其特征在于,所述故障巡检列表中记录故障巡检流程支持的硬件平台;
6.根据权利要求1所述的方法,其特征在于,执行所述目标故障巡检流程,包括:
7.根据权利要求6所述的方法,其特征在于,还包括:
8.一种故障巡检装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述硬件故障巡检方法的步骤。
