一种基于知识图谱的工厂事故诊断方法与流程

    专利查询2022-07-07  110



    1.本发明涉及信息技术、人工智能和故障诊断领域,尤其涉及一种基于知识图谱的工厂事故诊断方法。


    背景技术:

    2.传统意义上,工业制造需要耗费大量的人力物力进行生产,这样不仅耗时耗力,而且在如采矿业、石油化工业等危险性行业中,容易发生重大安全事故。因此,工业领域进行智能化的需求显得尤为重要。如今,在工业生产上,我国工业部门已经实现了相当程度的自动化,在一些行业甚至实现了无人化生产,但是例如在设备检测,维修等方面仍主要依赖于质检人员和维修人员的主观判断和经验。但是,由于工业设备故障模式的复杂性、故障原因的多样性,使得故障的精确诊断需要耗费大量的时间和物力。在一些信息化程度较好的工厂内,一般会用mes(制造执行系统)提升管理水平,但利用mes指导或辅助人员完成维修工作只能以关键词形式查询到某一次维修记录,无法体现某一次(类)事故与其他事故的关联性,不能或不能很好地协助人员完成维修与质检任务。因此,将结构化、半结构化与非结构化故障检测、维修处置文本等知识转变成直观地、可视的、结构化的形式是工业生产所需的。
    3.近年来,随着图数据库的发展,为知识图谱的构建提供了坚实的基础。知识图谱也逐渐作为当前人工智能领域的研究热点,具备将专家知识等非结构化数据进行规范化存储,并用于事故诊断的能力,能够实现对非结构化先验知识的利用以及事故原因的解释。然而,在事故诊断领域,知识图谱技术的应用尚少。
    4.综上,本发明提出了一种基于知识图谱的工厂事故诊断方法。


    技术实现要素:

    5.本发明目的在于克服现有技术的不足,通过构建知识图谱辅助工厂事故诊断工作,并且基于故障表现形式,挖掘出深层次的关联关系,从新的视角去探索事故的形成原因,揭示事故发生的内在本质,解决现有技术中对工厂事故诊断水平不足的问题。
    6.为了实现上述发明目的,本发明提供一种基于知识图谱的工厂事故诊断方法,可选地,所述方法包括以下步骤:
    7.步骤一:工厂事故的本体构建;
    8.步骤二:基于双向长短期记忆网络算法(ltsm)的实体抽取;
    9.步骤三:基于注意力机制双向长短期记忆网络算法的关系抽取;
    10.步骤四:基于neo4j的知识图谱构建;
    11.步骤五:基于知识图谱的智能应用。
    12.可选地,步骤一工厂事故的本体构建方式为:
    13.根据工厂事故诊断语料情况和图谱需求构建本体,确定实体类型和关系类型。可用的实体类型主要为事故排除和检修记录或手册,包括事故类型、事故表现、事故原因、事
    故影响、解决措施等。
    14.可选地,步骤二基于双向长短期记忆网络算法的实体抽取的流程分为以下步骤:
    15.步骤一:选取部分原始语料,以8:2的比例划分为训练集和测试集;
    16.步骤二:对训练集和测试集进行bmeo标注。bmeo标注是一种常用的实体标注方法,该方法通过给语料中的每一个字符添加表征其所在实体的位置和实体类型来标注实体;
    17.步骤三:以训练集语料为输入,训练集标注结果为标签,训练基于双向长短期记忆网络的实体抽取模型;
    18.步骤四:使用测试集测试训练好的模型实体抽取效果,将模型从测试集语料中抽取出的标签与人工标注的标签进行对比并计算准确率和召回率,公式如下:
    [0019][0020][0021]
    其中,p为准确率;r为召回率;t
    p
    为正类预测为正类,即被实际抽取结果为某一标签,且人工标注也是该标签的字符数量;f
    p
    为负类预测为正类,即实际抽取结果为某一标签,但人工标注不是该标签的字符数量;fn不为正类预测为负类;
    [0022]
    步骤五:使用经测试后训练好的模型抽取剩余原始语料中的实体,完成基于双向长短期记忆网络算法的实体抽取。
    [0023]
    可选地,步骤三基于注意力机制双向长短期记忆网络算法的关系抽取流程分为以下步骤:
    [0024]
    步骤一:选取部分生成的语料,以8:2的比例划分为训练集和测试集,并对训练集和测试集进行关系标注。
    [0025]
    步骤二:完成标注后,以训练集语料中头实体、尾实体和所在句子为输入,关系为标签,训练基于注意力机制双向长短期记忆网络的关系抽取模型。
    [0026]
    步骤三:使用测试集测试训练好的模型关系抽取效果,将模型从测试集语料中抽取出的关系与人工标注的关系进行对比,计算准确率和召回率,计算方法同实体抽取。
    [0027]
    步骤四:使用经测试后训练好的模型抽取剩余语料中的关系,完成基于注意力机制双向长短期记忆网络算法的关系抽取。
    [0028]
    可选地,步骤四基于neo4j的知识图谱构建内容主要为:
    [0029]
    在抽取出非结构化知识中的实体和其间关系后,利用neo4j图数据库将抽取出的知识构建知识图谱。
    [0030]
    可选地,步骤五基于知识图谱的智能应用应包括基于知识图谱的智能搜索与推荐和基于知识图谱的智能问答,各自包含以下内容:
    [0031]
    智能搜索指用户向系统输入实体名,系统输出有无该实体。在搜索过程中,用户所输入的实体名中可能存在错别字。为解决该问题,本发明采用了基于相似度的搜索,在没有完全匹配的实体时,将输出与输入实体名相似度较高的实体。
    [0032]
    智能问答是指用户向知识图谱输入问题,知识图谱输出该问题的答案。智能问答的关键在于问题分类,即用户需要什么类型的结果。本发明采用朴素贝叶斯分类器作为搜
    索和问答的方法。
    [0033]
    本发明的有益效果是:通过构建知识图谱,能有效地辅助工厂事故诊断工作,并且基于故障表现形式,挖掘出深层次的关联关系,从新的视角去探索事故的形成原因,揭示事故发生的内在本质。将知识图谱技术应用于工厂事故的分析中,以期获得更加方便快捷的分析效率。
    附图说明
    [0034]
    图1为工厂事故知识图谱总体框架图;
    [0035]
    图2为基于注意力机制的双向lstm结构示意图;
    [0036]
    图3为基于双向长短期记忆网络算法的实体抽取流程图;
    [0037]
    图4为实体抽取模型配置图;
    [0038]
    图5为关系抽取模型配置图;
    [0039]
    图6为常见事故处理流程图;
    [0040]
    图7为事故解决本体样例图。
    具体实施方式
    [0041]
    下面结合附图对本发明实施实例进行详细描述。以下实例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
    [0042]
    实施例一
    [0043]
    给定一组新的文本数据集,接下来按照基于知识图谱的工厂事故诊断方法中对应步骤进行操作,包括:
    [0044]
    步骤一:工厂事故的本体构建;
    [0045]
    根据工厂事故诊断语料情况和图谱需求构建本体,确定实体类型和关系类型。可用的实体类型主要为事故排除和检修记录或手册,包括事故类型、事故表现、事故原因、事故影响、解决措施等。
    [0046]
    步骤二:进行基于双向长短期记忆网络算法的实体抽取;
    [0047]
    首先,选取部分原始语料,以8:2的比例划分为训练集和测试集。对训练集和测试集进行bmeo标注。bmeo标注是一种常用的实体标注方法,该方法通过给语料中的每一个字符添加表征其所在实体的位置和实体类型来标注实体。例如:语料中存在“故障模式”实体类型,则标签“b-故障模式”代表该字符是一个故障模式实体的首字符,b为“begin”的缩写;标签“m-故障模式”代表该字符是一个故障模式实体的中间字符,m为“middle“的缩写;标签“e-故障模式”代表该字符是一个故障模式实体的尾字符,e为“end”的缩写;标签“o”代表该字符不在实体中,o为“outside”的缩写。
    [0048]
    在完成实体标注后,以训练集语料为输入,训练集标注结果为标签,训练基于双向长短期记忆网络的实体抽取模型。
    [0049]
    然后,使用测试集测试训练好的模型实体抽取效果,将模型从测试集语料中抽取出的标签与人工标注的标签进行对比并计算准确率和召回率,公式如下:
    [0050]
    [0051][0052]
    其中,p为准确率;r为召回率;t
    p
    为正类预测为正类,即被实际抽取结果为某一标签,且人工标注也是该标签的字符数量;f
    p
    为负类预测为正类,即实际抽取结果为某一标签,但人工标注不是该标签的字符数量;fn不为正类预测为负类。
    [0053]
    最后,使用经测试后训练好的模型抽取剩余原始语料中的实体,完成基于双向长短期记忆网络算法的实体抽取。
    [0054]
    步骤三:进行基于注意力机制双向长短期记忆网络算法的关系抽取;
    [0055]
    首先,选取部分生成的语料,以8:2的比例划分为训练集和测试集,并对训练集和测试集进行关系标注。完成标注后,以训练集语料中头实体、尾实体和所在句子为输入,关系为标签,训练基于注意力机制双向长短期记忆网络的关系抽取模型。
    [0056]
    然后,使用测试集测试训练好的模型关系抽取效果,将模型从测试集语料中抽取出的关系与人工标注的关系进行对比,计算准确率和召回率,计算方法同实体抽取。
    [0057]
    最后,使用经测试后训练好的模型抽取剩余语料中的关系,完成基于注意力机制双向长短期记忆网络算法的关系抽取。
    [0058]
    步骤四:基于neo4j进行知识图谱构建;
    [0059]
    在抽取出非结构化知识中的实体和其间关系后,利用neo4j图数据库将抽取出的知识构建知识图谱。
    [0060]
    步骤五:完成基于知识图谱的智能应用,包括基于知识图谱的智能搜索与推荐和基于知识图谱的智能问答;
    [0061]
    智能搜索指用户向系统输入实体名,系统输出有无该实体。在搜索过程中,用户所输入的实体名中可能存在错别字。为解决该问题,本发明采用了基于相似度的搜索,在没有完全匹配的实体时,将输出与输入实体名相似度较高的实体。
    [0062]
    智能问答指用户向知识图谱输入问题,知识图谱输出该问题的答案。智能问答的关键在于问题分类,即用户需要什么类型的结果。本发明采用朴素贝叶斯分类器作为搜索和问答的方法。
    [0063]
    以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所做的等效结构或等流程变换,或直接或间接运用在相关技术领域,均同理包括在本发明的专利保护范围。
    转载请注明原文地址:https://tc.8miu.com/read-1688.html

    最新回复(0)