1.本发明涉及知识图谱医疗知识管理领域,尤其涉及一种基于知识图谱的医疗知识快速检索方法及系统。
背景技术:
2.随着我国信息技术以及经济的飞速发展,每个领域的数据都在与日俱增,如何将这样爆炸的数据进行合理存储始终备受关注。知识图谱技术由谷歌在2013年首次提出,本质上是揭示实体之间关系的语义网络。演化至今日,知识图谱技术通常以rdf模型将数据储存为三元组形式。然而随着数据的不断迭代更新,知识图谱中的知识量同样日益增加,一些著名的知识图谱如freebase以及yago数据集目前已经达到了相当大的规模。
3.知识图谱(knowledge graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
4.知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
5.知识图谱,它能为学科研究提供切实的、有价值的参考。
6.现有的医疗知识检索更多的是根据关键字或词进行检索,而检索得到的结果更多是具有关键字或词的文字,往往缺乏相关知识的关联特征的介绍,并且检索的准确性并不高,因此,急需一个基于知识图谱的医疗知识检索方法,用于解决医疗知识检索结果不准确不丰富的技术问题。
技术实现要素:
7.为了解决现有的技术问题,本发明的目的是提出一个基于知识图谱的医疗知识检索方法,可提供关于疾病知识与药品知识的检索服务,并以图形可视化方式展示核心概念之间的关系,辅助医生理清学术发展脉络,发现知识点之间的联系。
8.为了实现上述目的,本发明提供了一种基于知识图谱的医疗知识快速检索方法,包括以下步骤:
9.基于icd-11国际疾病分类,通过采集临床诊疗指南、行业标准、诊疗规范与医学百科数据,构建第一知识图谱;
10.基于贝叶斯网络,对第一知识图谱进行转换,获得第二知识图谱,第二知识图谱用于生成具有时效性的检索知识图谱;
11.生成检索规则集,检索规则集用于表示第二知识图谱生成检索知识图谱需要使用的检索规则;
12.根据第二知识图谱和检索规则集,生成检索知识图谱,合并第二知识图谱和检索知识图谱,生成用于快速检索医疗知识的第三知识图谱;
13.基于第一单位时间,通过检索规则集和第二知识图谱,对检索知识图谱进行更新,以更新第三知识图谱;
14.根据检索特征,通过第三知识图谱进行特征匹配,生成具有检索特征的第一结果,或与检索特征具有直接关系的第二结果,其中,第二结果不包括检索特征,第二结果的每一个特征与每一个检索特征一一对应。
15.优选地,根据第三知识图谱的图谱目标关系,获取目标知识图谱的头部特征集合,以及头部特征集合对应的尾特征集合,并根据图谱目标关系、头部特征集合、尾特征集合,构建样本集合;
16.获取样本集合的路径池、关系矩阵,基于检索规则集,构建关系检索概率模型,关系检索概率模型用于表示根据检索规则集,从头部特征集合出发达到尾特征集合的检索过程中,每一条路径的概率值;
17.基于关系检索概率模型和第二知识图谱,更新第三知识图谱。
18.优选地,在更新第三知识图谱的过程中,根据头部特征集合,以深度优先的方式进行检索路径长度小于阈值长度的路径,当路径为新路径,则将路径添加到路径池,并对路径池对应的关系矩阵同步更新。
19.优选地,在更新第三知识图谱的过程中,关系检索概率模型用于表示根据深度优先的方式继续进行检索的概率。
20.优选地,记录生成新路径的检索规则以及新路径的更新时间;
21.根据新路径、检索规则、更新时间,生成索引知识图谱;
22.将索引知识图谱合并至检索知识图谱,并根据第二知识图谱,对第三知识图谱进行更新;
23.基于第二单位时间,根据检索规则和更新时间,判断新路径的有识图谱进行更新,以更新第三知识图谱;
24.根据检索特征,通过第三知识图谱进行特征匹配,生成具有检索特征的第一结果,或与检索特征具有直接关系的第二结果,其中,第二结果不包括检索特征,第二结果的每一个特征与每一个检索特征一一对应。
25.优选地,根据第三知识图谱的图谱目标关系,获取目标知识图谱的头部特征集合,以及头部特征集合对应的尾特征集合,并根据图谱目标关系、头部特征集合、尾特征集合,构建样本集合;
26.获取样本集合的路径池、关系矩阵,基于检索规则集,构建关系检索概率模型,关系检索概率模型用于表示根据检索规则集,从头部特征集合出发达到尾特征集合的检索过程中,每一条路径的概率值;
27.基于关系检索概率模型和第二知识图谱,更新第三知识图谱。
28.优选地,在更新第三知识图谱的过程中,根据头部特征集合,以深度优先的方式进行检索路径长度小于阈值长度的路径,当路径为新路径,则将路径添加到路径池,并对路径池对应的关系矩阵同步更新。
29.优选地,在更新第三知识图谱的过程中,关系检索概率模型用于表示根据深度优先的方式继续进行检索的概率。
30.优选地,记录生成新路径的检索规则以及新路径的更新时间;
31.根据新路径、检索规则、更新时间,生成索引知识图谱;
32.将索引知识图谱合并至检索知识图谱,并根据第二知识图谱,对第三知识图谱进行更新;
33.基于第二单位时间,根据检索规则和更新时间,判断新路径的有效性。
34.优选地,在获取第一结果的过程中,根据检索特征中的至少一个特征,通过第三知识图谱进行特征匹配,第一结果至少包括一个检索特征。
35.优选地,在获取第二结果的过程中,第二结果至少包括三个与检索特征一一对应的特征;
36.当检索特征小于三个时,则不生成第二结果。
37.本发明还公开了一种基于知识图谱的医疗知识快速检索系统,包括:
38.数据采集模块,用于采集icd-11国际疾病分类、临床诊疗指南、行业标准、诊疗规范与医学百科数据;
39.第一数据处理模块,用于基于icd-11国际疾病分类,通过临床诊疗指南、行业标准、诊疗规范与医学百科数据,构建第一知识图谱;
40.第二数据处理模块,用于基于贝叶斯网络,对第一知识图谱进行转换,获得第二知识图谱,第二知识图谱用于生成具有时效性的检索知识图谱;通过生成检索规则集,根据第二知识图谱和检索规则集,生成检索知识图谱,合并第二知识图谱和检索知识图谱,生成用于快速检索医疗知识的第三知识图谱,其中,检索规则集用于表示第二知识图谱生成检索知识图谱需要使用的检索规则;
41.第三数据处理模块,用于基于第一单位时间,通过检索规则集和第二知识图谱,对检索知识图谱进行更新,以更新第三知识图谱;
42.特征检索模块,用于通过输入检索特征,根据第三知识图谱进行特征匹配,生成具有检索特征的第一结果,或与检索特征具有直接关系的第二结果,其中,第二结果不包括检索特征,第二结果的每一个特征与每一个检索特征一一对应。
43.优选地,医疗知识快速检索系统还包括第四数据处理模块,用于根据第三知识图谱的图谱目标关系,获取目标知识图谱的头部特征集合,以及头部特征集合对应的尾特征集合,并根据图谱目标关系、头部特征集合、尾特征集合,构建样本集合;通过获取样本集合的路径池、关系矩阵,基于检索规则集,构建关系检索概率模型,关系检索概率模型用于表示根据检索规则集,从头部特征集合出发达到尾特征集合的检索过程中,每一条路径的概率值;基于关系检索概率模型和第二知识图谱,更新第三知识图谱。
44.优选地,医疗知识快速检索系统还包括:
45.显示模块,用于将第一结果或第二结果,通过知识图谱的方式进行显示,其中,当选择第二结果的第二结果特征时,生成第二结果特征对应的第二关系矩阵,通过选择第二关系矩阵,生成第一结果;当选择第一结果的第一结果特征时,生成第一结果特征对应的第一关系矩阵,通过选择不包括检索特征的第一关系矩阵,生成第二结果。
46.本发明公开了以下技术效果:
47.与传统的关键词检索方法相比,此方法可大幅提高知识检索的匹配度,节约时间。
附图说明
48.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
49.图1为本发明的具体实施流程图;
50.图2为本发明的系统结构示意图。
具体实施方式
51.下为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
52.如图1-2所示,本发明提供了一种基于知识图谱的医疗知识快速检索方法,包括以下步骤:
53.基于icd-11国际疾病分类,通过采集临床诊疗指南、行业标准、诊疗规范与医学百科数据,构建第一知识图谱;
54.基于贝叶斯网络,对第一知识图谱进行转换,获得第二知识图谱,第二知识图谱用于生成具有时效性的检索知识图谱;
55.生成检索规则集,检索规则集用于表示第二知识图谱生成检索知识图谱需要使用的检索规则;
56.根据第二知识图谱和检索规则集,生成检索知识图谱,合并第二知识图谱和检索知识图谱,生成用于快速检索医疗知识的第三知识图谱;
57.基于第一单位时间,通过检索规则集和第二知识图谱,对检索知识图谱进行更新,以更新第三知识图谱;
58.根据检索特征,通过第三知识图谱进行特征匹配,生成具有检索特征的第一结果,或与检索特征具有直接关系的第二结果,其中,第二结果不包括检索特征,第二结果的每一个特征与每一个检索特征一一对应。
59.进一步优选地,根据第三知识图谱的图谱目标关系,获取目标知识图谱的头部特征集合,以及头部特征集合对应的尾特征集合,并根据图谱目标关系、头部特征集合、尾特征集合,构建样本集合;
60.获取样本集合的路径池、关系矩阵,基于检索规则集,构建关系检索概率模型,关系检索概率模型用于表示根据检索规则集,从头部特征集合出发达到尾特征集合的检索过程中,每一条路径的概率值;
61.基于关系检索概率模型和第二知识图谱,更新第三知识图谱。
62.进一步优选地,在更新第三知识图谱的过程中,根据头部特征集合,以深度优先的
方式进行检索路径长度小于阈值长度的路径,当路径为新路径,则将路径添加到路径池,并对路径池对应的关系矩阵同步更新。
63.进一步优选地,在更新第三知识图谱的过程中,关系检索概率模型用于表示根据深度优先的方式继续进行检索的概率。
64.进一步优选地,记录生成新路径的检索规则以及新路径的更新时间;
65.根据新路径、检索规则、更新时间,生成索引知识图谱;
66.将索引知识图谱合并至检索知识图谱,并根据第二知识图谱,对第三知识图谱进行更新;
67.基于第二单位时间,根据检索规则和更新时间,判断新路径的有效性。
68.进一步优选地,在获取第一结果的过程中,根据检索特征中的至少一个特征,通过第三知识图谱进行特征匹配,第一结果至少包括一个检索特征。
69.进一步优选地,在获取第二结果的过程中,第二结果至少包括三个与检索特征一一对应的特征;
70.当检索特征小于三个时,则不生成第二结果。
71.本发明还公开了一种基于知识图谱的医疗知识快速检索系统,包括:
72.数据采集模块,用于采集icd-11国际疾病分类、临床诊疗指南、行业标准、诊疗规范与医学百科数据;
73.第一数据处理模块,用于基于icd-11国际疾病分类,通过临床诊疗指南、行业标准、诊疗规范与医学百科数据,构建第一知识图谱;
74.第二数据处理模块,用于基于贝叶斯网络,对第一知识图谱进行转换,获得第二知识图谱,第二知识图谱用于生成具有时效性的检索知识图谱;通过生成检索规则集,根据第二知识图谱和检索规则集,生成检索知识图谱,合并第二知识图谱和检索知识图谱,生成用于快速检索医疗知识的第三知识图谱,其中,检索规则集用于表示第二知识图谱生成检索知识图谱需要使用的检索规则;
75.第三数据处理模块,用于基于第一单位时间,通过检索规则集和第二知识图谱,对检索知识图谱进行更新,以更新第三知识图谱;
76.特征检索模块,用于通过输入检索特征,根据第三知识图谱进行特征匹配,生成具有检索特征的第一结果,或与检索特征具有直接关系的第二结果,其中,第二结果不包括检索特征,第二结果的每一个特征与每一个检索特征一一对应。
77.进一步优选地,医疗知识快速检索系统还包括第四数据处理模块,用于根据第三知识图谱的图谱目标关系,获取目标知识图谱的头部特征集合,以及头部特征集合对应的尾特征集合,并根据图谱目标关系、头部特征集合、尾特征集合,构建样本集合;通过获取样本集合的路径池、关系矩阵,基于检索规则集,构建关系检索概率模型,关系检索概率模型用于表示根据检索规则集,从头部特征集合出发达到尾特征集合的检索过程中,每一条路径的概率值;基于关系检索概率模型和第二知识图谱,更新第三知识图谱。
78.进一步优选地,医疗知识快速检索系统还包括:
79.显示模块,用于将第一结果或第二结果,通过知识图谱的方式进行显示,其中,当选择第二结果的第二结果特征时,生成第二结果特征对应的第二关系矩阵,通过选择第二关系矩阵,生成第一结果;当选择第一结果的第一结果特征时,生成第一结果特征对应的第
一关系矩阵,通过选择不包括检索特征的第一关系矩阵,生成第二结果。
80.实施例1:本发明提出了一个基于知识图谱的医疗知识检索方法,可提供关于疾病知识与药品知识的检索服务,并以图形可视化方式展示核心概念之间的关系,辅助医生理清学术发展脉络,发现知识点之间的联系,与传统的关键词检索方法相比,此方法可大幅提高知识检索的匹配度,节约时间。
81.具体流程:
82.第一步:基于icd-11内容模型构建疾病分类知识体系;
83.第二步:采集大规模、多源异构的临床诊疗指南、行业标准、诊疗规范与医学百科等医学文本数据;
84.第三步:利用自然语言处理和文本挖掘技术提取实体,并抽取各实体之间的关系,包括疾病的临床症状、发病部位、药物治疗、手术治疗、鉴别诊断、影像学检查、高危因素、传播途径、多发群体、就诊科室等以及药物的成分、适应症、用法用量、有效期、禁忌症等30余种常见关系类型;
85.第四步:结合自身的数据存储格式的特点,建立全图索引和顶点内索引,支撑图的遍历查询,实现对关系和数据的快速查询。
86.第五步:根据所获取的各种数据特点,按照数据分析和展现的需要,对数据进行整合后通过知识图谱实现数据的智能可视化展示。包括:1.用户输入查询词和查询条件,查询模块将查询内容发送到后端,交由图数据库根据遍历策略遍历出所有相关的节点,获取所有查询到的数据。2.根据所获取的节点所属的索引类别,按照数据自身特点以及向用户高效直观展示检索结果的需要,选择合适的展示方式。3.将获取的数据以知识图谱的方式进行展示。4.点击知识图谱中展现的节点,可以链接到检索节点的子节点或父节点页面,利用知识图谱的方式获取更多索索结果。
87.针对本发明的上述思路,可以理解的是,针对某一种疾病特征,通过输入简单的单一特征,即可出现多种特征检索结果,例如,当输入“咳嗽”时,会出现感冒、咽炎等疾病的检索提示,以及“是否伴有流鼻涕或嗓子疼痛或发烧等症状”的关联技术提示,以及“是否吸烟、喝酒、吃辛辣刺激食物等”,以及“咳嗽时间、频率、以及缓解方法”,另外,还会根据不同的检索结果扩产出不同的延展选项,比如对于缓解方法可以列举药物缓解或非药物缓解,比如喝温热水、按压某个穴位、揪嗓子、敲打背部等等,并给出用量用法以及机理解释;对于多种特征的组合式检索,会根据组合特征的多少,给出检索结果以及给出该检索规则中,其他常用的检索方式,帮助查询人根据现有症状进行现有解决方案的解锁,其中,该种检索方式,可以最大程度缩小检索范围,并且给出准确的解决结果;在组合特征检索时,会根据组合特征在知识图谱中为别处于的图谱位置,并根据图谱位置的最优路径对应的特征,获取若干个解决结果,并根据每个特征之间组合后对应的结果,依据与检索特征近似原则进行排序,将排序结果的1-10名作为最终结果进行输出,上述近似原则为当检索特征与路径特征相同时,视为近似度为100%,当路径特征包括1个检索特征时,根据检索特征的数量,确定近似度;当路径特征不包括任何一个检索特征,但路径特征中的每个特征与检索特征具备直接关联时,将该特征作为检索结果的近似特征,并通过标注的形式进行显示,该显示结果替代上述10名中的最后一名进行显示,并给予提示,当该结果被认可时,根据该结果对应的特征情况,通过加入最初的检索结果进行重新检索,根据重新检索的特征组合直接显示
其对应的结果,若该结果为空,则选择与上述特征组合最接近的特征组合对应的三个结果作为最终结果输出,若无最近接的特征,那么,视为该检索为空,并进行记录,将记录结果反馈管理员。
88.本发明提到的基于知识图谱的检索方法,有效地利用了知识图谱的结构性以及关联性,为医疗知识的检索准确性提供了技术支持,也为该领域提供了技术依据。
转载请注明原文地址:https://tc.8miu.com/read-3960.html