1.本发明涉及一种知识图谱的构建方法,具体涉及一种层状结构的多级知识图谱的建立、维护、融合和查询。
背景技术:
2.知识图谱以覆盖范围和使用场景的角度来看,通常分为通用知识图谱和领域知识图谱。通用知识图谱面向全领域,以常识性知识为主,强调知识的广度,例如百科知识图谱;领域知识图谱为细分知识领域为主,更强调专业性,对领域下的知识有更细粒度的刻画。
3.通用知识图谱无法覆盖领域知识图谱细粒度知识的需求,例如同一对象的属性在不同领域下会有不同的数据内容和不同的存储结构。所以,会同时构建通用知识图谱和领域知识图谱。目前的图谱构建方法有以下两种:一是采用多图构建模式,即两者在构建时完全隔离,彼此只能通过人工构建一些流程进行互补,且会因为隔离的构建会造成数据有过多的重复,为存储和后期查询造成负担;二是将领域知识图谱作为通用知识图谱的子图谱,领域知识图谱的设计受限于通用知识图谱,内容的新增也需要考虑是否适用于通用知识图谱,无法根据领域场景的需要快速迭代。
技术实现要素:
4.为了解决通用图谱和领域图谱无法互相融合一起推进的问题,本发明提供一种层状结构多级知识图谱的构建方法以及基于前述构建图谱的更新维护、查询方法。
5.一种层状结构多级知识图谱的构建方法,包括:构建纵向级联的若干层级的图谱,所述若干层级的图谱包括低层级图谱和高层级图谱,每一层级包括多种同类图谱;若干层级所述图谱均包括本体结构;当高层级图谱中所需构建的本体结构中涉及任意低层级图谱的本体结构,所述高层级图谱引用被涉及的本体结构;所述本体结构包括一种或多种类型以及类型间的关联关系;当高层级图谱中的类型涉及任意低层级图谱中的类型,对所述低层级图谱中被涉及的类型进行着色;根据所述类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据。
6.进一步地,所述类型包括属性结构和属性,所述属性结构表示属性的构成,所述属性包括字段名、约束字段以及索引方式,根据所述属性填充实体;当高层级图谱中所需构建的属性结构中涉及任意低层级的属性结构,则所述高层级图谱引用被涉及的属性结构。
7.进一步地,各个图谱中实体id与实体名称均相同的实体之间根据实体id建立映射关系,各个图谱中实体名称相同而实体id不同的实体之间建立虚连接。
8.进一步地,所述实体在填充前进行了消歧处理。
9.进一步地,所述类型还包括拓展属性,所述拓展属性为高层级图谱引用的低层级图谱的类型的拓展属性,具有所述拓展属性的类型在所述高层级图谱和所述低层级图谱中均生成属性拓展标识。
10.进一步地,还包括层状结构多级知识图谱的维护方法,用于维护用上述构建方法
构建的层状结构多级知识图谱,根据维护实体的类型判断所述实体属于低层级图谱还是高层级图谱,在对应图谱对所述维护实体进行维护,当识别出的类型存在属性拓展标识,则表示所述类型属于高层级图谱。
11.进一步地,所述纵向级联的若干层级的图谱,包括第一层级的通用图谱和多层级的领域图谱。
12.一种层状结构多级知识图谱的融合方法,用于融合根据上述构建方法构建的层状结构多级知识图谱,根据所述被涉及的本体结构融合图谱中的本体结构,各个图谱中的具有相同实体名称的实体根据实体id建立映射关系或虚连接,根据所述映射关系和虚连接对所述具有相同实体名称的实体进行融合。
13.一种层状结构多级知识图谱的查询方法,查询一种层状结构多级知识图谱,所述层状结构多级知识图谱包括纵向级联的若干层级的图谱,所述若干层级的图谱包括低层级图谱和高层级图谱,每一层级包括多种同类图谱;所述图谱均包括本体结构;当高层级图谱中所需构建的本体结构中涉及任意低层级的本体结构,则所述高层级图谱引用被涉及的本体结构;所述本体结构包括一种或多种类型以及类型间的关联关系;根据类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据;所述类型包括属性结构和属性,所述属性结构表示属性的构成,所述属性包括字段名、约束字段以及索引方式;
14.各个图谱中实体id与实体名称均相同的实体之间存在映射关系,各个图谱中实体名称相同而实体id不同的实体间存在虚连接;根据查询请求以及索引方式查询指定图谱对应的目标实体,当所述目标实体具有重复实体,则将各个所述目标实体根据所述映射关系和所述虚连接进行合并后返回查询结果。
15.进一步地,还包括根据所述本体结构、属性结构以及查询请求查询目标实体的邻居实体。
16.一种层状结构多级知识图谱的构建系统,包括:
17.存储单元,用于存储纵向级联的若干层级的图谱,每一层级包括多种同类图谱,若干层级的所述图谱均包括本体结构,所述本体结构包括一种或多种类型以及类型间的关联关系;
18.构建单元,用于构建所述图谱中的本体结构以及属性结构;
19.引用单元,用于高层级图谱中所需构建的本体结构中涉及任意低层级的本体结构,所述高层级图谱引用被涉及的本体结构;
20.填充单元,用于根据所述类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据;
21.着色单元,用于当高层级图谱中的类型涉及任意低层级图谱中的类型,对所述低层级图谱中被涉及的类型进行着色;
22.关联单元,用于在实体间构建联系,实体id与实体名称均相同的实体间根据实体id构建映射关系,实体名称相同而实体id不同的实体间构建虚连接。
23.本发明的有益效果在于:
24.本发明的层状结构多级知识图谱的构建方法,通过本体结构和属性结构的引用,在构建阶段可以省去重复构建的步骤和精力,并且在融合或查询阶段,能够通过相同的构架快速整合信息。通过相同类型内容的着色和实体间的映射关系以及虚连接解决实体间的
重复问题,精简了知识图谱的实体内容数据,降低了存储压力和查询压力,并且这些映射关系和虚连接而在图谱融合时也能快速的实现重复实体的消歧,更好地融合各层级图谱。通过属性的扩展,使得维护更新知识图谱时更有目的性,不需维护所有数据。本发明中的多级知识图谱使得各个图谱间的联系更有条理,实现维护和查询时的低工作量。
附图说明
25.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
26.图1是本发明知识图谱的整体结构示意图;
27.图2是本发明实体的关联关系示意图。
具体实施方式
28.为使得本技术的申请目的、特征、优点能够更加的明显和易懂,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本技术一部分实施例,而非全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
29.下面结合附图和具体实施例,进一步阐明本发明。
30.实施例1
31.本实施例提供一种层状结构多级知识图谱是构建方法,构建如图1所示的层状结构多级知识图谱,包括:
32.构建纵向级联的若干层级的图谱,每一层级包括多种同类图谱;每一图谱均包括本体结构,每一图谱都需要构建自己的本体结构,本体结构包括一种或多种类型以及类型间的关联关系。
33.当高层级图谱中所需构建的本体结构中涉及任意低层级的本体结构,高层级图谱可以引用被涉及的本体结构,从而进行自身的本体结构的构建。当高层级图谱中的类型涉及任意低层级图谱中的类型,对所述低层级图谱中被涉及的类型进行着色。
34.其中类型包括地点、名人等,其中地点这个类型下还可以包括子类型比如景点、市政建筑等。
35.实体根据所述类型和本体结构进行填充,所述实体包括实体名称、实体id和实体数据。所述类型包括属性结构和属性,所述属性结构表示属性的构成,所述属性包括字段名、约束字段以及索引方式,根据所述属性填充实体。其中,约束为一种约束条件,比如城市必须填已有的城市名称,自己编的城市名无法被填入。索引方式包括倒排索引、分词索引、数值索引或geo索引。
36.当高层级图谱中所需构建的属性结构中涉及任意低层级的属性结构,则高层级图谱引用被涉及的属性结构。
37.比如在低层级图谱中,景点子类型的属性包括城市、景区级别等,景点为西湖,实
体id为a,其下的属性为杭州市、5a景区等。类型与类型之间的关联关系,在景点上可体现为距离关系,比如景点西湖和景点灵隐寺的距离关系。
38.而当高层级图谱中也有关于景点的介绍时,高层级图谱对低层级图谱中的景点介绍进行着色,着色后,高层级图谱可以查询时获取该类型下的具体实体数据,并且,可在高层级图谱中针对这些实体进行专属的属性拓展或者是字段拓展,而这些拓展的属性和字段对低层级图谱不可见,维护时仅维护高层级图谱中的相应内容即可。比如在高层级图谱文旅图谱中,需要西湖的具体介绍时会对低层级图谱中的西湖进行着色,并形成适用于自身的属性结构,如西湖,实体名称为西湖,实体id为a,属性为人文历史情况、店铺情况,而人物历史情况下可以有人物、事件的具体实体介绍。
39.需要注意的是,填充实体前,需要对实体进行消歧处理,在图谱外事先避免重复实体的重复填充,减少工作量和存储压力。
40.如图2所示,各个图谱中如果重复出现同一个实体,但重复出现的实体实际内容为同一个时,该实体的实体名称通常相同。各个图谱中实体id与实体名称均相同的实体之间根据实体id存在映射关系,各个图谱中实体名称相同而实体id不同的实体间存在虚连接。
41.如果低层级图谱和高层级图谱分别存储有以下实体:
42.通用图谱:西湖(id为b,杭州市、5a级别等)
43.文旅图谱:西湖(id为b’,苏东坡苏小小,纪念品店铺等)
44.其中杭州市、5a级别为属性信息,苏东坡苏小小、纪念品店铺等也为属性信息。文旅图谱中的西湖id为b’,通用图谱中的西湖id为b,导致相同名称的实体有不同的id,此时,建立一条b
’→
b的虚连接,这样在查询时可以合并这个关系,显示简练的查询结果。虚连接存储的是非实质关系的同种内容,方便以后查询显示,比如西湖(id b)和西湖(id b’)本身不带有实质关系,但会建立一条关系,虚连接的连接存储层是存在的,会在查询结果层面进行内容合并。虚连接为构建实体时的失误做一个弥补,当碰到相同实体名称而有不同实体id的实体时用虚连接避免删除其中一个的麻烦,也避免查询时的信息分散。
45.如果高层级图谱是在低层级图谱的基础上构建的,则低层级图谱和高层级图谱分别存储有以下实体:
46.通用图谱:西湖(id为a,杭州市、5a级别等)
47.文旅图谱:西湖(id为a,苏东坡苏小小,纪念品店铺等)
48.这种情况下则表示高层级图谱中的类型涉及了低层级图谱中的类型,也就是说,低层级图谱中的类型属于高层级图谱的领域内容,则会在通用图谱中进行着色,如果是分别构建的但是实体id相同,则会直接形成映射关系。着色后,高层级图谱可在查询时获取到被着色类型下的具体实体数据。
49.其中,类型还包括拓展属性,拓展属性为高层级图谱引用的低层级图谱的类型的拓展属性,具有所述拓展属性的类型在所述高层级图谱和所述低层级图谱中均生成属性拓展标识,所述拓展属性只存在于所述领域图谱的类型中。
50.比如,低层级图谱中具有西湖,属性包括城市、景区级别,则当高层级图谱引用该类型时,可以在其基础上增加属性,被增加的属性称为拓展属性,被文旅图谱引用可增加人文历史事件等属性。
51.上述的纵向级联的若干层级的图谱,包括第一层级的通用图谱和多层级的领域图
谱,如图1所示,layer0为通用图谱的层级,layer1、layer2或者是layern为领域图谱。
52.本实施例中的层状结构多级知识图谱,通过本体结构和属性结构的引用以及相同类型内容的着色,通过实体间的映射关系和虚连接解决实体间的重复问题,精简了知识图谱的结构,降低了存储压力和查询压力。并且,通过属性的扩展,使得维护更新知识图谱时,更有目的性,而不是维护更新所有的数据,扩展属性和类型着色都建立起了各个图谱间的联系,使得查询时能够更方便地获得目标数据。
53.实施例2
54.一种层状结构多级知识图谱的融合方法,用于融合根据实施例1所述的构建方法构建的层状结构多级知识图谱,根据所述被涉及的本体结构融合图谱中的本体结构,各个图谱中的具有相同实体名称的实体根据实体id建立映射关系或虚连接,根据所述映射关系和虚连接对所述具有相同实体名称的实体进行融合。
55.当高层级图谱与低层级图谱需要融合时,可先根据被涉及的本体结构和被涉及的属性结构进行整体框架上的融合。
56.各个图谱中的具有相同实体名称的实体根据实体id建立映射关系或虚连接,根据所述映射关系和虚连接对所述具有相同实体名称的实体进行融合。
57.例如,低层级图谱和高层级图谱分别存储有以下实体:
58.通用图谱:西湖(id为a,杭州市、5a级别等)
59.文旅图谱:西湖(id为a,苏东坡苏小小,纪念品店铺等)
60.其中杭州市、5a级别为属性信息,苏东坡苏小小、纪念品店铺等也为属性信息也就是为实体数据。文旅图谱中的西湖id为a,通用图谱中的西湖id为a,两条实体的实体名称相同,实际上描述的是同一个实体,则将两个实体间建立映射关系,根据这个映射关系,可以在融合的时候实现实体消歧处理,合并为一条实体,使得融合如后的图谱更精简。
61.如果,低层级图谱和高层级图谱分别存储有以下实体:
62.通用图谱:西湖(id为b,杭州市、5a级别等)
63.文旅图谱:西湖(id为b’,苏东坡苏小小,纪念品店铺等)
64.其中杭州市、5a级别为属性信息,苏东坡苏小小、纪念品店铺等也为属性信息也就是为实体数据。文旅图谱中的西湖id为b’,通用图谱中的西湖id为b,导致相同名称的实体有不同的id,此时,建立一条b
’→
b的虚连接,在融合时,如果删除数据可能会对上游数据造成影响,虚连接就是为了同时保留这两条数据,又能表明二者的重复问题。虚连接存储的是非实质关系的同种内容,方便以后融合时,融合一些不能删除的相同实体,比如西湖(id b)和西湖(id b’)本身不带有实质关系,但会建立一条关系,虚连接的连接存储层是存在的,会在查询结果层面进行内容合并。
65.实施例3
66.本实施例提供一种层状结构多级知识图谱的维护方法,用于维护实施例1中的图谱,具体步骤包括:
67.根据维护实体的类型判断所述实体属于低层级图谱还是高层级图谱,在对应图谱对所述维护实体进行维护,当识别出的类型存在属性拓展标识,则表示所述类型属于高层级图谱。
68.一般来说,低层级图谱的类型较为简单,属于通用知识,高层级图谱的类型较为复
杂,包含本领域的专属类型或专属属性,所以先根据类型判断所需要维护的实体属于低层级图谱还是高层级图谱。如果类型属于低层级图谱的类型,但是其上有属性拓展标识时,则表示该类型属于高层级图谱,查看维护实体是否属于拓展属性,如果是则需要在高层级图谱维护对应实体,如果不是则在低层级图谱维护对应实体。
69.因为实施例1中构建的图谱具有类型着色和类型的拓展属性,在更新维护时只需要在对应的图片中维护就能保证数据的准确,不需要维护大量图谱信息来保持图谱中的信息一致。
70.实施例4
71.本实施例提供一种层状结构多级知识图谱的查询方法,用于查询实施例1中图谱的实体内容,具体步骤包括:
72.根据查询请求以及索引方式查询指定图谱对应的目标实体,当所述目标实体具有重复实体,则将各个所述目标实体根据所述映射关系和所述虚连接进行合并后返回查询结果。
73.如果指定查询通用图谱的实体时,只使用通用图谱中的属性索引进行搜索,查询满足搜索条件的实体数据返回结果。
74.如果指定查询领域图谱的实体时,因为领域图谱中可能引用了通用图谱的本体结构和属性结构,或者是着色了通用图谱中的类型内容,所以会出现多个查询状态。查询领域图谱中的引用信息,将领域图谱中引用通用图谱的类型进行集合,作为一个查询条件,根据该查询条件在通用图谱中进行搜索,得到结果集一;在上述查询条件中过滤通用图谱涉及的内容,形成新的查询条件,根据该查询条件在领域图谱中进行搜索,得到结果集二,将结果集根据查询请求进行与或非的逻辑处理,得到最终的结果集。
75.在领域图谱的查询中,如需获得实体的通用属性,则在通用图谱中查询实体的通用信息,如果通用图谱有对应实体id映射关系的,直接根据实体id获取通用信息,如果有虚连接进行关联的,通过虚连接跳转到通用图谱的实体并获取通用信息。
76.本查询方法还包括根据所述本体结构、属性结构以及查询请求查询目标实体的邻居实体。其中设计实体的邻居查询,实体间的路径查询,这些查询都依赖于全域的免索引邻接图数据存储,是基于gremlin语法进行的查询。
77.本查询方法依据实施例1公开的层状结构多级知识图谱,根据不同的图谱类型有不同的查询方式,并且将查询结果先合并再显示,可以降低用户的查询成本,帮助用户快速获得相关结果。
78.实施例5
79.本实施例提供一种层状结构多级知识图谱的构建系统,用于构建实施例1中的图谱,具体包括:
80.存储单元,用于存储纵向级联的若干层级的图谱,所述若干层级的图谱包括低层级图谱和高层级图谱,每一层级包括多种同类图谱,图谱均包括本体结构,所述本体结构包括一种或多种类型以及类型间的关联关系。
81.构建单元,用于构建所述图谱中的本体结构以及属性结构。
82.引用单元,用于高层级图谱中所需构建的本体结构中涉及任意低层级的本体结构,所述高层级图谱引用被涉及的本体结构。
83.填充单元,用于根据所述类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据。
84.着色单元,用于当高层级图谱中的类型涉及任意低层级图谱中的类型,对所述低层级图谱中被涉及的类型进行着色。
85.关联单元,用于在实体间构建联系,实体id与实体名称均相同的实体间根据实体id构建映射关系,实体名称相同而实体id不同的实体间构建虚连接。
86.在本技术所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
87.所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
88.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
89.特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序
90.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
91.上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
92.以上所述,仅为本实用新型的具体实施方式,但本实用新型的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本实用新型揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本实用新型的保护范围之内。因此,本实用新型的保护范围应以所述权利要求的保护范围为准。
技术特征:
1.一种层状结构多级知识图谱的构建方法,其特征在于,包括:构建纵向级联的若干层级的图谱,所述若干层级的图谱包括低层级图谱和高层级图谱,每一层级包括多种同类的图谱;若干层级的所述图谱均包括本体结构;当高层级图谱中所需构建的本体结构中涉及任意低层级图谱的本体结构,所述高层级图谱引用被涉及的本体结构;所述本体结构包括一种或多种类型以及类型间的关联关系;当高层级图谱中的类型涉及任意低层级图谱中的类型,对所述低层级图谱中被涉及的类型进行着色;根据所述类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据。2.根据权利要求1所述的层状结构多级知识图谱的构建方法,其特征在于,所述类型包括属性结构和属性,所述属性结构表示属性的构成,所述属性包括字段名、约束字段以及索引方式,根据所述属性填充实体;当高层级图谱中所需构建的属性结构中涉及任意低层级的属性结构,则所述高层级图谱引用被涉及的属性结构。3.根据权利要求1所述的层状结构多级知识图谱的构建方法,其特征在于,还包括:各个图谱中实体id与实体名称均相同的实体之间根据实体id建立映射关系,各个图谱中实体名称相同而实体id不同的实体之间建立虚连接。4.根据权利要求1所述的层状结构多级知识图谱的构建方法,其特征在于,所述类型还包括拓展属性,所述拓展属性为高层级图谱引用的低层级图谱的类型的拓展属性,具有所述拓展属性的类型在所述高层级图谱和所述低层级图谱中均生成属性拓展标识。5.根据权利要求4所述的层状结构多级知识图谱的构建方法,其特征在于,还包括一种维护方法,根据维护实体的类型判断所述实体属于低层级图谱还是高层级图谱,在对应图谱对所述维护实体进行维护,当识别出的类型存在属性拓展标识,则表示所述类型属于高层级图谱。6.根据权利要求1-5任一所述的层状结构多级知识图谱的构建方法,其特征在于,所述纵向级联的若干层级的图谱,包括第一层级的通用图谱和多层级的领域图谱。7.一种层状结构多级知识图谱的融合方法,用于融合根据权利要求3所述的构建方法构建的层状结构多级知识图谱,其特征在于,根据所述被涉及的本体结构融合图谱中的本体结构,各个图谱中的具有相同实体名称的实体根据实体id建立映射关系或虚连接,根据所述映射关系和虚连接对所述具有相同实体名称的实体进行融合。8.一种层状结构多级知识图谱的查询方法,其特征在于,查询一种层状结构多级知识图谱,所述层状结构多级知识图谱包括纵向级联的若干层级的图谱,所述若干层级的图谱包括低层级图谱和高层级图谱,每一层级包括多种同类图谱;若干层级的所述图谱均包括本体结构;当高层级图谱中所需构建的本体结构中涉及任意低层级的本体结构,则所述高层级图谱引用被涉及的本体结构;所述本体结构包括一种或多种类型以及类型间的关联关系;根据类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据;所述类型包括属性结构和属性,所述属性结构表示属性的构成,所述属性包括字段名、约束字段以及索引方式;
各个图谱中实体id与实体名称均相同的实体之间根据实体id存在映射关系,各个图谱中实体名称相同而实体id不同的实体间存在虚连接;根据查询请求以及索引方式查询指定图谱对应的目标实体,当所述目标实体具有重复实体,则将各个所述目标实体根据所述映射关系和所述虚连接进行合并后返回查询结果。9.根据权利要求8所述的层状结构多级知识图谱的查询方法,其特征在于,还包括根据所述本体结构、属性结构以及查询请求查询目标实体的邻居实体。10.一种层状结构多级知识图谱的构建系统,其特征在于,包括:存储单元,用于存储纵向级联的若干层级的图谱,所述若干层级的图谱包括低层级图谱和高层级图谱,每一层级包括多种同类图谱,所述图谱均包括本体结构,所述本体结构包括一种或多种类型以及类型间的关联关系;构建单元,用于构建所述图谱中的本体结构以及属性结构;引用单元,用于高层级图谱中所需构建的本体结构中涉及任意低层级的本体结构,所述高层级图谱引用被涉及的本体结构;填充单元,用于根据所述类型和本体结构填充实体,所述实体包括实体名称、实体id和实体数据;着色单元,用于当高层级图谱中的类型涉及任意低层级图谱中的类型,对所述低层级图谱中被涉及的类型进行着色;关联单元,用于在实体间构建联系,实体id与实体名称均相同的实体间根据实体id构建映射关系,实体名称相同而实体id不同的实体间构建虚连接。
技术总结
本发明公开了一种层状结构多级知识图谱的构建、融合方法,其中构建方法包括:纵向级联的若干层级的图谱,每一层级包括多种同类图谱;图谱均包括本体结构;当高层级图谱中所需构建的本体结构中涉及任意低层级图谱的本体结构,高层级图谱引用被涉及的本体结构;本体结构包括一种或多种类型以及类型间的关联关系;当高层级图谱中的类型涉及任意低层级图谱中的类型,对低层级图谱中被涉及的类型进行着色;实体根据类型和本体结构进行填充,实体包括实体ID和实体数据。本发明的层状结构多级知识图谱,通过本体结构和属性结构的引用,在构建阶段可以省去重复构建的步骤和精力,并且在融合或查询阶段,能够通过相同的构架快速整合信息。信息。信息。
技术研发人员:杨丛聿 仇应俊 郝凯
受保护的技术使用者:新华智云科技有限公司
技术研发日:2022.02.18
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-7310.html