背景技术:
1、本发明涉及一种用于确定知识图中的链路的设备和计算机实现的方法。
技术实现思路
1、根据独立权利要求的计算机实现的方法和设备提供了对知识图中先前未看到的链路的改进预测。
2、知识图是一种多关系图,其通常以三元组(头实体h、关系r和尾实体t)的形式表示事实。知识图嵌入经由链路预测在距离空间或神经网络中以数字方式表示知识图,从而实现了利用强大的机器学习用于许多下游任务(诸如查询回答、实体分类)的可能性。双曲空间中的知识图嵌入即使在低维嵌入空间中也可以实现非常好的性能。
3、用于确定知识图中的链路的计算机实现的方法,其中该链路包括第一实体、第二实体和关系,其中该方法包括:确定第一表示,其中第一表示表示第一实体的嵌入;从知识图的实体嵌入的表示集合中选择第二表示,其中第二表示表示第二实体的嵌入,并且其中选择第二表示包括确定对第二表示的预测并且取决于对第二表示的预测选择第二表示;以及确定包括第一实体、第二实体和关系的链路,其中第一表示包括双曲空间(特别是二维双曲空间)中的多维(特别是二维)向量,其中确定第一表示包括将第一实体的嵌入拆分成第一多维向量集合,取决于该关系将第一集合的向量映射到第一表示的多维向量,并且其中确定对第二表示的预测包括取决于该关系旋转和平移双曲空间中的多维向量。该方法提供了多重外推(multi-foldextrapolation)至:训练中未看到的三元组、训练数据中表示不足的实体、以及训练数据中表示不足的关系。该方法改进了低维空间中的链路预测。该方法支持强合成。
4、该链路包括头实体(第一实体)和尾实体(第二实体)。该方法将流形m中头实体的嵌入分解为乘积空间p的分量空间中的子向量,并对子向量执行关系特定的平移和旋转以确定对第二表示的预测。基于得到的平移和旋转的子向量选择第二表示。
5、在一些实施例中,对第二表示的预测包括双曲空间中的多维(特别是二维)向量,其中第二表示包括双曲空间中的多维(特别是二维)向量,并且其中选择第二表示包括确定在第二表示的多维向量和在同一双曲空间中的对第二表示的预测的多维向量之间的差异,取决于差异确定距离,以及取决于距离选择第二表示。取决于平移和旋转的子向量来确定距离。第二表示可以是给定的基础真值(groundtruth),或者可以取决于嵌入或第二实体来确定。
6、在一些实施例中,确定距离包括连接(concatenate)对第二表示的预测的多维向量,连接第二表示的多维向量,以及取决于对第二表示的预测的已连接多维向量和第二表示的已连接多维向量来确定距离。例如,连接平移和旋转的子向量,并且确定到表示第二实体嵌入的已连接向量的距离。
7、在一些实施例中,确定第一表示包括将第一集合的向量映射到不同的双曲空间。
8、在一些实施例中,至少一个双曲空间的曲率由关系定义。这意味着曲率是可学习的参数。
9、在一些实施例中,在至少一个双曲空间中的旋转范围由关系定义。这意味着旋转范围是可学习的参数。
10、在一些实施例中,在至少一个双曲空间中的平移范围由关系定义。这意味着平移范围是可学习的参数。
11、在一些实施例中,该方法包括提供该关系,其中该关系包括每个双曲空间的一个参数,该参数定义了双曲空间的旋转范围、平移范围和/或曲率。在推断中,该关系(即至少一个学习的参数)被提供用于为给定的第一实体确定第二实体。
12、在一些实施例中,该方法包括确定知识图的实体嵌入的表示集合,其中确定嵌入的表示集合包括将相应的嵌入拆分成多维向量的集合,将相应集合的向量映射到相应表示的多维向量,特别是取决于关系。包括第二实体的其他实体被嵌入,并且相应的嵌入由多维向量的相应集合到双曲空间中的映射来表示。
13、在一些实施例中,该方法包括训练模型,用于取决于该关系将第一实体映射到第一表示,用于取决于该关系将第二实体映射到第二表示,用于取决于该关系在双曲空间中旋转和平移第一表示,以及用于取决于对第二表示的预测并取决于第二表示选择第二实体,或者用该模型选择第二实体。
14、在一些实施例中,该方法包括:取决于链路确定用于控制技术系统的控制信号,所述技术系统特别是物理系统,优选地是计算机控制的机器,特别是机器人系统、车辆、家用电器、电动工具、制造机器、个人助理或访问控制系统;或者取决于链路对传感器数据进行分类,特别是用于检测传感器数据中宾语的存在或者对传感器数据执行语义分割,优选地关于交通标志、路面、行人、车辆;或者取决于链路分析数据,特别是标量时间序列数据,优选地来自传感器;或者取决于链路确定技术系统的状态。
15、用于确定知识图中的链路的设备包括至少一个处理器和至少一个存储装置,其中该至少一个处理器被配置成执行指令,该指令当被该至少一个处理器执行时使得该至少一个处理器执行该方法,其中该至少一个存储装置被配置成存储该指令。
16、一种计算机程序包括计算机可读指令,该计算机可读指令当由计算机执行时使得计算机执行该方法的步骤。
1.一种用于确定知识图中的链路的计算机实现的方法,其中所述链路包括第一实体、第二实体和关系,其特征在于所述方法包括:确定(206)第一表示,其中所述第一表示表示第一实体的嵌入;从知识图的实体嵌入的表示集合中选择(208)第二表示,其中所述第二表示表示第二实体的嵌入,并且其中选择(208)第二表示包括确定(208-1)对第二表示的预测并且取决于对第二表示的预测来选择(208-2)第二表示;以及确定(210)包括第一实体、第二实体和关系的链路,其中所述第一表示包括双曲空间、特别是二维双曲空间中的多维、特别是二维向量,其中确定(206)第一表示包括将第一实体的嵌入拆分(206-1)成第一多维向量集合,取决于所述关系将第一集合的向量映射(206-2)到第一表示的多维向量,并且其中确定(208-1)对第二表示的预测包括取决于所述关系旋转(208-11)和平移(208-12)双曲空间中的多维向量。
2.根据权利要求1所述的方法,其特征在于,对第二表示的预测包括双曲空间中的多维、特别是二维向量,其中第二表示包括双曲空间中的多维、特别是二维向量,并且其中选择(208-2)第二表示包括:确定(208-21)在第二表示的多维向量和在同一双曲空间中的对第二表示的预测的多维向量之间的差异,取决于所述差异确定(208-22)距离,以及取决于所述距离选择(208-23)第二表示。
3.根据权利要求2所述的方法,其特征在于,确定(208-22)距离包括连接(208-221)对第二表示的预测的多维向量,连接(208-222)第二表示的多维向量,以及取决于对第二表示的预测的已连接多维向量和第二表示的已连接多维向量来确定(208-223)距离。
4.根据前述权利要求之一所述的方法,其特征在于,确定(206-1)第一表示包括将第一集合的向量映射(206-2)到不同的双曲空间。
5.根据前述权利要求之一所述的方法,其特征在于,至少一个双曲空间的曲率由所述关系定义。
6.根据前述权利要求之一所述的方法,其特征在于,在至少一个双曲空间中的旋转范围由所述关系定义。
7.根据前述权利要求之一所述的方法,其特征在于,在至少一个双曲空间中的平移范围由所述关系定义。
8.根据前述权利要求之一所述的方法,其特征在于,所述方法包括提供(204)所述关系,其中所述关系包括每个双曲空间的一个参数,所述参数定义了双曲空间的旋转范围、平移范围和/或曲率。
9.根据前述权利要求之一所述的方法,其特征在于,所述方法包括确定(206)知识图的实体嵌入的表示集合,其中确定(206)嵌入的表示集合包括将相应嵌入拆分(206-1)成多维向量的集合,将相应集合的向量映射(206-2)到相应表示的多维向量,特别是取决于所述关系。
10.根据前述权利要求之一所述的方法,其特征在于,所述方法包括训练模型,用于取决于所述关系将第一实体映射到第一表示,用于取决于所述关系将第二实体映射到第二表示,用于取决于所述关系在双曲空间中旋转和平移第一表示,以及用于取决于对第二表示的预测并取决于第二表示来确定第二实体,或者用所述模型选择第二实体。
11.根据前述权利要求之一所述的方法,其特征在于,所述方法包括取决于链路确定(212)用于控制技术系统(106)的控制信号(112),所述技术系统(106)特别是物理系统,优选是计算机控制的机器,特别是机器人系统、车辆、家用电器、电动工具、制造机器、个人助理或访问控制系统;或者取决于链路对传感器数据(114)进行分类(212),特别是用于检测传感器数据(114)中宾语的存在,或者对传感器数据(114)执行(212)语义分割,优选地关于交通标志、路面、行人、车辆;或者取决于链路分析数据(114),特别是标量时间序列数据,优选地来自传感器(108);或者取决于链路确定(212)技术系统(106)的状态。
12.一种用于确定知识图中的链路的设备(100),其特征在于,所述设备(100)包括至少一个处理器(102)和至少一个存储装置(104),其中所述至少一个处理器(102)被配置成执行指令,所述指令当由所述至少一个处理器(102)执行时使得所述至少一个处理器(102)执行根据前述权利要求中的一项所述的方法,其中所述至少一个存储装置(104)被配置成存储所述指令。
13.一种计算机程序,其中所述计算机程序包括计算机可读指令,所述计算机可读指令当由计算机执行时使得所述计算机执行根据权利要求1至12中的一项所述的方法的步骤。