本发明涉及矿产资源预测,具体涉及基于知识图谱的成矿预测模型构建方法、系统及产品。
背景技术:
1、矿产资源是指经过地质成矿作用而形成的天然赋存于地壳内部或地表具有开发利用价值的矿物或有用元素的集合体。矿产资源是推动人类社会发展和探究地球系统运行模式的重要基础和宝贵窗口,对其进行准确预测具有重要意义。
2、当前,相关矿产资源预测研究主要基于专家经验和建立的典型矿床模型,运用地质、地球物理、地球化学、遥感数据等来估算目标区域的成矿概率,在这一过程中该类研究往往只关注与成矿直接相关的重要指标。
3、然而,成矿系统并不是一个孤立的系统,其是地球多圈层物理、化学、生物等作用相互联系、相互影响、相互制约的耦合产物。现有的矿产资源预测模型对岩石圈物质结构、壳幔演化、成矿物质的演化与循环等相关因素的远程动态关联和相互制约关注较少,无法全面利用矿产资源要素进行有效预测,导致建立的成矿模式和预测模型多具专属性和特殊性,缺乏普适性和通用性。
技术实现思路
1、有鉴于此,本发明提供了基于知识图谱的成矿预测模型构建方法、系统及产品,以解决现有矿产资源预测模型构建缺乏对矿产资源要素的全面利用,影响了预测结果的准确性,难以满足矿产资源预测智能化要求的问题。
2、第一方面,本发明提供了一种基于知识图谱的成矿预测模型构建方法,方法包括:
3、构建矿产资源的知识图谱,知识图谱包含元素、矿物、岩石、矿床、成矿作用和地质现象的知识数据;
4、基于地球系统、成矿系统、勘查系统和预测评价系统的数据类型对知识图谱进行知识提取,得到第一知识数据;
5、基于预设知识挖掘方法对第一知识数据和/或知识图谱进行知识挖掘,得到第二知识数据;
6、基于第一知识数据和第二知识数据构建矿产资源预测模型。
7、本发明考虑到岩石圈物质结构、壳幔演化、成矿物质的演化与循环等因素对成矿的影响,基于地球系统数据类型、成矿系统数据类型、勘查系统数据类型和预测评价系统数据类型获取对应的知识数据,并进一步从该数据中挖掘新的知识数据来构建矿产资源预测模型,实现了对矿产资源要素的全面利用,能够显著提高预测结果的准确性,满足矿产资源预测的智能化要求。
8、在一种可选的实施方式中,构建矿产资源的知识图谱,包括:
9、收集包含地球系统、成矿系统、勘查系统和预测评价系统的矿产资源的相关数据;
10、对相关数据进行实体与关系标注,得到大量知识数据,知识数据为包含实体以及实体关系的三元组数据,其中,实体表示与矿产资源成矿相关的要素,实体关系表示不同实体间的语义关系;
11、从大量知识数据中提取训练数据和测试数据,并基于训练数据构建数据生成模型,其中,数据生成模型用于生成包含实体以及实体关系的三元组数据;
12、将测试数据输入数据生成模型进行预测,对应得到大量生成的三元组数据;
13、将所有三元组数据进行存储,得到矿产资源的知识图谱。
14、本发明通过收集矿产资源相关数据并对其进行标注以获取标准的三元组知识数据,以及将标注知识数据通过构建好的机器学习模型进行预测以生成海量的三元组数据,能够保障数据集的规范性和丰富性,一定程度上提高了矿产资源预测模型预测结果的准确性。
15、在一种可选的实施方式中,第二知识数据包括第一挖掘知识,基于预设知识挖掘方法对第一知识数据和/或知识图谱进行知识挖掘,得到第二知识数据,包括:
16、响应于用户从第一知识数据和/或知识图谱任选的两个目标实体,将两个目标实体基于预设的实体关系类型查询方式进行知识搜索,对应得到搜索知识;
17、将搜索知识进行整合,得到第一挖掘知识。
18、本发明在获取用户给定的目标实体时,通过知识检索技术从相关知识图谱中快速找到与之相同的或最类似的知识数据,进一步挖掘实体间存在的强关联和间接关联的实体关系,以及识别实体间的长程关联和隐式连接的实体关系,为后续实现全要素的矿产资源预测模型构建提供数据指示与参考内容。
19、在一种可选的实施方式中,预设的实体关系类型包括直接关系和间接关系,其中,间接关系包括短程关系和长程关系;将两个目标实体基于预设的实体关系类型查询方式进行知识搜索,对应得到搜索知识,包括:
20、获取两个目标实体存在关联所需的最小跳数和路径数量;
21、判断最小跳数是否小于预设跳数阈值;
22、若最小跳数小于预设跳数阈值,则确定两个目标实体存在直接关系,并基于两个目标实体和直接关系得到对应的搜索知识;
23、若最小跳数不小于预设跳数阈值,则确定两个目标实体存在间接关系,判断路径数量是否小于预设路径阈值;
24、若路径数量小于预设路径阈值,则确定两个目标实体存在短程关系,并基于两个目标实体和短程关系得到对应的搜索知识;
25、若路径数量不小于预设路径阈值,则确定两个目标实体存在长程关系,并基于两个目标实体和长程关系得到对应的搜索知识。
26、本发明通过实体间的最小跳数和路径数量来定量判断实体间存在的关联关系,能够挖掘更丰富的实体关系,为后续全要素矿产资源预测模型的构建提供研究数据。
27、在一种可选的实施方式中,第二知识数据包括第二挖掘知识,基于预设知识挖掘方法对第一知识数据和/或知识图谱进行知识挖掘,得到第二知识数据,包括:
28、基于第一知识数据和/或知识图谱构建数据集,数据集包括:训练数据集和测试数据集;
29、将训练数据集通过预设知识图谱嵌入模型进行训练,对应得到知识推理模型;
30、将测试数据集输入知识推理模型进行推理,得到推理知识;
31、将推理知识进行整合,得到第二挖掘知识。
32、本发明基于现有的知识数据并利用知识图谱嵌入模型对其进行知识推理,能够挖掘出新的可能存在的实体关系,即推理知识,为后续实现全要素的矿产资源预测模型构建提供研究数据。
33、在一种可选的实施方式中,第二知识数据包括第三挖掘知识,基于预设知识挖掘方法对第一知识数据和/或知识图谱进行知识挖掘,得到第二知识数据,包括:
34、获取矿产资源与第一知识数据和/或知识图谱中任一尾部实体存在关联的全部路径;
35、统计每条路径中不同实体关系的出现频次,计算矿产资源与尾部实体的关系概率,并基于出现频次和关系概率确定对应路径的强度指数;
36、整合全部路径的强度指数,得到第三挖掘知识。
37、本发明考虑到不同元素、矿物和岩石对矿产资源的成矿影响概率不同,基于实体间关联路径的出现频次和关系概率确定对应路径的强度指数,通过强度指数以表征对应实体间关联关系的强弱,能够实现基于图谱分析计算新的隐式知识并对其进行不同权重赋值的知识挖掘,为后续实现全要素的矿产资源预测模型构建提供研究数据。
38、第二方面,本发明提供了一种基于知识图谱的成矿预测模型构建系统,系统包括:
39、数据构建模块,用于构建矿产资源的知识图谱,知识图谱包含元素、矿物、岩石、矿床、成矿作用和地质现象的知识数据;
40、知识提取模块,用于基于地球系统、成矿系统、勘查系统和预测评价系统的数据类型对知识图谱进行知识提取,得到第一知识数据;
41、知识挖掘模块,用于基于预设知识挖掘方法对第一知识数据和/或知识图谱进行知识挖掘,得到第二知识数据;
42、模型构建模块,用于基于第一知识数据和第二知识数据构建矿产资源预测模型。
43、本发明的基于知识图谱的成矿预测模型构建系统,考虑到岩石圈物质结构、壳幔演化、成矿物质的演化与循环等因素对成矿的影响,基于地球系统数据类型、成矿系统数据类型、勘查系统数据类型和预测评价系统数据类型获取对应的知识数据,并进一步从该数据中挖掘新的知识数据来构建矿产资源预测模型,实现了对矿产资源要素的全面利用,有助于提高预测结果的准确性,满足矿产资源预测的智能化要求。
44、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的一种基于知识图谱的成矿预测模型构建方法。
45、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的一种基于知识图谱的成矿预测模型构建方法。
46、第五方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的一种基于知识图谱的成矿预测模型构建方法。
1.一种基于知识图谱的成矿预测模型构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于知识图谱的成矿预测模型构建方法,其特征在于,所述构建矿产资源的知识图谱,包括:
3.根据权利要求1至2中任一项所述的基于知识图谱的成矿预测模型构建方法,其特征在于,所述第二知识数据包括第一挖掘知识,所述基于预设知识挖掘方法对所述第一知识数据和/或所述知识图谱进行知识挖掘,得到第二知识数据,包括:
4.根据权利要求3所述的基于知识图谱的成矿预测模型构建方法,其特征在于,所述预设的实体关系类型包括直接关系和间接关系,其中,所述间接关系包括短程关系和长程关系;所述将所述两个目标实体基于预设的实体关系类型查询方式进行知识搜索,对应得到搜索知识,包括:
5.根据权利要求1至2中任一项所述的基于知识图谱的成矿预测模型构建方法,其特征在于,所述第二知识数据包括第二挖掘知识,所述基于预设知识挖掘方法对所述第一知识数据和/或所述知识图谱进行知识挖掘,得到第二知识数据,包括:
6.根据权利要求1至2中任一项所述的基于知识图谱的成矿预测模型构建方法,其特征在于,所述第二知识数据包括第三挖掘知识,所述基于预设知识挖掘方法对所述第一知识数据和/或所述知识图谱进行知识挖掘,得到第二知识数据,包括:
7.一种基于知识图谱的成矿预测模型构建系统,其特征在于,所述系统包括:
8.一种计算机设备,其特征在于,所述设备包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至6中任一项所述的基于知识图谱的成矿预测模型构建方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的基于知识图谱的成矿预测模型构建方法。
10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的基于知识图谱的成矿预测模型构建方法。
