数据处理方法、装置和电子设备与流程

专利查询2023-03-13 149

1.本发明涉及数据处理的技术领域，尤其是涉及一种数据处理方法、装置和电子设备。

背景技术：

2.数据从产生、加工融合、流转流通到最终消亡，在数据之间自然会形成一种关系。可以借鉴人类社会中类似的一种关系来表达数据之间的这种关系，称之为数据的血缘关系。数据的血缘关系是元数据的组成部分之一。通过数据的血缘关系可以分析表和字段从数据源到当前表的血缘路径，以及血缘字段之间存在的关系是否满足，可以评判数据的一致性以及表设计的合理性，可以用于分析上游数据发生变化给下游数据带来的影响，在下游数据发生变化时可以追踪上游问题的源头，帮助我们更好地去理解数据。
3.一般来说，可以通过自动解析或系统追踪的方式去获取数据的血缘关系。其中，自动解析方法是当前获取数据的血缘关系的主要方法，其具体做法就是解析数据的sql(structured query language，结构化查询语言)语句、存储过程、etl(extract-transform-load，抽取、转换、加载)过程等文件，以确定数据的血缘关系。系统跟踪方法是通过数据加工流动过程中，由数据处理程序负责发送数据血缘信息，例如：在数据的注解部分增加对血缘的描述等。
4.然而，对于自动解析方法，由于数据的复杂代码和应用环境等原因，根据国际厂商的经验，自动解析方法可以仅覆盖到企业数据的70-95％，目前无法做到100％，数据的覆盖不够全面。对于系统跟踪方法，由于调度引擎的种类比较多，导致分析成本交过。获取sql执行日志比较困难，就算获取到sql执行日志，也需要长时间追踪和分析，还可能带来数据安全的问题，并且也只能覆盖一部分数据。

技术实现要素：

5.有鉴于此，本发明的目的在于提供一种数据处理方法、装置和电子设备，以降低获取数据血缘关系的成本，提高数据的覆盖率。
6.第一方面，本发明实施例提供了一种数据处理方法，应用于元数据搜索引擎，方法包括：响应血缘关系查询操作，确定血缘关系查询操作对应的目标数据表；基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。
7.在本发明较佳的实施例中，上述方法还包括：在创建目标数据表的过程中确定目标数据表的血缘关系；将目标数据表的血缘关系写入目标数据表的建表语句中；或者，将目标数据表的血缘关系写入目标数据表对应的血缘表中。
8.在本发明较佳的实施例中，上述将目标数据表的血缘关系写入目标数据表的建表语句中的步骤，包括：将目标数据表的血缘关系写入目标数据表中的指定字段内。
9.在本发明较佳的实施例中，上述基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系的步骤，包括：解析目标数据表中的指定字段，确定
目标数据表的血缘关系。
10.在本发明较佳的实施例中，上述目标数据表设置于数据库中，数据库包括多个数据表和一个血缘表；上述将目标数据表的血缘关系写入目标数据表对应的血缘表中的步骤，包括：将目标数据表的血缘关系写入数据库的血缘表中，以使血缘表记录数据库中的各个数据表的血缘关系。
11.在本发明较佳的实施例中，上述基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系的步骤，包括：从数据库的血缘表中查找目标数据表的血缘关系。
12.在本发明较佳的实施例中，上述基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系的步骤之后，方法还包括：基于目标数据表的血缘关系生成目标数据表的血缘关系图。
13.在本发明较佳的实施例中，上述方法还包括：将目标数据表的血缘关系或血缘关系图发送至与元数据搜索引擎通信连接的终端设备中。
14.第二方面，本发明实施例还提供一种数据处理装置，应用于元数据搜索引擎，装置包括：目标数据表确定模块，用于响应血缘关系查询操作，确定血缘关系查询操作对应的目标数据表；血缘关系确定模块，用于基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。
15.第三方面，本发明实施例还提供一种电子设备，包括处理器和存储器，存储器存储有能够被处理器执行的计算机可执行指令，处理器执行计算机可执行指令以实现上述的数据处理方法的步骤。
16.第四方面，本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令，计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现上述的数据处理方法的步骤。
17.本发明实施例带来了以下有益效果：
18.本发明实施例提供的一种数据处理方法、装置和电子设备，可以响应用户的血缘关系查询操作，基于血缘关系查询操作对应的目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。该方式中，可以基于建表语句或血缘表查询目标数据表的血缘关系，相比于常见的自动解析方法和系统追踪方法，该方式无需解析sql语句，解析血缘关系的方式较为简单，可以降低获取数据血缘关系的成本，可以获取所有数据的血缘关系，提高数据的覆盖率，还没有信息泄露的风险。
19.本公开的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本公开的上述技术即可得知。
20.为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。
附图说明
21.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前
提下，还可以根据这些附图获得其他的附图。
22.图1为本发明实施例提供的一种数据处理方法的流程图；
23.图2为本发明实施例提供的另一种数据处理方法的流程图；
24.图3为本发明实施例提供的一种数据处理方法的总体架构的示意图；
25.图4为本发明实施例提供的一种数据处理装置的结构示意图；
26.图5为本发明实施例提供的另一种数据处理装置的结构示意图；
27.图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
28.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
29.目前，数据从产生、加工融合、流转流通到最终消亡，在数据之间自然会形成一种关系。可以借鉴人类社会中类似的一种关系来表达数据之间的这种关系，称之为数据的血缘关系。数据的血缘关系是元数据的组成部分之一。通过数据的血缘关系可以分析表和字段从数据源到当前表的血缘路径，以及血缘字段之间存在的关系是否满足，可以评判数据的一致性以及表设计的合理性，可以用于分析上游数据发生变化给下游数据带来的影响，在下游数据发生变化时可以追踪上游问题的源头，帮助我们更好地去理解数据。
30.一般来说，可以通过自动解析或系统追踪的方式去获取数据的血缘关系。其中，自动解析方法是当前获取数据的血缘关系的主要方法，其具体做法就是解析数据的sql语句、存储过程、etl过程等文件，以确定数据的血缘关系。系统跟踪方法是通过数据加工流动过程中，由数据处理程序负责发送数据血缘信息，例如：在数据的注解部分增加对血缘的描述等。
31.然而，对于自动解析方法，由于数据的复杂代码和应用环境等原因，根据国际厂商的经验，自动解析方法可以仅覆盖到企业数据的70-95％，目前无法做到100％，数据的覆盖不够全面。对于系统跟踪方法，由于调度引擎的种类比较多，导致分析成本交过。获取sql执行日志比较困难，就算获取到sql执行日志，也需要长时间追踪和分析，还可能带来数据安全的问题，并且也只能覆盖一部分数据。基于此，本发明实施例提供的一种数据处理方法、装置和电子设备，具体设计一种数据血缘获取规范，无需解析sql语句，解析血缘关系的方式较为简单，可以降低获取数据血缘关系的成本，可以获取所有数据的血缘关系，提高数据的覆盖率，还没有信息泄露的风险。
32.为便于对本实施例进行理解，首先对本发明实施例所公开的一种数据处理方法进行详细介绍。
33.本发明实施例提供了一种数据处理方法，应用于服务器，应用于元数据搜索引擎，元数据搜索引擎即元搜索引擎(meta search engine)。元搜索引擎在接受用户的查询请求后，可以同时在多个搜索引擎上搜索，并将结果返回给用户。因此，有搜索引擎之上的搜索引擎之称，元搜索引擎具有提高搜索速度、智能化处理搜索结果、设置个性搜索功能，提高用户检索界面的友好性的功能，并且查全率和查准率都比较高。
34.元数据(metadata)是描述其它数据的数据，或者说是用于提供某种资源的有关信息的结构数据。元数据是描述信息资源或数据等对象的数据，其使用目的在于：识别资源；评价资源；追踪资源在使用过程中的变化；实现简单高效地管理大量网络化数据；实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
35.基于上述描述，参见图1所示的一种数据处理方法的流程图，该数据处理方法包括如下步骤：
36.步骤s100，响应血缘关系查询操作，确定血缘关系查询操作对应的目标数据表。
37.用户可以在终端设备上执行血缘关系查询操作，其中，终端设备可以是手机、电脑、平板电脑、服务器等具有通信和交互功能的设备，用户执行血缘关系查询操作之后，本发明实施例中的元数据搜索引擎可以响应上述响应血缘关系查询操作，确定上述血缘关系查询操作对应的数据表，可以称为目标数据表。
38.数据表是由表名、表中的字段和表的记录三个部分组成的。设计数据表结构就是定义数据表文件名，确定数据表包含哪些字段，各字段的字段名、字段类型、及宽度，并将这些数据输入到计算机当中。举例来说，用户想要查询数据表a的血缘关系，可以在执行血缘关系查询操作时选择数据表a作为目标数据表。
39.步骤s102，基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。
40.在确定目标数据表之后，本发明实施例可以基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。具体地，在目标数据表的建立过程中，可以在建表语句(表的字段)中通过comment(注释)标注数据来源，例如在sql语句中，comment可以用于在生成的sql语句中添加注释内容。因此，在查询目标数据表的血缘关系时，就可以基于sql语句中的comment(即目标数据表的建表语句)进行查询。
41.或者，在目标数据表的建立过程中，可以在目标数据表所属的数据库中创建一个血缘表，血缘表里的数据用来描述整个数据库所有的数据表的数据的来源，就像项目的readme文件。因此，在查询目标数据表的血缘关系时，就可以基于目标数据表所属的数据库的血缘表(即目标数据表对应的血缘表)进行查询。
42.举例来说，用户在目标数据表的建立过程中，可以手工整理血缘关系，将血缘关系整理到血缘表里或建表语句里。元数据搜索引擎抓取可以数据库的血缘表，或者读取数据表的建表语句，然后分析出血缘关系，供用户搜索。
43.本发明实施例提供的一种数据处理方法，可以响应用户的血缘关系查询操作，基于血缘关系查询操作对应的目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。该方式中，可以基于建表语句或血缘表查询目标数据表的血缘关系，相比于常见的自动解析方法和系统追踪方法，该方式无需解析sql语句，解析血缘关系的方式较为简单，可以降低获取数据血缘关系的成本，可以获取所有数据的血缘关系，提高数据的覆盖率，还没有信息泄露的风险。
44.本发明实施例提供了另一种数据处理方法，该方法在上述实施例的基础上实现；本实施例重点描述生成目标数据表的血缘关系图的具体实施方式。参见图2所示的另一种数据处理方法的流程图，本实施例中的数据处理方法包括如下步骤：
45.步骤s200，响应血缘关系查询操作，确定血缘关系查询操作对应的目标数据表。
46.本发明实施例中，用户在数据表的建立过中可以先将血缘关系写入建表语句或血缘表，例如：在创建目标数据表的过程中确定目标数据表的血缘关系；将目标数据表的血缘关系写入目标数据表的建表语句中；或者，将目标数据表的血缘关系写入目标数据表对应的血缘表中。
47.其中，血缘关系可以由用户手动整理，也可以由计算机通过自动解析或系统追踪的方式去获取数据的血缘关系。目标数据表的血缘关系可以写入目标数据表的建表语句中，也可以写入目标数据表对应的血缘表中。
48.具体地，目标数据表的血缘关系可以通过下述方式写入目标数据表的建表语句中：将目标数据表的血缘关系写入目标数据表中的指定字段内。参见下述代码：
[0049][0050]
通过上述代码，可以将目标数据表的血缘关系写入目标数据表中的comment字段(即指定字段)内。
[0051]
具体地，目标数据表的血缘关系可以通过写入目标数据表对应的血缘表：将目标数据表的血缘关系写入数据库的血缘表中，以使血缘表记录数据库中的各个数据表的血缘关系。
[0052]
其中，目标数据表设置于数据库中，数据库包括多个数据表和一个血缘表。举例来说，目标数据表为数据表x，设置于数据库中，数据库中可以包括数据表x、数据表y和数据表z，数据库中还可以包括一个血缘表，其中，血缘表可以记录数据表x、数据表y和数据表z的血缘关系。
[0053]
表名字段名方式来源范围数据表1 映射源：库：表：表级数据表2字段名function源：库：表：字段：字段级数据表3字段名精度为2源：库：表：字段：字段级数据表4字段名视图源：库：表：字段：字段级
[0054]
表1一种血缘表
[0055]
可以参见表1所示的一种血缘表，表1中的来源分别记载了数据表1、数据表2、数据表3和数据表4的血缘关系。
[0056]
步骤s202，基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。
[0057]
参见图3所示的一种数据处理方法的总体架构的示意图，如图3所示，可以通过抓
取建表语句或读取血缘表两种方式确定目标数据表的血缘关系。
[0058]
具体地，可以通过下述步骤基于目标数据表的建表语句确定目标数据表的血缘关系：解析目标数据表中的指定字段，确定目标数据表的血缘关系。
[0059]
例如，可以将目标数据表的血缘关系写入目标数据表中的comment字段(即指定字段)内，因此，可以解析目标数据表中的comment字段，从comment字段确定目标数据表的血缘关系。
[0060]
具体地，可以通过下述步骤基于目标数据表对应的血缘表确定目标数据表的血缘关系：从数据库的血缘表中查找目标数据表的血缘关系。
[0061]
举例来说，目标数据表为数据表x，设置于数据库中，数据库中可以包括数据表x、数据表y和数据表z，数据库中还可以包括一个血缘表，其中，血缘表可以记录数据表x、数据表y和数据表z的血缘关系。因此，从数据库的血缘表中查找数据表x的血缘关系。
[0062]
步骤s204，基于目标数据表的血缘关系生成目标数据表的血缘关系图。
[0063]
如图3所示，在确定血缘关系之后，可以基于血缘关系生成目标数据表的血缘关系图，血缘关系图与血缘关系相比，可以更加直观地看出目标数据的血缘路径，可以提高血缘关系的观看效率。
[0064]
在确定目标数据表的血缘关系或血缘关系图之后，还可以发送血缘关系或血缘关系图，例如：将目标数据表的血缘关系或血缘关系图发送至与元数据搜索引擎通信连接的终端设备中。其中，终端设备可以是手机、电脑、平板电脑、服务器等具有通信和交互功能的设备，以方便用户在终端设备查看目标数据表的血缘关系或血缘关系图。
[0065]
本发明实施例提供的上述方法，可以响应用户的血缘关系查询操作，基于血缘关系查询操作对应的目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。
[0066]
本发明实施例提供的上述方法，用户在数据表的建立过中可以先将血缘关系写入建表语句或血缘表，其中，血缘关系可以由用户手动整理，也可以由计算机通过自动解析或系统追踪的方式去获取数据的血缘关系。例如：可以将目标数据表的血缘关系写入目标数据表中的指定字段内，或者，可以将目标数据表的血缘关系写入数据库的血缘表中，以使血缘表记录数据库中的各个数据表的血缘关系。
[0067]
本发明实施例提供的上述方法，可以通过抓取建表语句或读取血缘表两种方式确定目标数据表的血缘关系。例如：解析目标数据表中的指定字段，确定目标数据表的血缘关系。又例如：从数据库的血缘表中查找目标数据表的血缘关系。
[0068]
该方式中，可以基于建表语句或血缘表查询目标数据表的血缘关系，相比于常见的自动解析方法和系统追踪方法，该方式无需解析sql语句，解析血缘关系的方式较为简单，可以降低获取数据血缘关系的成本，可以获取所有数据的血缘关系，提高数据的覆盖率，还没有信息泄露的风险。
[0069]
对应于上述方法实施例，本发明实施例提供了一种数据处理装置，应用于元数据搜索引擎，参见图4所示的一种数据处理装置的结构示意图，该数据处理装置包括：
[0070]
目标数据表确定模块41，用于响应血缘关系查询操作，确定血缘关系查询操作对应的目标数据表；
[0071]
血缘关系确定模块42，用于基于目标数据表的建表语句或者目标数据表对应的血
缘表，确定目标数据表的血缘关系。
[0072]
本发明实施例提供的一种数据处理装置，可以响应用户的血缘关系查询操作，基于血缘关系查询操作对应的目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。该方式中，可以基于建表语句或血缘表查询目标数据表的血缘关系，相比于常见的自动解析方法和系统追踪方法，该方式无需解析sql语句，解析血缘关系的方式较为简单，可以降低获取数据血缘关系的成本，可以获取所有数据的血缘关系，提高数据的覆盖率，还没有信息泄露的风险。
[0073]
参见图5所示的另一种数据处理装置的结构示意图，该数据处理装置还包括：血缘关系写入模块43，与目标数据表确定模块41连接，血缘关系写入模块43用于在创建目标数据表的过程中确定目标数据表的血缘关系；将目标数据表的血缘关系写入目标数据表的建表语句中；或者，将目标数据表的血缘关系写入目标数据表对应的血缘表中。
[0074]
上述血缘关系写入模块，用于将目标数据表的血缘关系写入目标数据表中的指定字段内。
[0075]
上述血缘关系确定模块，用于解析目标数据表中的指定字段，确定目标数据表的血缘关系。
[0076]
上述目标数据表设置于数据库中，数据库包括多个数据表和一个血缘表；上述血缘关系写入模块，用于将目标数据表的血缘关系写入数据库的血缘表中，以使血缘表记录数据库中的各个数据表的血缘关系。
[0077]
上述血缘关系确定模块，用于从数据库的血缘表中查找目标数据表的血缘关系。
[0078]
如图5所示，该数据处理装置还包括：血缘关系图生成模块44，与血缘关系确定模块42连接，血缘关系图生成模块44用于基于目标数据表的血缘关系生成目标数据表的血缘关系图。
[0079]
如图5所示，该数据处理装置还包括：血缘关系或血缘关系图发送模块45，与血缘关系确定模块42连接，也与血缘关系图生成模块44连接，血缘关系或血缘关系图发送模块45用于将目标数据表的血缘关系或血缘关系图发送至与元数据搜索引擎通信连接的终端设备中。
[0080]
本发明实施例所提供的数据处理装置，其实现原理及产生的技术效果和前述数据处理方法实施例相同，为简要描述，数据处理装置实施例部分未提及之处，可参考前述数据处理方法实施例中相应内容。
[0081]
本发明实施例还提供了一种电子设备，用于运行上述数据处理方法；参见图6所示的一种电子设备的结构示意图，该电子设备包括存储器100和处理器101，其中，存储器100用于存储一条或多条计算机指令，一条或多条计算机指令被处理器101执行，以实现上述数据处理方法。
[0082]
进一步地，图6所示的电子设备还包括总线102和通信接口103，处理器101、通信接口103和存储器100通过总线102连接。
[0083]
其中，存储器100可能包含高速随机存取存储器(ram，random access memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口103(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线102可以是isa总线、pci总线或
eisa总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。
[0084]
处理器101可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器，包括中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)等；还可以是数字信号处理器(digital signal processor，简称dsp)、专用集成电路(application specific integrated circuit，简称asic)、现场可编程门阵列(field-programmable gate array，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器100，处理器101读取存储器100中的信息，结合其硬件完成前述实施例的方法的步骤。
[0085]
本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令在被处理器调用和执行时，计算机可执行指令促使处理器实现上述数据处理方法，具体实现可参见方法实施例，在此不再赘述。
[0086]
本发明实施例所提供的数据处理方法、装置和电子设备的计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行前面方法实施例中的方法，具体实现可参见方法实施例，在此不再赘述。
[0087]
所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和/或装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0088]
另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。
[0089]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0090]
在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。
[0091]
最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

技术特征：
1.一种数据处理方法，其特征在于，应用于元数据搜索引擎，所述方法包括：响应血缘关系查询操作，确定所述血缘关系查询操作对应的目标数据表；基于所述目标数据表的建表语句或者所述目标数据表对应的血缘表，确定所述目标数据表的血缘关系。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：在创建所述目标数据表的过程中确定所述目标数据表的血缘关系；将所述目标数据表的血缘关系写入所述目标数据表的建表语句中；或者，将所述目标数据表的血缘关系写入所述目标数据表对应的血缘表中。3.根据权利要求2所述的方法，其特征在于，将所述目标数据表的血缘关系写入所述目标数据表的建表语句中的步骤，包括：将所述目标数据表的血缘关系写入所述目标数据表中的指定字段内。4.根据权利要求3所述的方法，其特征在于，基于所述目标数据表的建表语句或者所述目标数据表对应的血缘表，确定所述目标数据表的血缘关系的步骤，包括：解析所述目标数据表中的所述指定字段，确定所述目标数据表的血缘关系。5.根据权利要求2所述的方法，其特征在于，所述目标数据表设置于数据库中，所述数据库包括多个数据表和一个血缘表；将所述目标数据表的血缘关系写入所述目标数据表对应的血缘表中的步骤，包括：将所述目标数据表的血缘关系写入所述数据库的血缘表中，以使所述血缘表记录所述数据库中的各个所述数据表的血缘关系。6.根据权利要求5所述的方法，其特征在于，基于所述目标数据表的建表语句或者所述目标数据表对应的血缘表，确定所述目标数据表的血缘关系的步骤，包括：从所述数据库的血缘表中查找所述目标数据表的血缘关系。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：基于所述目标数据表的建表语句或者所述目标数据表对应的血缘表，确定所述目标数据表的血缘关系的步骤之后，所述方法还包括：基于所述目标数据表的血缘关系生成所述目标数据表的血缘关系图。8.根据权利要求7所述的方法，其特征在于，所述方法还包括：将所述目标数据表的血缘关系或血缘关系图发送至与所述元数据搜索引擎通信连接的终端设备中。9.一种数据处理装置，其特征在于，应用于元数据搜索引擎，所述装置包括：目标数据表确定模块，用于响应血缘关系查询操作，确定所述血缘关系查询操作对应的目标数据表；血缘关系确定模块，用于基于所述目标数据表的建表语句或者所述目标数据表对应的血缘表，确定所述目标数据表的血缘关系。10.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现权利要求1-8任一项所述的数据处理方法的步骤。11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在被处理器调用和执行时，所述计算机可执行指令促使
处理器实现权利要求1-8任一项所述的数据处理方法的步骤。

技术总结
本发明提供了一种数据处理方法、装置和电子设备。其中，该方法应用于元数据搜索引擎，该方法包括：响应血缘关系查询操作，确定血缘关系查询操作对应的目标数据表；基于目标数据表的建表语句或者目标数据表对应的血缘表，确定目标数据表的血缘关系。该方式中，可以基于建表语句或血缘表查询目标数据表的血缘关系，相比于常见的自动解析方法和系统追踪方法，该方式无需解析SQL语句，解析血缘关系的方式较为简单，可以降低获取数据血缘关系的成本，可以获取所有数据的血缘关系，提高数据的覆盖率，还没有信息泄露的风险。还没有信息泄露的风险。还没有信息泄露的风险。

技术研发人员：孙成虎
受保护的技术使用者：北京金山云网络技术有限公司
技术研发日：2022.03.15
技术公布日：2022/5/25

转载请注明原文地址:https://tc.8miu.com/read-15638.html

专利

最新回复(0)