1.本发明涉及计算机领域,并且更具体地涉及一种对象存储的数据迁移的方法、装置、设备及可读介质。
背景技术:
2.当前企业的信息系统数据量成几何级数增加。分布式对象存储同时具有块存储高速直接访问磁盘的特点以及文件存储分布式共享的特点,适用于图片、视频等海量非结构化数据的存储,一经推出就得到广泛的发展与应用。
3.随着业务需求的变化,信息技术的不断更新换代,原有的存储系统必然会遇到一些无法逾越的限制,为了能够让海量存储设备更好的支撑企业的发展,设备的更新换代是必然的。为使原有系统产生的业务数据在新系统中能够继续提供价值,需要将原有系统的数据迁移至新的系统。在业务约束条件下,快速、正确、完整地进行数据迁移,保障数据的完整性和一致性,海量数据迁移成为企业解决存储空间不足和信息系统升级改造等过程中必须面对的一个现实问题。
4.目前对象存储中,数据迁移是以桶为粒度的,当需要迁移有大量对象的桶,大量时间耗费在遍历对象上,导致数据迁移速度缓慢,无法满足部分用户的需求。
技术实现要素:
5.有鉴于此,本发明实施例的目的在于提出一种对象存储的数据迁移的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够实现多线程分别处理不同的桶分片上的对象,能够显著提高数据迁移的性能和效率。
6.基于上述目的,本发明的实施例的一个方面提供了一种对象存储的数据迁移的方法,包括以下步骤:
7.响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;
8.在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;
9.响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;
10.响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。
11.根据本发明的一个实施例,响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程包括:
12.根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。
13.根据本发明的一个实施例,还包括:
14.响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。
15.根据本发明的一个实施例,还包括:
16.响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。
17.本发明的实施例的另一个方面,还提供了一种对象存储的数据迁移的装置,装置包括:
18.创建模块,创建模块配置为响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;
19.遍历模块,遍历模块配置为在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;
20.添加模块,添加模块配置为响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;
21.分配模块,分配模块配置为响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。
22.根据本发明的一个实施例,创建模块还配置为:
23.根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。
24.根据本发明的一个实施例,还包括更改模块,更改模块配置为:
25.响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。
26.根据本发明的一个实施例,还包括更改模块,更改模块配置为:
27.响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。
28.本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
29.至少一个处理器;以及
30.存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
31.本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
32.本发明具有以下有益技术效果:本发明实施例提供的对象存储的数据迁移的方法,通过响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移的技术方案,能够实现多线程分别处理不同的桶分片上的对象,能够显著提高数据迁移的性能和效率。
附图说明
33.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
34.图1为根据本发明一个实施例的对象存储的数据迁移的方法的示意性流程图;
35.图2为根据本发明一个实施例的对象存储的数据迁移的装置的示意图;
36.图3为根据本发明一个实施例的计算机设备的示意图;
37.图4为根据本发明一个实施例的计算机可读存储介质的示意图。
具体实施方式
38.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
39.基于上述目的,本发明的实施例的第一个方面,提出了一种对象存储的数据迁移的方法的一个实施例。图1示出的是该方法的示意性流程图。
40.如图1中所示,该方法可以包括以下步骤:
41.s1响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程。
42.当接收到数据迁移的指令时,获取迁移目标集群的ip地址和端口信息,然后根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,链接创建成功后创建数据迁移线程。
43.s2在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态。
44.通过桶分片遍历的方式读取源端桶目录下所有文件,执行迁移准备时以桶分片为粒度,添加桶分片迁移状态,该状态信息保存在索引池的桶分片上,桶分片的状态分为未执行状态和执行中以及无状态。
45.s3响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中。
46.找到对象存储中待迁移的桶中的状态为未迁移的全部桶分片,将这些桶分片的信息添加到迁移表中。
47.s4响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。
48.在全部桶分片遍历完成后,为迁移表中的每个桶分片分配一个线程进行迁移,桶分片默认为128个,因此可以实现128个线程同时进行128个桶分片的数据迁移。
49.通过本发明的技术方案,能够实现多线程分别处理不同的桶分片上的对象,能够显著提高数据迁移的性能和效率。
50.在本发明的一个优选实施例中,响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程包括:
51.根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。
52.在本发明的一个优选实施例中,还包括:
53.响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。如果桶分片迁移状态为执行中,那么其他线程则无法操作该桶分片,也就是说在为桶分片分配迁移线程时,只能为状态为未迁移的桶分片分配线程,分配了线程的桶分片状态为执行中,因此不能够分配第二个线程,从而保证了不同线程无法操作相同的对象。
54.在本发明的一个优选实施例中,还包括:
55.响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。在数据迁移完成后,将桶分片的状态更改为未执行的状态以便于下一次数据迁移。
56.本发明的技术方案通过加入更细粒度的桶分片,以桶分片为粒度,通过查看桶分片迁移遍历状态,借助桶分片实现多线程分别处理不同的桶分片上的对象,实现单个桶多线程迁移桶内对象,保证了不同线程处理对象的隔离性,从而显著提高迁移单个桶时的性能和效率。
57.需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(read-only memory,rom)或随机存取存储器(random access memory,ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
58.此外,根据本发明实施例公开的方法还可以被实现为由cpu执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu执行时,执行本发明实施例公开的方法中限定的上述功能。
59.基于上述目的,本发明的实施例的第二个方面,提出了一种对象存储的数据迁移的装置,如图2所示,装置200包括:
60.创建模块,创建模块配置为响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;
61.遍历模块,遍历模块配置为在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;
62.添加模块,添加模块配置为响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;
63.分配模块,分配模块配置为响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。
64.在本发明的一个优选实施例中,创建模块还配置为:
65.根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。
66.在本发明的一个优选实施例中,还包括更改模块,更改模块配置为:
67.响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。
68.在本发明的一个优选实施例中,还包括更改模块,更改模块配置为:
69.响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。
70.基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例包括如下装置:至少一个处理器21;以及存储器22,存储器22存储有可在处理器上运行的计算机指令23,指令由处理器执行时实现以下方法:
71.响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;
72.在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;
73.响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;
74.响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以
进行数据迁移。
75.在本发明的一个优选实施例中,响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程包括:
76.根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。
77.在本发明的一个优选实施例中,还包括:
78.响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。
79.在本发明的一个优选实施例中,还包括:
80.响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。
81.基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质31存储有被处理器执行时执行如下方法的计算机程序32:
82.响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;
83.在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;
84.响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;
85.响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。
86.在本发明的一个优选实施例中,响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程包括:
87.根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。
88.在本发明的一个优选实施例中,还包括:
89.响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。
90.在本发明的一个优选实施例中,还包括:
91.响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。
92.此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
93.此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
94.本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
95.在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或
通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
96.以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
97.应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
98.上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
99.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
100.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
技术特征:
1.一种对象存储的数据迁移的方法,其特征在于,包括以下步骤:响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;响应于全部桶分片遍历完成,为所述迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。2.根据权利要求1所述的方法,其特征在于,响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程包括:根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。3.根据权利要求1所述的方法,其特征在于,还包括:响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。4.根据权利要求1所述的方法,其特征在于,还包括:响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。5.一种对象存储的数据迁移的装置,其特征在于,所述装置包括:创建模块,所述创建模块配置为响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;遍历模块,所述遍历模块配置为在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;添加模块,所述添加模块配置为响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;分配模块,所述分配模块配置为响应于全部桶分片遍历完成,为所述迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。6.根据权利要求5所述的装置,其特征在于,所述创建模块还配置为:根据待迁移数据所在的集群ip和端口以及目标集群ip和端口创建链接,并创建数据迁移线程。7.根据权利要求5所述的装置,其特征在于,还包括更改模块,所述更改模块配置为:响应于全部桶分数据迁移完成,将全部桶分片的状态更改为未执行状态。8.根据权利要求5所述的装置,其特征在于,还包括更改模块,所述更改模块配置为:响应于桶分片开始进行数据迁移,将桶分片的状态更改为执行中。9.一种计算机设备,其特征在于,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-4任意一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。
技术总结
本发明提供了一种对象存储的数据迁移的方法、装置、设备及可读介质,该方法包括:响应于接收到数据迁移的指令,在待迁移集群和目标集群之间创建迁移线程;在待迁移数据所在的对象存储中遍历待迁移的桶分片的状态;响应于待迁移数据所在的对象存储中待迁移的桶分片的状态为未执行状态,将状态为未执行的桶分片的信息添加到迁移表中;响应于全部桶分片遍历完成,为迁移表中的每个桶分片各自分配一个迁移线程以进行数据迁移。通过使用本发明的方案,能够实现多线程分别处理不同的桶分片上的对象,能够显著提高数据迁移的性能和效率。能够显著提高数据迁移的性能和效率。能够显著提高数据迁移的性能和效率。
技术研发人员:刘超 程晓煜
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2022.01.29
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-25037.html