1.本发明涉及一种基因编辑的方法,具体涉及采用新研发的cas载体优化crispr/cas9基因编辑方法,对猪进行基因编辑。
背景技术:
2.转基因技术目前已被广泛用于生物生产、药物筛选和治疗等多个方面,但通常采用的病毒转染或转座子系统会导致随机和多拷贝插入,导致转基因表达的不稳定,并可能干扰内源基因的表达,且不可能达到纯合插入,导致外源基因较难稳定地遗传。
3.将外源基因插入基因组的特定位点需要采用基因编辑技术,该技术是近年来发展的一种生物技术,其包括从基于同源重组的基因敲入到基于核酸酶的zfn、talen、crispr/cas9等编辑手段,其中crispr/cas9技术是当前最先进的基因编辑技术。目前,基因编辑技术被越来越多地应用到动植物及微生物的转基因中。
4.将外源基因稳定整合到基因组的安全港位点是目前较好的解决方案。例如,专利cn111088282a公开了aavs1、h11安全港位点在重组表达蛋白中的应用,即利用人基因组上的aavs1、h11位点作为整合位点高表达重组人血白蛋白,并且以人肝细胞直接作为表达细胞,得到的人血清白蛋白更加安全,大大降低了其安全性风险,但是该专利并没有完全公开安全位点的具体位置,同时,基于人与猪基因组序列的差异性比较大,是否可以将此安全位点直接用于猪,以及如何用于猪的基因编辑现有技术仍然无法确定。
技术实现要素:
5.为解决上述问题,本发明以猪为研究对象,获得特定靶向猪基因组不同安全港位点的sgrna,揭示适合外源基因表达的最佳安全位点靶向序列,同时,创造性的获得了优化的携带编码cas蛋白核苷酸序列的cas载体,显著提高了基因编辑效率,更重要的是可以稳定遗传,为基于猪基因组的研究如构建转基因猪模式动物奠定基础。
6.本发明的第一方面,提供了一种基因编辑的方法,所述的方法包括将包含外源基因的安全港位点载体、sgrna载体和cas载体共转染至宿主细胞。
7.所述的cas载体包含编码cas蛋白、egfp和puro蛋白的核苷酸序列。优选的,所述的cas载体还包含ef1a启动子、wpre元件和3’ltr序列元件。进一步优选的,所述的cas载体的核苷酸序列从5
’-3’
依次为:cmv增强子、ef1a启动子、核定位信号nls(优选为sv40nls)、核定位信号nls(优选为sv40 nls)、编码cas蛋白的核苷酸序列、核定位信号nls(优选为nucleoplasmin nls),核定位信号nls(优选为nucleoplasmin nls)、编码自剪切多肽p2a(自剪切多肽p2a的氨基酸序列为“atnfsllkqagdveenpgp”,发生自剪切的断裂位置为c端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码egfp的核苷酸序列、编码自裂解多肽t2a(自裂解多肽t2a的氨基酸序列为“egrgslltcgdveenpgp”,发生自裂解的断裂位置为c端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码puro蛋白的核苷酸序列、wpre序列元件、3’ltr序列元件和poly a信号序列元件(即bgh poly(a)
signal序列元件)。
8.优选的,所述的cas蛋白选自cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t,cas5h,cas5a、cas6、cas7、cas8、cas9、cas10、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx1o、csx16、csax、csx3、csx1、csx1s、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、c2c1、c2c2、c2c3、cpf1、carf、ding、其同源物或其修饰形式。
9.在本发明的一个具体实施方式中,所述的cas蛋白为cas9蛋白。
10.在本发明的一个具体实施方式中,所述的cas载体的核苷酸序列如seq id no:2所示。
11.所述的方法包括将包含外源基因的安全港位点载体、sgrna载体和cas载体共转染至宿主细胞中,使安全港位点载体上的外源基因分别整合入rosa26、aavs1、h11或col1a1任一个或两个以上安全港位点。
12.例如,可以将包含外源基因的rosa26安全港位点载体、sgrna载体和cas载体共转染至宿主细胞中,使rosa26安全港位点载体上的外源基因整合入rosa26安全港位点。或者将包含外源基因的aavs1安全港位点载体、sgrna载体和cas载体共转染至宿主细胞中,使aavs1安全港位点载体上的外源基因整合入aavs1安全港位点。或者将包含外源基因的h11安全港位点载体、sgrna载体和cas载体共转染至宿主细胞中,使h11安全港位点载体上的外源基因整合入h11安全港位点。或者将包含外源基因的col1a1安全港位点载体、sgrna载体和cas载体共转染至宿主细胞中,使col1a1安全港位点载体上的外源基因整合入col1a1安全港位点。
13.其中,外源基因可以代表一个单独的基因、两个基因的拼接或者具有某种功能的核苷酸片段。
14.当然,也可以按照上述描述将两个或其以上相同或者不同的外源基因同时分别整合入不同的安全港位点。
15.优选的,rosa26安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:8所示,aavs1安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:9所示,h11安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:10所示,col1a1安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:11所示。
16.所述的sgrna载体包含靶向rosa26、aavs1、h11或col1a1安全港位点的sgrna。优选的,靶向rosa26的sgrna的核苷酸序列如seq id no:45-48任一所示,靶向aavs1的sgrna的核苷酸序列如seq id no:49-52任一所示,靶向h11的sgrna的核苷酸序列如seq id no:53-56任一所示,靶向col1a1的sgrna的核苷酸序列如seq id no:57-60任一所示。
17.所述的安全港位点载体包含与rosa26、aavs1、h11或col1a1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、ef-1d启动子,编码egfp蛋白的核苷酸序列,ef-1d poly(a)信号序列,pgk启动子,编码mcherry蛋白的核苷酸序列,bgh poly(a)信号序列,loxp-puro-loxp表达框区域,pcag启动子,和/或β-globin poly(a)信号序列。进一步优选的,rosa26安全港位点载体如seq id no:4所示,aavs1安全港位点载体如seq id no:5所示,h11安全港位点载体如seq id no:6所示,col1a1安全港位
点载体如seq id no:7所示。
18.优选的,所述的安全港位点载体、sgrna载体或cas载体均为环状质粒。
19.优选的,所述的外源基因的核苷酸序列位于安全港位点5’同源臂与3’同源臂之间。其中,所述的外源基因可以为任何欲导入宿主细胞进行表达的基因,包括但不限于rag1、绿色荧光蛋白(gfp)、红色荧光蛋白dsred及其变体突变体mbanana、morange、dtomato、mtangerine、mstrawberry和mcherry,蓝色荧光蛋白(bfp)及其变体azurite、橙色荧光蛋白及其变体mcitrine、mvenus、topaz、ypet,黄色荧光蛋白(yfp)、青色荧光蛋白(cfp)等等。
20.所述的宿主细胞来源于非人动物或人,所述的非人动物选自猪、狗、牛、羊、猴或小鼠。优选的,所述的宿主细胞来源于猪,进一步优选为猪的成纤维细胞。
21.优选的,所述的宿主细胞还可以选自胚胎干细胞、成体干细胞、造血干细胞、骨髓间充质干细胞、神经干细胞、肝干细胞、肌肉卫星细胞、皮肤表皮干细胞、肠上皮干细胞、视网膜干细胞、胰腺干细胞、体细胞、成纤维细胞、肌细胞、胶质细胞、脂肪细胞或生殖细胞等等。
22.本发明的第二方面,提供了一种cas载体,所述的cas载体包含编码cas蛋白、egfp和puro蛋白的核苷酸序列。
23.优选的,所述的cas载体还包含ef1a启动子、wpre元件和3’ltr序列元件。进一步优选的,所述的cas载体的核苷酸序列从5
’-3’
依次为:cmv增强子、ef1a启动子、核定位信号nls(优选为sv40 nls)、核定位信号nls(优选为sv40 nls)、编码cas蛋白的核苷酸序列、核定位信号nls(优选为nucleoplasmin nls),核定位信号nls(优选为nucleoplasmin nls)、编码自剪切多肽p2a(自剪切多肽p2a的氨基酸序列为“atnfsllkqagdveenpgp”,发生自剪切的断裂位置为c端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码egfp的核苷酸序列、编码自裂解多肽t2a(自裂解多肽t2a的氨基酸序列为“egrgslltcgdveenpgp”,发生自裂解的断裂位置为c端开始第一个氨基酸残基和第二个氨基酸残基之间)的核苷酸序列、编码puro蛋白的核苷酸序列、wpre序列元件、3’ltr序列元件和poly a信号序列元件(即bgh poly(a)signal序列元件)。
24.优选的,所述的cas蛋白选自cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t,cas5h,cas5a、cas6、cas7、cas8、cas9、cas10、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、c2c1、c2c2、c2c3、cpf1、carf、ding、其同源物或其修饰形式。
25.在本发明的一个具体实施方式中,所述的cas蛋白为cas9蛋白。
26.在本发明的一个具体实施方式中,所述的cas载体的核苷酸序列如seq id no:2所示。
27.优选的,所述的cas载体为环状质粒。
28.本发明的第三方面,提供了一种靶向rosa26的sgrna,所述的靶向rosa26的sgrna的核苷酸序列如seq id no:45-48任一所示。
29.本发明的第四方面,提供了一种靶向aavs1的sgrna,所述的靶向aavs1的sgrna的
id no:85)/sh2-r-r(seq id no:86)进行aavs1安全港位点切点右侧基因组序列的pcr扩增。然后,选择8只猪中序列保守的区域进一步分别采用引物对sh2-lr-f(seq id no:87)/sh2-lr-r(seq id no:88)和sh2-rr-f(seq id no:89)/sh2-rr-r(seq id no:90)进行aavs1安全港位点切点左侧和右侧基因组同源序列的扩增。
44.本发明的第十一方面,提供了一种h11安全港位点载体,所述的h11安全港位点载体包含与h11安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、ef-1α启动子,编码egfp蛋白的核苷酸序列,ef-1α poly(a)信号序列,pgk启动子,编码mcherry蛋白的核苷酸序列,bgh poly(a)信号序列,loxp-puro-loxp表达框区域,pca6启动子,和/或β-globin poly(a)信号序列。进一步优选的,h11安全港位点载体如seq id no:6所示。
45.所述的h11安全港位点载体采用引物对sh3-l-f(seq id no:95)/sh3-l-r(seq id no:96)进行h11安全港位点切点左侧基因组序列的pcr扩增,采用引物对sh3-r-f(seq id no:97)/sh3-r-r(seq id no:98)进行h11安全港位点切点右侧基因组序列的pcr扩增。然后,选择8只猪中序列保守的区域进一步分别采用引物对sh3-lr-f(seq id no:99)/sh3-lr-r(seq id no:100)和sh3-rr-f(seq id no:101)/sh3-rr-r(seq id no:102)进行h11安全港位点切点左侧和右侧基因组同源序列的扩增。
46.本发明的第十二方面,提供了一种col1a1安全港位点载体,所述的col1a1安全港位点载体包含与col1a1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂。优选的,还包含绝缘子区域、ef-1d启动子,编码egfp蛋白的核苷酸序列,ef-1d poly(a)信号序列,pgk启动子,编码mcherry蛋白的核苷酸序列,bgh poly(a)信号序列,loxp-puro-loxp表达框区域,pcag启动子,和/或β-globin poly(a)信号序列。进一步优选的,col1a1安全港位点载体如seq id no:7所示。
47.所述的col1a1安全港位点载体采用引物对sh4-l-f(seq id no:107)/sh4-l-r(seq id no:108)进行col1a1安全港位点切点左侧基因组序列的pcr扩增,采用引物对sh4-r-f(seq id no:109)/sh4-r-r(seq id no:110)进行col1a1安全港位点切点右侧基因组序列的pcr扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对sh4-lr-f(seq id no:111)/sh4-lr-r(seq id no:112)和sh4-rr-f(seq id no:113)/sh4-rr-r(seq id no:114)进行h1安全港位点切点左侧和右侧基因组同源序列的扩增。
48.本发明的第十三方面,提供了一种基因编辑的试剂盒,所述的试剂盒中包含上述的cas载体、上述的sgrna、上述的sgrna载体和/或上述rosa26、aavs1、h11或col1a1安全港位点载体。
49.本发明所述的sgrna载体可以转录成grna与cas蛋白结合为复合物,靶向结合猪基因组特定区域,引起预期的dna切割,从而对猪基因组进行编辑。
50.术语“安全港位点”是染色体的一部分,当供体基因被整合进其中时,不会对宿主细胞或生物体产生不利影响,被用于基因安全敲入并能保证转入基因的正常稳定表达。参见sadelain等人(2012)nat.rev.cancer 12:51-58。
51.术语“载体”是细胞内能够在自身控制下复制的多核苷酸,或者通过插入到宿主细胞染色体进行复制和/或表达的遗传元件,例如质粒、染色体、病毒、转座子。合适的载体包
括但不限于质粒、转座子、细菌噬菌体和粘粒。
52.本发明所述的“grna”,也称指导rna,是由sgrna载体在细胞中转录得到的,对细胞中的靶序列具有特异性并且可与cas蛋白形成复合体的rna。
附图说明
53.图1为质粒px330的结构示意图。
54.图2为质粒pkg-ge3的结构示意图。
55.图3为质粒pkg-u6grna的结构示意图。
56.图4为将20bp左右的dna分子(用于转录形成grna的靶序列结合区)插入质粒pkg-u6grna的示意图。
57.图5为rosa26位点重组donor质粒的结构示意图。
58.图6为aavs1位点重组donor质粒的结构示意图。
59.图7为h11位点重组donor质粒的结构示意图。
60.图8为colia1位点重组donor质粒的结构示意图。
61.图9a为实施例2中单grna质粒与cas9质粒不同摩尔比的测序峰图。
62.图9b为实施例2中质粒pkg-ge3(rag1-kg)与质粒px330(rag1-330)进行基因编辑的测序峰图。
63.图10为实施例3中以8只猪的基因组dna为模板采用rosa26-f195/rosa26-r1092组成的引物对进行pcr扩增后的电泳图。
64.图11为实施例3中各种具有粘性末端的双链dna分子,其中a对应rosa26-g1s和rosa26-g1a,b对应rosa26-g2s和rosa26-g2a,c对应rosa26-g3s和rosa26-g3a,d对应rosa26-g4s和rosa26-g4a。
65.图12为实施例4中以8只猪的基因组dna为模板采用aavs1-f101/aavs1-r1088组成的引物对进行pcr扩增后的电泳图。
66.图13为实施例4中各种具有粘性末端的双链dna分子,其中,a对应aavs1-g1s和aavs1-g1a,b对应aavs1-g2s和aavs1-g2a,c对应aavs1-g3s和aavs1-g3a,d对应aavs1-g4s和aavs1-g4a。
67.图14为实施例5中以8只猪的基因组dna为模板采用h11-f3/h11-r843组成的引物对进行pcr扩增后的电泳图。
68.图15为实施例5中各种具有粘性末端的双链dna分子,其中,a对应h11-g1s和h11-g1a,b对应h11-g2s和h11-g2a,c对应h11-g3s和h11-g3a,d对应h11-g4s和h11-g4a。
69.图16为实施例6中以8只猪的基因组dna为模板采用col1a1-f157/col1a1-r1084组成的引物对进行pcr扩增后的电泳图。
70.图17为实施例6中各种具有粘性末端的双链dna分子,其中,a对应col1a1-g1s和col1a1-g1a,b对应col1a1-g2s和col1a1-g2a,c对应col1a1-g3s和col1a1-g3a,d对应col1a1-g4s和col1a1-g4a。
71.图18为实施例3中采用rosa26-f477和rosa26-r899组成的引物对进行pcr扩增,然后进行测序确定不同靶点编辑效率的测序峰图。
72.图19为实施例4中采用aavs1-f378和aavs1-r749组成的引物对进行pcr扩增,然后
h11,简称h11质粒。h11质粒的结构示意图见图7。
89.制备质粒pb-1g 2r 3-puro-col1a1,如seq id no:7所示,质粒pb-1g 2r 3-puro-col1a1,简称col1a1质粒。sh4质粒的结构示意图见图8。
90.质粒px330、质粒pkg-ge3、质粒pkg-u6grna、质粒rosa26、质粒aavs1、质粒h11、质粒col1a1均为环形质粒。
91.质粒px330的结构示意图见图1。seq id no:1中,第440-725位核苷酸组成cmv增强子,第727-1208位核苷酸组成chickenβ-actin启动子,第1304-1324位核苷酸编码sv40核定位信号(nls),第1325-5449位核苷酸编码cas9蛋白,第5450-5497位核苷酸编码nucleoplasmin核定位信号(nls)。
92.质粒pkg-ge3的结构示意图见图2。seq id no:2中,第395-680位核苷酸组成cmv增强子,第682-890位核苷酸组成ef1a启动子,第986-1006位核苷酸编码核定位信号(nls),第1016-1036位核苷酸编码核定位信号(nls),第1037-5161位核苷酸编码cas9蛋白,第5162-5209位核苷酸编码核定位信号(nls),第5219-5266位核苷酸编码核定位信号(nls),第5276-5332位核苷酸编码自剪切多肽p2a(自剪切多肽p2a的氨基酸序列为“atnfsllkqagdveenpgp”,发生自剪切的断裂位置为c端开始第一个氨基酸残基和第二个氨基酸残基之间),第5333-6046位核苷酸编码egfp蛋白,第6056-6109位核苷酸编码自裂解多肽t2a(自裂解多肽t2a的氨基酸序列为“egrgslltcgdveenpgp”,发生自裂解的断裂位置为c端开始第一个氨基酸残基和第二个氨基酸残基之间),第6110-6703位核苷酸编码puromycin蛋白(简称puro蛋白),第6722-7310位核苷酸组成wpre序列元件,第7382-7615位核苷酸组成3’ltr序列元件,第7647-7871位核苷酸组成bgh poly(a)signal序列元件。seq id no:2中,第911-6706形成融合基因,表达融合蛋白。由于自剪切多肽p2a和自裂解多肽t2a的存在,融合蛋白自发形成如下三个蛋白:具有cas9蛋白的蛋白、具有egfp蛋白的蛋白和具有puro蛋白的蛋白。
93.与质粒px330相比,质粒pkg-ge3主要进行了如下改造:
①
去除残留的grna骨架序列(gttttagagctagaaatagcaagttaaaataaggctagtccgtttt),降低干扰;
②
将原有chickenβ-actin启动子改造为具更高表达活性的ef1a启动子,增加cas9基因的蛋白表达能力;
③
在cas9基因的上游和下游均增加核定位信号编码基因(nls),增加cas9蛋白的核定位能力;
④
原质粒无任何真核细胞筛选标记,不利于阳性转化细胞的筛选和富集,依次在cas9基因的下游插入p2a-egfp-t2a-puro编码基因,赋予载体荧光和真核细胞抗性筛选能力;
⑤
插入wpre元件和3’ltr序列元件,增强cas9基因的蛋白翻译能力。
94.质粒pkg-u6grna的结构示意图见图3。seq id no:3中,第2280-2539位核苷酸组成hu6启动子,第2558-2637位核苷酸用于转录形成grna骨架。使用时,将20bp左右的dna分子(用于转录形成grna的靶序列结合区)插入质粒pkg-u6grna,形成重组质粒,示意图见图4,在细胞中重组质粒转录得到grna。
95.seq id no:4中,第1-345位核苷酸组成rosa26安全港位点左侧猪基因组区域(sh1左臂),第9184-10195位核苷酸组成rosa26安全港位点右侧猪基因组区域(sh1右臂),第346-546、3132-3531、6506-6707、8975-9175位核苷酸分别组成4个不同的绝缘子区域,第1954-3131位核苷酸组成ef-1d启动子,第1216-1935位核苷酸编码egfp蛋白,第637-1209位核苷酸组成ef-1α poly(a)信号,第3543-4042位核苷酸组成pgk启动子,第4059-5769位核
苷酸编码mcherry蛋白,第4791-5015位核苷酸组成bgh poly(a)信号,第5054-6504位核苷酸为loxp-puro-loxp表达框区域,第7259-8974位核苷酸组成pcag启动子,第6969-7233位核苷酸组成β-globin poly(a)信号。
96.seq id no:5中,第1-1081位核苷酸组成aavs1安全港位点左侧猪基因组区域(sh2左臂),第9920-10179位核苷酸组成aavs1安全港位点右侧猪基因组区域(sh2右臂),第1082-1282、3868-4267、7242-7442、9711-9911位核苷酸分别组成4个不同的绝缘子区域,第1373-1945位核苷酸组成ef-1d启动子,第1952-2671位核苷酸编码egfp蛋白,第2690-3867位核苷酸组成ef-1α poly(a)信号,第4279-4778位核苷酸组成pgk启动子,第4795-5502位核苷酸编码mcherry蛋白,第5527-5751位核苷酸组成bgh poly(a)信号,第5790-7240位核苷酸为loxp-puro-loxp表达框区域,第7995-9710位核苷酸组成pcag启动子,第7705-7969位核苷酸组成β-globin poly(a)信号。
97.seq id no:6中,第1-555位核苷酸组成h11安全港位点左侧猪基因组区域(sh3左臂),第9394-10402位核苷酸组成h11安全港位点右侧猪基因组区域(sh3右臂),第556-756、3342-3741、6716-6916、9185-9385位核苷酸分别组成4个不同的绝缘子区域,第2164-3341位核苷酸组成ef-1α启动子,第1426-2145位核苷酸编码egfp蛋白,第847-1419位核苷酸组成ef-1d poly(a)信号,第3753-4252位核苷酸组成pgk启动子,第4269-4979位核苷酸编码mcherry蛋白,第5001-5225位核苷酸组成bgh poly(a)信号,第5264-6714位核苷酸为loxp-puro-loxp表达框区域,第7469-9184位核苷酸组成pca6启动子,第7179-7443位核苷酸组成β-globin poly(a)信号。
98.seq id no:7中,第1-886位核苷酸组成col1a1安全港位点左侧猪基因组区域(sh4左臂),第9725-10451位核苷酸组成col1a1安全港位点右侧猪基因组区域(sh4右臂),第887-1087、3673-4072、7047-7247、9516-9716位核苷酸分别组成4个不同的绝缘子区域,第2495-3672位核苷酸组成ef-1d启动子,第1757-2476位核苷酸编码egfp蛋白,第1178-1750位核苷酸组成ef-1d poly(a)信号,第4084-4583位核苷酸组成pgk启动子,第4600-5310位核苷酸编码mcherry蛋白,第5332
--
5556位核苷酸组成bgh poly(a)信号,第5595-7045位核苷酸为loxp-puro-loxp表达框区域,第7800-9515位核苷酸组成pca6启动子,第7510-7774位核苷酸组成β-globin poly(a)信号。
99.实施例2:质粒px330和质粒pkg-ge3的效果比较
100.选择位于rag1基因的高效grna靶点:
101.rag1-grna4的靶点:5
’-
agttatggcagaactcagtg-3’(seq id no:61)。
102.用于扩增包含靶点的片段的引物为:
103.rag1-nf126:5
’-
ccccatccaaagtttttaaagga-3’(seq id no:62);
104.rag1-nr525:5
’-
tgtggcagatgtcacagtttagg-3’(seq id no:63)。
105.一、制备重组质粒
106.取质粒pkg-u6grna,用限制性内切酶bbsi进行酶切,回收载体骨架(约3kb的线性大片段)。
107.分别合成rag1-4s和rag1-4a,然后混合并进行退火,得到具有粘性末端的双链dna分子。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(rag1-4)。
108.rag1-4s:5
’-
caccgagttatggcagaactcagtg-3’(seq id no:64);
109.rag1-4a:5
’-
aaaccactgagttctgccataactc-3’(seq id no:65)。
110.二、质粒配比优化
111.1、组别
112.第一组:将质粒pkg-u6grna(rag1-4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.44μg质粒pkg-u6grna(rag1-4):1.56μg质粒pkg-ge3。即质粒pkg-u6grna(rag1-4)和质粒pkg-ge3的摩尔配比为:1∶1。
113.第二组:将质粒pkg-u6grna(rag1-4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.72μg质粒pkg-u6grna(rag1-4):1.28μg质粒pkg-ge3。即质粒pkg-u6grna(rag1-4)和质粒pkg-ge3的摩尔配比为:2∶1。
114.第三组:将质粒pkg-u6grna(rag1-4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rag1-4):1.08μg质粒pkg-ge3。即质粒pkg-u6grna(rag1-4)和质粒pkg-ge3的摩尔配比为:3∶1。
115.第四组:将质粒pkg-u6grna(rag1-4)转染致猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:1μg质粒pkg-u6grna(rag1-4)。
116.共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(neon kit,thermofisher)与neon tm transfection system电转仪(参数设置为:1450v、10ms、3pulse)。
117.2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
118.3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组dna,采用rag1-nf126和rag1-nr525组成的引物对进行pcr扩增,然后进行电泳。
119.电泳后回收目的条带并进行测序,测序结果见图9a。
120.通过利用synthegoice工具分析测序峰图得出不同靶点的编辑效率。第一组至第四组的编辑效率依次为9%、53%、66%和0%。结果表明,第三组编辑效率最高,确定单grna质粒与cas9质粒最适用量为摩尔比3∶1,质粒实际用量为0.92μg∶1.08μg。
121.三、质粒px330和质粒pkg-ge3的效果比较
122.1、共转染
123.rag1-b组:将质粒pkg-u6grna(rag1-4)转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rag1-4)。
124.rag1-330组:将质粒pkg-u6grna(rag1-4)和质粒px330共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rag1-grna4):1.08μg质粒px330。
125.rag1-kg组:将质粒pkg-u6grna(rag1-4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rag1-4):1.08μg质粒pkg-ge3。
126.共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(neon kit,thermofisher)与neon tm transfection system电转仪(参数设置为:1450v、10ms、3pulse)。
127.2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行
u6grna(rosa26-g2)。质粒pkg-u6grna(rosa26-g2)表达seq id no:116所示的sgrna
rosa26-g2
。
150.seq id no:116:
[0151][0152]
分别合成rosa26-g3s和rosa26-g3a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图11c)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(rosa26-g3)。质粒pkg-u6grna(rosa26-g3)表达seq id no:117所示的sgrna
rosa26-g3
。
[0153]
seq id no:117:
[0154][0155]
分别合成rosa26-g4s和rosa26-g4a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图11d)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(rosa26-g4)。质粒pkg-u6grna(rosa26-g4)表达seq id no:118所示的sgrna
rosa26-g4
。
[0156]
seq id no:118:
[0157][0158]
sgrna-rosa26-1s:5
’-
caccgccaagaatcaggttaagcca-3’;seq id no:13
[0159]
sgrna-rosa26-1a:5
’-
aaactggcttaacctgattcttggc-3’。seq id no:14
[0160]
sgrna-rosa26-2s:5
’-
caccgcgagaaggagcaaactgaca-3’;seq id no:15
[0161]
sgrna-rosa26-2a:5
’-
aaactgtcagtttgctccttctcgc-3’。seq id no:16
[0162]
sgrna-rosa26-3s:5
’-
caccgaaggagcaaactgacatgg-3’;seq id no:17
[0163]
sgrna-rosa26-3a:5
’-
aaacccatgtcagtttgctccttc-3’。seq id no:18
[0164]
sgrna-rosa26-4s:5
’-
caccgcaggacaacgcccaagaatc-3’;seq id no:19
[0165]
sgrna-rosa26-4a:5
’-
aaacgattcttgggcgttgtcctgc-3’。seq id no:20
[0166]
sgrna-rosa26-1s、sgrna-rosa26-1a、sgrna-rosa26-2s、sgrna-rosa26-2a、sgrna-rosa26-3s、sgrna-rosa26-3a、sgrna-rosa26-4s、sgrna-rosa26-4a均为单链dna分子。
[0167]
四、不同靶点的编辑效率比较
[0168]
1、共转染
[0169]
第一组:将质粒pkg-u6grna(rosa26-g1)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rosa26-g1):1.08μg质粒pkg-ge3。
[0170]
第二组:将质粒pkg-u6grna(rosa26-g2)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rosa26-g2):1.08μg质粒pkg-ge3。
[0171]
第三组:将质粒pkg-u6grna(rosa26-g3)和质粒pkg-ge3共转染猪原代成纤维细
胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rosa26-g3):1.08μg质粒pkg-ge3。
[0172]
第四组:将质粒pkg-u6grna(rosa26-g4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(rosa26-g4):1.08μg质粒pkg-ge3。
[0173]
第五组:猪原代成纤维细胞,未进行任何转染操作。
[0174]
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(neon kit,thermofisher)与neon tm transfection system电转仪(参数设置为:1450v、10ms、3pulse)。
[0175]
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
[0176]
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组dna,采用rosa26-f477和rosa26-r899组成的引物对进行pcr扩增,然后进行电泳并测序,结果见图18。
[0177]
通过利用synthegoice工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为35%、3%、38%、14%和0%。结果表明,第三组编辑效率最高,sgrna
rosa26-g3
为最优靶点。
[0178]
五、高效靶点两侧基因组区域同源臂序列扩增
[0179]
分别以8只猪的基因组dna为模板,采用引物对sh1-l-f/sh1-l-r进行rosa26安全港位点切点左侧基因组序列的pcr扩增,采用引物对sh1-r-f/sh1-r-r进行rosa26安全港位点切点右侧基因组序列的pcr扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对sh1-lr-f/sh1-lr-r和sh1-rr-f/sh1-rr-r进行rosa26安全港位点切点左侧和右侧基因组同源序列的扩增。
[0180]
sh1-l-f:5
’-
gactcatttcccatctccacccc-3’;seq id no:70
[0181]
sh1-l-r:5
’-
atgggtgcttgaggtggtctgac-3’;seq id no:71
[0182]
sh1-r-f:5
’-
gggtaaggactatggagggtagc-3’;seq id no:72
[0183]
sh1-r-r∶5
’-
tctctgctgcctccttttcctaa-3’;seq id no:73
[0184]
sh1-lr-f:5
’-
tcttgttatagatatcggcgcgccctctacctgctctcggacccgtggg-3’;seq id no:75
[0185]
sh1-lr-r:5
’-
ccaggcccgggtctggggcgcgccagggcaaaagaatcccgcccataatcg-3’;seq id no:76
[0186]
sh1-rr-f:5
’-
agccattgtacgcgttgcttaacctgattcttgggcgttgtcctg-3’;seq id no:77
[0187]
sh1-rr-r:5
’-
cttttatggcggccgcataagtactttttgtaggcatgtgtggaaaattg-3’。seq id no:78
[0188]
实施例4:aavs1安全港位点猪基因组区域定位及aavs1的高效切割靶点筛选
[0189]
一、猪aavs1安全港位点信息:通过将人的aavs1安全港位点序列与猪全基因组序列进行比对,将猪的aavs1安全港位点区域定位在猪6号染色体ppp1r12c基因内,该区域及其上下游500bp序列如seq id no:9所示。
[0190]
分别以8只猪的基因组dna为模板,采用引物aavs1-f101/aavs1-r1088组成的引物
对进行pcr扩增,然后进行电泳,见图12。回收pcr扩增产物并进行测序,将测序结果与公共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:aavs1-f378/aavs1-r749。
[0191]
aavs1-f101:5
’-
ctgtaggctctctcttggggatg-3’;seq id no:79
[0192]
aavs1-r1088:5
’-
agccgattaagaccccagcatag-3’;seq id no:80
[0193]
aavs1-f378:5
’-
tgctaggtcctctctctccacaa-3’;seq id no:81
[0194]
aavs1-r749:5
’-
ctcttcaggcatcctccccattc-3’。seq id no:82
[0195]
二、筛选靶点
[0196]
通过筛选ngg(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
[0197]
4个靶点分别如下:
[0198]
sgrna
aavs1-g1
靶点:5
’-
aagacccactgcagccaggc-3’;seq id no:49
[0199]
sgrna
aavs1-g2
靶点:5
’-
gaggagtagaggctcttctg-3’;seq id no:50
[0200]
sgrna
aavs1-g3
靶点:5
’-
cccaaagacccactgcagcc-3’;seq id no:51
[0201]
sgrna
aavs1-g4
靶点:5
’-
tgcagtgggtctttggggac-3’。seq id no:52
[0202]
三、制备重组质粒
[0203]
取质粒pkg-u6grna,用限制性内切酶bbsi进行酶切,回收载体骨架(约3kb的线性大片段)。
[0204]
分别合成aavs1-g1s和aavs1-g1a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图13a)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(aavs1-g1)。质粒pkg-u6grna(aavs1-g1)表达seq id no:119所示的sgrna
aavs1-g1
。
[0205]
seq id no:119:
[0206][0207]
分别合成aavs1-g2s和aavs1-g2a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图13b)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(aavs1-g2)。质粒pkg-u6grna(aavs1-g2)表达seq id no:120所示的sgrna
aavs1-g2
。
[0208]
seq id no:120:
[0209][0210]
分别合成aavs1-g3s和aavs1-g3a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图13c)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(aavs1-g3)。质粒pkg-u6grna(aavs1-g3)表达seq id no:121所示的sgrna
aavs1-g3
。
[0211]
seq id no:121:
[0212][0213]
分别合成aavs1-g4s和aavs1-g4a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图13d)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(aavs1-g4)。质粒pkg-u6grna(aavs1-g4)表达seq id no:122所示的sgrna
aavs1-g4
。
[0214]
seq id no:122:
[0215][0216]
sgrna-aavs1-1s:5
’-
caccgaagacccactgcagccaggc-3’;seq id no:21
[0217]
sgrna-aavs1-1a:5
’-
aaacgcctggctgcagtgggtcttc-3’。seq id no:22
[0218]
sgrna-aavs1-2s:5
’-
caccggaggagtagaggctcttctg-3’;seq id no:23
[0219]
sgrna-aavs1-2a:5
’-
aaaccagaagagcctctactcctcc-3’。seq id no:24
[0220]
sgrna-aavs1-3s:5
’-
caccgcccaaagacccactgcagcc-3’;seq id no:25
[0221]
sgrna-aavs1-3a:5
’-
aaacggctgcagtgggtctttgggc-3’。seq id no:26
[0222]
sgrna-aavs1-4s:5
’-
caccgtgcagtgggtctttggggac-3’;seq id no:27
[0223]
sgrna-aavs1-4a:5
’-
aaacgtccccaaagacccactgcac-3’。seq id no:28
[0224]
sgrna-aavs1-1s、sgrna-aavs1-1a、sgrna-aavs1-2s、sgrna-aavs1-2a、sgrna-aavs1-3s、sgrna-aavs1-3a、sgrna-aavs1-4s、sgrna-aavs1-4a均为单链dna分子。
[0225]
四、不同靶点的编辑效率比较
[0226]
1、共转染
[0227]
第一组:将质粒pkg-u6grna(aavs1-g1)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(aavs1-g1):1.08μg质粒pkg-ge3。
[0228]
第二组:将质粒pkg-u6grna(aavs1-g2)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(aavs1-g2):1.08μg质粒pkg-ge3。
[0229]
第三组:将质粒pkg-u6grna(aavs1-g3)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(aavs1-g3):1.08μg质粒pkg-ge3。
[0230]
第四组:将质粒pkg-u6grna(aavs1-g4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(aavs1-g4):1.08μg质粒pkg-ge3。
[0231]
第五组:猪原代成纤维细胞,未进行任何转染操作。
[0232]
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(neon kit,thermofisher)与neon tm transfection system电转仪(参数设置为:1450v、10ms、3pulse)。
[0233]
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
[0234]
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组dna,采用aavs1-f378和aavs1-r749组成的引物对进行pcr扩增,然后进行电泳并测序,结果见图19。
[0235]
通过利用synthegoice工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为5%、27%、4%、30%和0%。结果表明,第四组编辑效率最高,sgrna
aavs1-g4
为最优靶点。
[0236]
五、高效靶点两侧基因组区域同源臂序列扩增
[0237]
分别以8只猪的基因组dna为模板,采用引物对sh2-l-f/sh2-l-r进行aavs1安全港位点切点左侧基因组序列的pcr扩增,采用引物对sh2-r-f/sh2-r-r进行aavs1安全港位点切点右侧基因组序列的pcr扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对sh2-lr-f/sh2-lr-r和sh2-rr-f/sh2-rr-r进行aavs1安全港位点切点左侧和右侧基因组同源序列的扩增。
[0238]
sh2-l-f:5
’-
cgtgctgagtccttttcccatc-3’;seq id no:83
[0239]
sh2-l-r:5
’-
ccccaaagtaaccgaacctgacg-3’;seq id no:84
[0240]
sh2-r-f:5
’-
ctgcctccattggtcttgtgttc-3’;seq id no:85
[0241]
sh2-r-r:5
’-
gtgcagctcctcaggaagtgg-3’;seq id no:86
[0242]
sh2-lr-f:5
’-
tcttgttatagatatcggcgcgccgtgctgagtccttttcccatcccacccacctg-3’;seq id no:87
[0243]
sh2-lr-r:5
’-
ccaggcccgggtctggggcgcccaaagacccactgcagccaggcagg-3’;seq id no:88
[0244]
sh2-rr-f:5
’-
agccattgtacgcgttggacaggccacagaagagcctctactcctc-3’;seq id no:89
[0245]
sh2-rr-r:5
’-
cttttatggcggccgcattttccctgaactgctcctcttctggg-3’。seq id no:90
[0246]
实施例5:h11安全港位点猪基因组区域定位及h11的高效切割靶点筛选
[0247]
一、猪h11安全港位点信息:猪h11安全港位点位于drg1和eif4enif1基因之间的间隔区,该区域及其上下游500bp序列如seq id no:10所示。
[0248]
分别以8只猪的基因组dna为模板,采用引物h11-f3/h11-r843组成的引物对进行pcr扩增,然后进行电泳,见图14。回收pcr扩增产物并进行测序,将测序结果与公共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:h11-f194/h11-r574。
[0249]
h11-f3:5
’-
tggctttgcttggtacctacatct-3’;seq id no:91
[0250]
h11-r843:5
’-
ttagggaaaatggggcctcagag-3’;seq id no:92
[0251]
h11-f194:5
’-
tgcgagaattctaaactggagta-3’;seq id no:93
[0252]
h11-r574:5
’-
ggtgacagtctcaagctcctcaa-3’。seq id no:94
[0253]
二、筛选靶点
[0254]
通过筛选ngg(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
[0255]
4个靶点分别如下:
[0256]
sgrna
h11-g1
靶点:5
’-
ttccaggaacataagaaagt-3’;seq id no:53
[0257]
sgrna
h11-g2
靶点:5
’-
tgttcctggaagtttagatc-3’;seq id no:54
[0258]
sgrna
h11-g3
靶点:5
’-
aggctacactgttaacactc-3’;seq id no:55
[0259]
sgrna
h11-g4
靶点:5
’-
gacctactttcttatgttcc-3’。seq id no:56
[0260]
三、制备重组质粒
[0261]
取质粒pkg-u6grna,用限制性内切酶bbsi进行酶切,回收载体骨架(约3kb的线性大片段)。
[0262]
分别合成h11-g1s和h11-g1a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图15a)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(h11-g1)。质粒pkg-u6grna(h11-g1)表达seq id no:123所示的sgrna
h11-g1
。
[0263]
seq id no:123:
[0264][0265]
分别合成h11-g2s和h11-g2a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图15b)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(h11-g2)。质粒pkg-u6grna(h11-g2)表达seq id no:124所示的sgrna
h11-g2
。
[0266]
seq id no:124:
[0267][0268]
分别合成h11-g3s和h11-g3a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图15c)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(h11-g3)。质粒pkg-u6grna(h11-g3)表达seq id no:125所示的sgrna
h11-g3
。
[0269]
seq id no:125:
[0270][0271]
分别合成h11-g4s和h11-g4a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图15d)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(h11-g4)。质粒pkg-u6grna(h11-g4)表达seq id no:126所示的sgrna
h11-g4
。
[0272]
seq id no:126:
[0273][0274]
sgrna-h11-1s:5
’-
caccgttccaggaacataagaaagt-3’;seq id no:29
[0275]
sgrna-h11-1a:5
’-
aaacactttcttatgttcctggaac-3’。seq id no:30
[0276]
sgrna-h11-2s:5
’-
caccgtgttcctggaagtttagatc-3’;seq id no:31
[0277]
sgrna-h11-2a:5
’-
aaacgatctaaacttccaggaacac-3’。seq id no:32
[0278]
sgrna-h11-3s:5
’-
caccgaggctacactgttaacactc-3’;seq id no:33
[0279]
sgrna-h11-3a:5
’-
aaacgagtgttaacagtgtagcctc-3’。seq id no:34
[0280]
sgrna-h11-4s:5
’-
caccggacctactttcttatgttcc-3’;seq id no:35
[0281]
sgrna-h11-4a:5
’-
aaacggaacataagaaagtaggtcc-3’。seq id no:36
[0282]
sgrna-h11-1s、sgrna-h11-1a、sgrna-h11-2s、sgrna-h11-2a、sgrna-h11-3s、sgrna-h11-3a、sgrna-h11-4s、sgrna-h11-4a均为单链dna分子。
[0283]
四、不同靶点的编辑效率比较
[0284]
1、共转染
[0285]
第一组:将质粒pkg-u6grna(h11-g1)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(h11-g1):1.08μg质粒pkg-ge3。
[0286]
第二组:将质粒pkg-u6grna(h11-g2)和质粒pkg-ge3共转染猪原代成纤维细胞。配
比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(h11-g2):1.08μg质粒pkg-ge3。
[0287]
第三组:将质粒pkg-u6grna(h11-g3)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(h11-g3):1.08μg质粒pkg-ge3。
[0288]
第四组:将质粒pkg-u6grna(h11-g4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(h11-g4):1.08μg质粒pkg-ge3。
[0289]
第五组:猪原代成纤维细胞,未进行任何转染操作。
[0290]
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(neon kit,thermofisher)与neon tm transfection system电转仪(参数设置为:1450v、10ms、3pulse)。
[0291]
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
[0292]
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组dna,采用h11-f194和h11-r574组成的引物对进行pcr扩增,然后进行电泳并测序,结果见图20。
[0293]
通过利用synthegoice工具分析测序峰图得出不同靶点的编辑效率。第一组至第五组的编辑效率依次为60%、27%、26%、0%和0%。结果表明,第一组编辑效率最高,sgrna
h11-g1
为最优靶点。
[0294]
五、高效靶点两侧基因组区域同源臂序列扩增
[0295]
分别以8只猪的基因组dna为模板,采用引物对sh3-l-f/sh3-l-r进行h11安全港位点切点左侧基因组序列的pcr扩增,采用引物对sh3-r-f/sh3-r-r进行h11安全港位点切点右侧基因组序列的pcr扩增,然后进行电泳并测序分析。通过测序结果,选择8只猪中序列保守的区域进一步分别采用引物对sh3-lr-f/sh3-lr-r和sh3-rr-f/sh3-rr-r进行h1安全港位点切点左侧和右侧基因组同源序列的扩增。
[0296]
sh3-l-f:5
’-
agacagaccatgctcaatccaca-3’;seq id no:95
[0297]
sh3-l-r:5
’-
gatgcccgatgttgtcaatcctg-3’;seq id no:96
[0298]
sh3-r-f:5
’-
aagatactcagcagcagtctcct-3’;seq id no:97
[0299]
sh3-r-r:5
’-
gatggacaggtgaagcaggcaag-3’;seq id no:98
[0300]
sh3-lr-f:5
’-
tcttgttatagatatcggcgcgcccaaatacccacgtttattgggacaaaag-3’;seq id no:99
[0301]
sh3-lr-r:5
’-
ccaggcccgggtctggggcgcgttcttatgttcctggaagtttagatcag-3’;seq id no:100
[0302]
sh3-rr-f:5
’-
agccattgtacgcgttgagtaggtcacatttcagtaaaacctgg-3’;seq id no:101
[0303]
sh3-rr-r:5
’-
cttttatggcggccgcatcttttctacggccacttccagggcatatgg-3’。seq id no:102
[0304]
实施例6:col1a1安全港位点猪基因组区域定位及col1a1的高效切割靶点筛选
[0305]
一、猪col1a1安全港位点信息:猪col1a1安全港位点位于col1a1基因的下游区域,该区域及其上下游500bp序列如seq id no:11所示。
[0306]
分别以8只猪的基因组dna为模板,采用引物col1a1-f157/col1a1-r1084组成的引物对进行pcr扩增,然后进行电泳,见图16。回收pcr扩增产物并进行测序,将测序结果与公
共数据库中的基因序列进行比对分析。根据比对结果,设计用于检测突变的引物(引物本身避开可能的突变位点)。设计的用于检测突变的引物为:col1a1-f473/col1a1-r870。
[0307]
col1a1-f157:5
’-
tgacccaaaccaatcttgcactg-3’;seq id no:103
[0308]
col1a1-r1084:5
’-
tgagttctggcttcctggattct-3’;seq id no:104
[0309]
col1a1-f473:5
’-
gatgccaccaactctctcgctc-3’;seq id no:105
[0310]
col1a1-r870:5
’-
ccagaggtctcatgtttggggaa-3’。seq id no:106
[0311]
二、筛选靶点
[0312]
通过筛选ngg(避开可能的突变位点)初步筛选到若干靶点,经过预实验进一步从中筛选到4个靶点。
[0313]
4个靶点分别如下:
[0314]
sgrna
col1a1-g1
靶点:5
’-
ctaccaagagagtgaccagc-3’;seq id no:57
[0315]
sgrna
col1a1-g2
靶点:5
’-
ggtcctgctggtcactctct-3’;seq id no:58
[0316]
sgrna
col1a1-g3
靶点:5
’-
gcagtctcagcaaccactga-3’;seq id no:59
[0317]
sgrna
col1a1-g4
靶点:5
’-
agccagcaacaaggctcaag-3’。seq id no:60
[0318]
三、制备重组质粒
[0319]
取质粒pkg-u6grna,用限制性内切酶bbsi进行酶切,回收载体骨架(约3kb的线性大片段)。
[0320]
分别合成col1a1-g1s和col1a1-g1a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图17a)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(col1a1-g1)。质粒pkg-u6grna(col1a1-g1)表达seq id no:127所示的sgrna
col1a1-g1
。
[0321]
seq id no:127:
[0322][0323]
分别合成col1a1-g2s和col1a1-g2a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图17b)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(col1a1-g2)。质粒pkg-u6grna(col1a1-g2)表达seq id no:128所示的sgrna
col1a1-g2
。
[0324]
seq id no:128:
[0325][0326]
分别合成col1a1-g3s和col1a1-g3a,然后混合并进行退火,得到具有粘性末端的双链dna分子(图17c)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(col1a1-g3)。质粒pkg-u6grna(col1a1-g3)表达seq id no:129所示的sgrna
col1a1-g3
。
[0327]
seq id no:129:
[0328][0329]
分别合成col1a1-g4s和col1a1-g4a,然后混合并进行退火,得到具有粘性末端的
双链dna分子(图17d)。将具有粘性末端的双链dna分子和载体骨架连接,得到质粒pkg-u6grna(col1a1-g4)。质粒pkg-u6grna(col1a1-g4)表达seq id no:130所示的sgrna
col1a1-g4
。
[0330]
seq id no:130:
[0331][0332]
sgrna-col1a1-1s:5
’-
caccgctaccaagagagtgaccagc-3’;seq id no:37
[0333]
sgrna-col1a1-1a:5
’-
aaacgctggtcactctcttggtagc-3’。seq id no:38
[0334]
sgrna-col1a1-2s:5
’-
caccgggtcctgctggtcactctct-3’;seq id no:39
[0335]
sgrna-col1a1-2a:5
’-
aaacagagagtgaccagcaggaccc-3’。seq id no:40
[0336]
sgrna-col1a1-3s:5
’-
caccggcagtctcagcaaccactga-3’;seq id no:41
[0337]
sgrna-col1a1-3a:5
’-
aaactcagtggttgctgagactgcc-3’。seq id no:42
[0338]
sgrna-col1a1-4s:5
’-
caccgagccagcaacaaggctcaag-3’;seq id no:43
[0339]
sgrna-col1a1-4a:5
’-
aaaccttgagccttgttgctggctc-3’。seq id no:44
[0340]
sgrna-col1a1-1s、sgrna-col1a1-1a、sgrna-col1a1-2s、sgrna-col1a1-2a、sgrna-col1a1-3s、sgrna-col1a1-3a、sgrna-col1a1-4s、sgrna-col1a1-4a均为单链dna分子。
[0341]
四、不同靶点的编辑效率比较
[0342]
1、共转染
[0343]
第一组:将质粒pkg-u6grna(col1a1-g1)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(col1a1-g1):1.08μg质粒pkg-ge3。
[0344]
第二组:将质粒pkg-u6grna(col1a1-g2)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(col1a1-g2):1.08μg质粒pkg-ge3。
[0345]
第三组:将质粒pkg-u6grna(col1a1-g3)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(col1a1-g3):1.08μg质粒pkg-ge3。
[0346]
第四组:将质粒pkg-u6grna(col1a1-g4)和质粒pkg-ge3共转染猪原代成纤维细胞。配比:约20万个猪原代成纤维细胞:0.92μg质粒pkg-u6grna(col1a1-g4):1.08μg质粒pkg-ge3。
[0347]
第五组:猪原代成纤维细胞,未进行任何转染操作。
[0348]
共转染采用电击转染的方式,采用哺乳动物核转染试剂盒(neon kit,thermofisher)与neon tm transfection system电转仪(参数设置为:1450v、10ms、3pulse)。
[0349]
2、完成步骤1后,采用完全培养液培养16-18小时,然后更换新的完全培养液进行培养。培养总时间为48小时。
[0350]
3、完成步骤2后,采用胰蛋白酶消化并收集细胞,提取基因组dna,采用col1a1-f473和col1a1-r870组成的引物对进行pcr扩增,然后进行电泳并测序,结果见图21。
2r3-puro-col1a1、0.5μg质粒pkg-u6grna(col1a1-g3):0.9μg质粒pkg-ge3。
[0370]
第五组:猪原代成纤维细胞,同等电转参数不加任何质粒进行电转染操作。
[0371]
具体实施方法:
[0372]
细胞:电转前猪原代成纤维细胞融合度达到60%,0.25%胰蛋白酶消化,台盼蓝染色计数,取等量细胞进行五组电转。
[0373]
猪原代细胞电转:
[0374]
(1)将细胞用胰酶消化,得到的细胞悬液用pbs磷酸缓冲液(solarbio)洗一遍,600g离心6min,弃去上清,使用58ul电转基本液r buffer重悬细胞(11ul/个),重悬过程中要避免气泡的产生;
[0375]
(2)吸取10ul细胞悬液与质粒电转反应液混匀,混匀过程中注意切勿产生气泡;
[0376]
(3)将试剂盒带有的电转杯放置于neon tm transfection system电转仪杯槽内,加入3ml e buffer;
[0377]
(4)用电转枪吸取10ul步骤2)得到的混合液,插入电转杯内,选择电转程序(1450v 10ms3pulse),电击转染后立即在超净台内将电转枪中混合液转入到6孔板中,每孔3ml完全培养液(含15%胎牛血清(gibco)+83%dmem培养基(gibco)+1%p/s(gibco penicillin-streptomycin)+1%hepes(solarbio));
[0378]
(5)混匀后放置于37℃,5%co2、5%o2的恒温培养箱中进行培养;
[0379]
(6)电转18-24h换液,电转48h使用嘌呤霉素进行筛选阳性细胞。
[0380]
二、嘌呤霉素筛选
[0381]
细胞经质粒电转48h,加入1.5μg/ml嘌呤霉素筛选,每两天更换含有相同浓度嘌呤霉素的培养基,同时进行gfp绿色荧光拍照,连续筛选两周,待细胞内质粒完全降解后再继续加药筛选一周。通过gfp荧光表达的强弱判断安全港位点对外源基因表达效率的影响。
[0382]
嘌呤霉素筛选一周后,rosa26、col1a1安全港位点实验组荧光强度明显强于aavs1、h11实验组;嘌呤霉素筛选两周后,荧光强度由强到弱依次为:col1a1>rosa26>h11>aavs1,其中h11组部分荧光弱整体荧光强,rosa26组整体荧光强度较均一,aavs1组细胞荧光表达最弱,col1a1组荧光细胞数增多,荧光最强;嘌呤霉素继续筛选三周后,荧光强度由强到弱依次为:col1a1>rosa26>h11>aavs1,结果如图22。
[0383]
三、gfp基因转录水平检测
[0384]
为了比较gfp基因整合入四个不同安全港位点后其mrna转录水平的差异性,即四个不同安全港位点是否参与gfp的表达调控及其对gfp表达量的影响。我们针对gfp基因设计一对引物,取嘌呤霉素筛选三周后的细胞,提取总rna,反转录成cdna,用于检测原代细胞在四个不同安全港位点整合gfp基因后的转录水平,同时用野生型原代细胞作为对照。以gapdh为内参基因按照2-δct
法进行计算。
[0385]
(1)引物信息(表1)
[0386]
表1荧光定量pcr引物信息
[0387]
[0388][0389]
(2)细胞总rna提取
[0390]
利用bio flux的simply p总rna提取试剂盒进行细胞总rna提取。
[0391]
(3)cdna第一链获得
[0392]
根据vazyme反转录试剂盒ii 1st strand cdna synthesis kit(r211-01/02)说明书合成cdna第一链,具体步骤和程序如下:
[0393]
1)配制第一链cdna合成反应液
[0394]
在rnase-free离心管中配制如下混合液:
[0395][0396]
用移液枪轻轻吹打混匀。
[0397]
2)按下列条件进行第一链cdna合成反应
[0398][0399]
产物立即用于qpcr反应,或存放于-80℃保存,避免反复冻融。
[0400]
(4)荧光定量pcr
[0401]
利用实时荧光定量pcr法检测插入四组不同安全港位点(rosa26、aavs1、h11、col1a1)猪原代成纤维细胞中gfp的表达量,gapdh作为内参基因。操作步骤及程序如下:
[0402]
1)反应体系配制如下
[0403]
[0404][0405]
2)qpcr反应程序如下
[0406][0407]
3)统计与分析
[0408]
用prism5统计学软件进行数据分析,以(平均数
±
标准差)表示,采用双因素方差分析进行统计学分析。2-δct
值结果显示嘌呤霉素筛选三周后aavs1、h11组gfp表达量较低,rosa26、col1a1组gfp表达量较高,且rosa26、col1a1组相对于aavs1和h11组gfp转录水平差异极显著(p<0.01),2-δct
值结果见表2,差异显著性分析结果如图23。
[0409]
表2 2-δct
值信息
[0410][0411]
综上,根据培养细胞三周后的荧光信号强度与gfp基因实时荧光定量pcr的结果,可以得出如下结论,在rosa26、aavs1、h11、col1a1这四个基因组安全港位点中,col1a1位点插入基因后表达的最好,col1a1位点是最适合猪原代细胞表达外源基因的安全港位点。
[0412]
三、gfp基因的流式细胞荧光分选检测
[0413]
为了比较gfp基因整合入四个不同安全港位点后gfp蛋白的表达情况。分别用胰蛋白酶消化细胞,400g离心4min后,弃上清。以1ml培养基重悬细胞,并将细胞悬液分别转移至流式管内。在bd facsmelody流式细胞仪的fitc通道内检测gfp信号,并以野生型细胞作为阴性对照,收集5
×
104个细胞进行分析,结果如图24所示。结果显示gfp荧光信号col1a1>rosa26>h11>aavs1。
技术特征:
1.一种基因编辑的方法,其特征在于,所述的方法包括将包含外源基因的安全港位点载体、sgrna载体和cas载体共转染至宿主细胞,其中,所述的cas载体包含编码cas蛋白、egfp和puro蛋白的核苷酸序列。2.根据权利要求1所述的方法,其特征在于,所述的cas载体还包含ef1a启动子、wpre元件和3’ltr序列元件,优选的,所述的cas载体的核苷酸序列从5
’-3’
依次为:cmv增强子、ef1a启动子、核定位信号、核定位信号、编码cas蛋白的核苷酸序列、核定位信号,核定位信号、编码自剪切多肽p2a的核苷酸序列、编码egfp的核苷酸序列、编码自裂解多肽t2a的核苷酸序列、编码puro蛋白的核苷酸序列、wpre序列元件、3’ltr序列元件和polya信号序列元件,其中,所述的cas蛋白选自casl、caslb、cas2、cas3、cas4、cas5、cas5d、cas5t,cas5h,cas5a、cas6、cas7、cas8、cas9、caslo、csyl、csy2、csy3、csy4、csel、cse2、cse3、cse4、cse5e、cscl、csc2、csa5、csnl、csn2、csml、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csx17、csx14、csxlo、csx16、csax、csx3、csxl、csxls、csfl、csf2、cso、csf4、csdl、csd2、cstl、cst2、cshl、csh2、csal、csa2、csa3、csa4、csa5、c2cl、c2c2、c2c3、cpfl、carf、ding、其同源物或其修饰形式,优选为cas9。3.根据权利要求1或2所述的方法,其特征在于,所述的cas载体的核苷酸序列如seq id no:2所示。4.根据权利要求1-3任一所述的方法,其特征在于,所述的方法包括将包含外源基因的安全港位点载体、sgrna载体和cas载体共转染至宿主细胞中,使安全港位点载体上的外源基因分别整合入rosa26、aavs1、h11或col1a1任一个或两个以上安全港位点,优选的,rosa26安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:8所示,aavs1安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:9所示,h11安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:10所示,col1a1安全港位点区域及其上下游各500bp的核苷酸序列如seq id no:11所示。5.根据权利要求1-4任一所述的方法,其特征在于,所述的sgrna载体包含靶向rosa26、aavs1、h11或col1a1安全港位点的sgrna,其中,靶向rosa26的sgrna的核苷酸序列如seq id no:45-48任一所示,靶向aavs1的sgrna的核苷酸序列如seq id no:49-52任一所示,靶向h11的sgrna的核苷酸序列如seq id no:53-56任一所示,靶向col1a1的sgrna的核苷酸序列如seq id no:57-60任一所示。6.根据权利要求1-5任一所述的方法,其特征在于,所述的安全港位点载体包含与rosa26、aavs1、h11或col1a1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂,优选的,还包含绝缘子区域、ef-1α启动子,编码egfp蛋白的核苷酸序列,ef-1αpoly(a)信号序列,pgk启动子,编码mcherry蛋白的核苷酸序列,bgh poly(a)信号序列,loxp-puro-loxp表达框区域,pcag启动子,和/或β-globin poly(a)信号序列,进一步优选的,rosa26安全港位点载体如seq id no:4所示,aavs1安全港位点载体如seq id no:5所示,h11安全港位点载体如seq id no:6所示,col1a1安全港位点载体如seq id no:7所示;优选的,所述的外源基因的核苷酸序列位于安全港位点5’同源臂与3’同源臂之间。7.根据权利要求1-6任一所述的方法,其特征在于,所述的安全港位点载体、sgrna载体或cas载体均为环状质粒。8.根据权利要求1-7任一所述的方法,其特征在于,所述的宿主细胞来源于非人动物或
人,所述的非人动物选自猪、狗、牛、羊、猴或小鼠;优选的,所述的宿主细胞来源于猪,进一步优选为猪的成纤维细胞。9.一种cas载体,其特征在于,所述的cas载体包含编码cas蛋白、egfp和puro蛋白的核苷酸序列。10.根据权利要求9所述的cas载体,其特征在于,所述的cas载体还包含ef1a启动子、wpre元件和3’ltr序列元件,优选的,所述的cas载体的核苷酸序列从5
’-3’
依次为:cmv增强子、ef1a启动子、核定位信号、核定位信号、编码cas蛋白的核苷酸序列、核定位信号,核定位信号、编码自剪切多肽p2a的核苷酸序列、编码egfp的核苷酸序列、编码自裂解多肽t2a的核苷酸序列、编码puro蛋白的核苷酸序列、wpre序列元件、3’ltr序列元件和poly a信号序列元件,其中,所述的cas蛋白选自casl、caslb、cas2、cas3、cas4、cas5、cas5d、cas5t,cas5h,cas5a、cas6、cas7、cas8、cas9、caslo、csyl、csy2、csy3、csy4、csel、cse2、cse3、cse4、cse5e、cscl、csc2、csa5、csnl、csn2、csml、csm2、csm3、csm4、csm5、csm6、cmrl、cmr3、cmr4、cmr5、cmr6、csbl、csb2、csb3、csx17、csx14、csxlo、csx16、csax、csx3、csxl、csxls、csfl、csf2、cso、csf4、csdl、csd2、cstl、cst2、cshl、csh2、csal、csa2、csa3、csa4、csa5、c2cl、c2c2、c2c3、cpfl、carf、ding、其同源物或其修饰形式,优选为cas9。11.根据权利要求9或10所述的cas载体,其特征在于,所述的cas载体的核苷酸序列如seq id no:2所示,所述的cas载体为环状质粒。12.一种靶向rosa26的sgrna,其特征在于,所述的靶向rosa26的sgrna的核苷酸序列如seq id no:45-48任一所示。13.一种靶向aavs1的sgrna,其特征在于,所述的靶向aavs1的sgrna的核苷酸序列如seq id no:49-52任一所示。14.一种靶向h11的sgrna,其特征在于,所述的靶向h11的sgrna的核苷酸序列如seq id no:53-56任一所示。15.一种靶向col1a1的sgrna,其特征在于,所述的靶向col1a1的sgrna的核苷酸序列如seq id no:57-60任一所示。16.一种sgrna载体,其特征在于,所述的sgrna载体包含权利要求12-15任一所述的靶向rosa26、aavs1、h11或col1a1的sgrna。17.一种sgrna载体的制备方法,其特征在于,所述的制备方法包括:1)提供权利要求12-15任一所述的靶向rosa26、aavs1、h11或col1a1的sgrna;2)采用步骤1)中的sgrna制备双链dna分子;3)将步骤2)获得的双链dna分子连接至相应的载体骨架,获得相应的sgrna载体,其中,所述的载体骨架的核苷酸序列如seq id no:3所示。18.一种安全港位点载体,其特征在于,所述的安全港位点载体包含与rosa26、aavs1、h11或col1a1安全港位点5’端同源的5’同源臂和/或3’端同源的3’同源臂,优选的,还包含绝缘子区域、ef-1α启动子,编码egfp蛋白的核苷酸序列,ef-1αpoly(a)信号序列,pgk启动子,编码mcherry蛋白的核苷酸序列,bgh poly(a)信号序列,loxp-puro-loxp表达框区域,pcag启动子,和/或β-globin poly(a)信号序列,进一步优选的,rosa26安全港位点载体如seq id no:4所示,aavs1安全港位点载体如seq id no:5所示,h11安全港位点载体如seq id no:6所示,col1a1安全港位点载体如seq id no:7所示。
19.一种基因编辑的试剂盒,其特征在于,所述的试剂盒中包含权利要求9-11任一所述的cas载体、权利要求12-15任一所述的sgrna、权利要求16所述的sgrna载体和/或权利要求18所述的安全港位点载体。
技术总结
本发明提供了一种基因编辑的方法,所述的方法包括将包含外源基因的安全港位点载体、sgRNA载体和Cas载体共转染至宿主细胞。本发明还提供了一种SEQ ID NO:2所示的Cas载体,其与现有载体相比,具有更高的基因编辑效率。具有更高的基因编辑效率。具有更高的基因编辑效率。
技术研发人员:牛冬 汪滔 曾为俊 马翔 王磊 程锐 黄彩云
受保护的技术使用者:南京启真基因工程有限公司
技术研发日:2020.11.23
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-14313.html