背景技术:
1、crispr-cas9和胞嘧啶脱氨酶的组合产生了用于可编程的胞嘧啶至胸腺嘧啶(c至t)取代的胞嘧啶碱基编辑器(cbe),该技术已被成功应用以在多种物种中实现高效编辑并且在临床应用中具有巨大的潜力。由于碱基编辑过程不依赖于dna双链断裂(dsb)的产生,因此可在很大程度上避免不需要的核苷酸插入/缺失(indel)或dna损伤应答(ddr)。
2、变形式碱基编辑器(tbe)系统含有胞嘧啶脱氨酶抑制剂(dcdi)结构域和分裂tev蛋白酶(参见,例如wo2020156575)。因此,tbe在因具有可切割的dcdi结构域融合物,而得以在脱靶位点处保持无活性,并消除了非预期的脱靶突变。只有当结合在靶向位点处时,才转化tbe以切除dcdi结构域并催化靶向脱氨基以进行精确的编辑。具体地,tbe使用sgrna(通常为20nt)结合在靶基因组位点处,并且使用辅助sgrna(hsgrna,通常为10nt至20nt)结合在邻近区域(优选靶基因组位点上游)。两个grna的结合可在用于碱基编辑的靶基因组位点处引导tbe系统组件的正确组装。tbe可在靶区域中特异性地编辑胞嘧啶,而没有可观察到的脱靶突变。
技术实现思路
1、在一些实施方案中,本公开提供了用于进行碱基编辑的突变的胞嘧啶脱氨酶和相关分子,这些突变的胞嘧啶脱氨酶和相关分子具有减少的脱靶突变或者没有脱靶突变,并且具有改善的编辑位点精确度。小鼠apobec3蛋白的突变的催化域(ma3cda1)包含一个或多个有助于缩小编辑窗口同时保持高编辑效率的突变。示例性突变包括y35d和k40h-w102y。还提供了使用这些突变的胞嘧啶脱氨酶的改善的引物编辑系统和方法。
2、根据本公开的一个实施方案,提供了一种蛋白质,该蛋白质包含突变的小鼠apobec3蛋白的催化域,其中该催化域与seq id no:1的氨基酸残基35-141具有至少85%的序列同一性,并且相对于seq id no:1包含在选自y35、k37、r39、k40、n66、w102、y132以及其组合组成的组中的残基处的取代。
3、在一些实施方案中,该取代选自由以下组成的组:
4、
5、
6、在一些实施方案中,该催化域在残基h71和e73处保留seq id no:1的氨基酸。在一些实施方案中,该催化域在残基d41、f43、f64、a72、p104、c105和c108处保留seq id no:1的氨基酸。在一些实施方案中,该取代选自由y35d、y35e、k37d、r39a、k40a、k40h、n66a、n66g、n66q、w102y、w102f、y132f以及其组合组成的组。
7、在一些实施方案中,该取代为y35d或y35e。在一些实施方案中,该催化域包含seqid no:3的氨基酸序列。在一些实施方案中,该取代为k40h和w102y。在一些实施方案中,该催化域包含seq id no:5的氨基酸序列。
8、还提供了一种包含第一片段和第二片段的融合蛋白,该第一片段包括本公开的蛋白质,该第二片段包括核碱基脱氨酶抑制剂。在一些实施方案中,该融合蛋白还包含位于该第一片段和该第二片段之间的蛋白酶切割位点。在一些实施方案中,该核碱基脱氨酶抑制剂是核碱基脱氨酶的抑制性结构域。
9、在一些实施方案中,该核碱基脱氨酶抑制剂包含seq id no:7、8或9的氨基酸序列,或seq id no:7的氨基酸残基128-223。
10、在一些实施方案中,还提供了一种双重向导rna系统,该双重向导rna系统包含:靶单向导rna,该靶单向导rna包含与邻近第一pam位点的靶核酸序列具有序列互补性的第一间隔区,辅助单向导rna,该辅助单向导rna包含与邻近第二pam位点的第二核酸序列具有序列互补性的第二间隔区,成簇的规律间隔短回文重复序列(crispr)相关(cas)蛋白,和本公开的蛋白质或融合蛋白。
11、在一些实施方案中,该第二pam位点距该第一pam位点34至91个碱基。
12、又一个实施方案提供了一种用于在靶核酸的胞嘧啶处引入c至t取代的方法,该方法包括使该靶核酸与crispr相关(cas)蛋白、本公开的蛋白质或融合蛋白、单向导rna(sgrna)和辅助单向导rna(hsgrna)接触,其中该sgrna和该hsgrna能够与靶核酸杂交。
13、在一些实施方案中,该胞嘧啶位于靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第4位和第8位核苷酸之间。在一些实施方案中,该胞嘧啶位于靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第6位和第8位核苷酸之间。
14、在另一个实施方案中,提供了一种用于在靶核酸中的胞嘧啶处引入c至t取代的方法,该方法包括使该靶核酸与crispr相关(cas)蛋白、本公开的融合蛋白、单向导rna(sgrna)和辅助单向导rna(hsgrna)接触,其中该sgrna和该hsgrna能够与该靶核酸杂交,其中胞嘧啶位于该靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第6位和第8位核苷酸之间,并且其中该催化域包含seq id no:3的氨基酸序列。
15、又提供了一种用于在靶核酸中的胞嘧啶处引入c至t取代的方法,该方法包括使该靶核酸与crispr相关(cas)蛋白、本公开的融合蛋白、单向导rna(sgrna)和辅助单向导rna(hsgrna)接触,其中该sgrna和该hsgrna能够与该靶核酸杂交,其中胞嘧啶位于该靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第4位和第8位核苷酸之间,并且其中该催化域包含seq id no:5的氨基酸序列。
1.一种蛋白质,所述蛋白质包含突变的小鼠apobec3蛋白的催化域,其中所述催化域与seq id no:1的氨基酸残基35-141具有至少85%的序列同一性,并且相对于seq id no:1包含在选自由y35、k37、r39、k40、n66、w102、y132及其组合组成的组中的残基处的取代。
2.根据权利要求1所述的蛋白质,其中所述取代选自由以下组成的组:
3.根据权利要求1或2所述的蛋白质,其中所述催化域在残基h71和e73处保留seq idno:1的氨基酸。
4.根据权利要求1至3中任一项所述的蛋白质,其中所述催化域在残基d41、f43、f64、a72、p104、c105和c108处保留seq id no:1的氨基酸。
5.根据权利要求1至4中任一项所述的蛋白质,其中所述取代选自由y35d、y35e、k37d、r39a、k40a、k40h、n66a、n66g、n66q、w102y、w102f、y132f及其组合组成的组。
6.根据权利要求5所述的蛋白质,其中所述取代为y35d或y35e。
7.根据权利要求1所述的蛋白质,其中所述催化域包含seq id no:3的氨基酸序列。
8.根据权利要求5中任一项所述的蛋白质,其中所述取代为k40h和w102y。
9.根据权利要求1所述的蛋白质,其中所述催化域包含seq id no:5的氨基酸序列。
10.一种融合蛋白,所述融合蛋白包含:
11.根据权利要求10所述的融合蛋白,所述融合蛋白还包含位于所述第一片段和所述第二片段之间的蛋白酶切割位点。
12.根据权利要求10或11所述的融合蛋白,其中所述核碱基脱氨酶抑制剂是核碱基脱氨酶的抑制性结构域。
13.根据权利要求10所述的融合蛋白,其中所述核碱基脱氨酶抑制剂包含seq id no:7、8或9的氨基酸序列,或seq id no:7的氨基酸残基128-223。
14.一种双重向导rna系统,所述双重向导rna系统包含:
15.根据权利要求14所述的双重向导rna系统,其中所述第二pam位点距所述第一pam位点34至91个碱基。
16.一种用于在靶核酸中的胞嘧啶处引入c至t取代的方法,所述方法包括使所述靶核酸与crispr相关(cas)蛋白、根据权利要求1至9中任一项所述的蛋白质或根据权利要求10至13中任一项所述的融合蛋白、单向导rna(sgrna)和辅助单向导rna(hsgrna)接触,其中所述sgrna和所述hsgrna能够与所述靶核酸杂交。
17.根据权利要求16所述的方法,其中所述胞嘧啶位于所述靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第4位和第8位核苷酸之间。
18.根据权利要求16所述的方法,其中所述胞嘧啶位于所述靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第6位和第8位核苷酸之间。
19.一种用于在靶核酸中的胞嘧啶处引入c至t取代的方法,所述方法包括使所述靶核酸与crispr相关(cas)蛋白、根据权利要求10至13中任一项所述的融合蛋白、单向导rna(sgrna)和辅助单向导rna(hsgrna)接触,其中所述sgrna和所述hsgrna能够与所述靶核酸杂交,其中胞嘧啶位于所述靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第6位和第8位核苷酸之间,并且其中所述催化域包含seq id no:3的氨基酸序列。
20.一种用于在靶核酸中的胞嘧啶处引入c至t取代的方法,所述方法包括使所述靶核酸与crispr相关(cas)蛋白、根据权利要求10至13中任一项所述的融合蛋白、单向导rna(sgrna)和辅助单向导rna(hsgrna)接触,其中所述sgrna和所述hsgrna能够与所述靶核酸杂交,其中胞嘧啶位于所述靶核酸序列上的原型间隔区相邻基序(pam)序列3'端的第4位和第8位核苷酸之间,并且其中所述催化域包含seq id no:5的氨基酸序列。
21.一种碱基编辑系统,所述碱基编辑系统包含:
22.根据权利要求21所述的碱基编辑系统,其中所述第一融合蛋白还包含尿嘧啶糖基化酶抑制剂(ugi)。
23.根据权利要求21或22所述的碱基编辑系统,其中所述cas蛋白还包含一个、两个或三个ugi,其中所述ugi能够从所述cas蛋白切割。
24.一种多核苷酸,所述多核苷酸包含
25.根据权利要求24所述的多核苷酸,其中所述核碱基脱氨酶是根据权利要求1至9中任一项所述的蛋白质。