一种单细胞水平检测hla-i/ii类基因表达分型和表达量的试剂盒及使用方法
技术领域
1.本发明属于基因测序领域,具体涉及一种单细胞水平检测hla-i/ii类基因表达分型和表达量的试剂盒及使用方法。
背景技术:
2.测序法已经成为一种常规的实验技术,最近新一代测序技术的显著优势,主要有以下几种:大规模平行签名测序(massively parallel signature sequencing,mpss)、高通量测序技术、聚合酶克隆(polony sequencing)、454焦磷酸测序(454 pyrosequencing)、illumina (solexa) sequencing、abi solid sequencing、离子半导体测序(ion semiconductor sequencing)、dna纳米球测序(dna nanoball sequencing)等。
3.大规模平行信号(mpss, brenner et al.2000)和焦磷酸测序法(也称454测序,margulies et al.2005, langaee and ronaghi2005)已经使测序技术发生了彻底的变革,它们可以同时对数百万个短序列读长进行测序。尽管面临着来自生物信息学方面的挑战,但是这些技术为探索更多生态学与进化问题提供了更多的机会,其中包括对生物多样性的分析( venter etal.2004)。此外,二代测序技术是最不可能由于操作不当、缺失、稀有转录及克隆细菌不稳定的原因而产生错误的。技术进步使得这一方法变得不断可靠(hamady et al.2008),绝大多数的转录表达(包括那些表达量极少的转录本)都能够被精准地定量( stoloⅶitzky etal.2005)。随着序列读长的增加,454焦磷酸测序法的使用频率将大增,能进一步增加在非模式物种中鉴定基因的概率( hudson2008)。由于测序的读长较短,这项技术最初只能用于已测序的模式物种。
4.高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条dna分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。高通量测序技术的诞生可以说是基因组学研究领域一个具有里程碑意义的事件。该技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降, 以人类基因组测序为例,上世纪末进行的人类基因组计划花费 30 亿美元解码了人类生命密码,而第二代测序使得人类基因组测序已进入万(美)元基因组时代。如此低廉的单碱基测序成本使得我们可以实施更多物种的基因组计划从而解密更多生物物种的基因组遗传密码。在已完成基因组序列测定的物种中,对该物种的其他品种进行大规模地全基因组重测序也成为了可能,同时,为研究人类基因组上复杂多态区域(如:vdj、hla等)提供有效工具。
5.主要组织相容性复合体(major histocompatibility complex,mhc)是一组编码动物主要组织相容性抗原的基因群的统称。1958年dausset等发现,多次接受输血的患者、多产妇和用同种白细胞免疫的志愿者血清中,存在不同特异性的白细胞抗体,用这些抗体鉴定出许多不同特异性的白细胞抗原,称为人类白细胞抗原(human leucocyte antigen,
hla)。通过家系和人群遗传分析发现,人类mhc位于第6号染色体上,称为hla复合体。mhc可以分为经典mhc与非经典mhc两类,经典mhc包括mhc
ꢀⅰ
、mhc
ꢀⅱ
、mhc
ꢀⅲ
基因,分别编码mhc
ꢀⅰ
分子、mhc
ꢀⅱ
分子、mhc
ꢀⅲ
分子。
6.mhc class
ꢀⅰ
(mhc
ꢀⅰ
):位于一般细胞表面上,可以提供一般细胞内的一些状况,比如该细胞遭受病毒感染,则将病毒外膜碎片之氨基酸链(peptide)透过mhc提示在细胞外侧,可以供杀手cd8 t细胞等辨识,以进行扑杀。ⅰ类基因区包括hla-a、b、c位点的等位基因,编码hla-a抗原、b抗原和c抗原等经典的ⅰ类抗原(分子)。近年来相继发现大量与ⅰ类基因结构相似的基因,已被正式命名的有hla-e、f、g、h、j、k、l。其中hla-e、f、g基因可编码非多态性的ⅰ类样抗原(或非经典ⅰ类抗原),但它们的确切功能尚未清楚。hla-h、j、k、l则属于假基因。
7.mhc class
ꢀⅱ
(mhc
ꢀⅱ
):大多位于抗原提呈细胞(apc)上,如巨噬细胞等。这类提供则是细胞外部的情况,像是组织中有细菌侵入,则巨噬细胞进行吞食后,把细菌碎片利用mhc提示给辅助t细胞,启动免疫反应。ⅱ类基因区十分复杂,主要包括hla-dp、dq、dr三个亚区和新近确定的dn、do、dm等3个亚区。该区的基因是以它们所编码的肽链(α、β)直接命名,如dra、drb1、drb2等。已知该区至少存在7个编码α链和16个编码β链的基因,其中有的基因有表达功能,有的功能不明,有的属于假基因。现在证明,在ⅱ类基因区内存在与内源性抗原处理和递呈相关的基因,即lmp和tap。lmp又称蛋白酶体相关基因(proteasome-related gene),由lmp2和lmp7两个基因组成,其编码产物lmp(low molecular mass polypeptide or large multifunctional protease)与内源性抗原的处理有关。tap为多肽转运体基因,包括tap1和tap2两个基因,其编码产物tap(transporter of antigenic peptides)与抗原肽的转运有关。
8.mhc class
ꢀⅲꢀ
(mhc
ꢀⅲ
) :主要编码补体成分,肿瘤坏死因子(tnf),热休克蛋白70(hsp70)和21羟化酶基因(cyp21a和cyp21b)。ⅲ类基因区内已定位的至少有36个基因,其中与免疫系统有关的基因有c4b、c4a、c2、bf、肿瘤坏死因子(tnfa、tnfb)和热休克蛋白70(hsp70),分别编码c4、c2、b因子、tnf-α、tnf-β和hsp70分子。在c4b两侧,还有与免疫系统无明显关系的cyp21b和cyp21a两个基因,编码21-羟化酶。大多数ⅲ类基因产物合成后分泌到体液中去。具体内容见有关章节。hsp70主要在胞浆内,与其他蛋白质肽链的折叠、转位有关,亦可见于mφ细胞和b细胞的内体(endosome)和膜表面,其作用为阻止内体中抗原的降解,并使之与ⅱ类分子联合。
9.针对mhc的研究,目前主要集中在针对bulk mhc的ⅰ类和ⅱ类两个方面。然而,查阅相关试剂盒,仅发现能够检测mhc的某一部分试剂盒,例如专利cn101892317b中描述的i类a基因的2-4外显子、b基因的2-4外显子和drb1基因的2号外显子;专利cn105039332b描述的i类a、b、c三个基因的全长。结合大量文献研究,hla的i类基因多态性显著,在1-7号外显子上都显示出基因的多态性;ii类集中在drb1、dra1、dpa1、dpb1、dqa1、dqb1六个基因的2-4号外显子。目前,尚未发现有此类高范围覆盖mhc转录本的试剂盒的出现。
10.根据已有研究,bulk mhc基因型的差异也许也表现在单细胞层面,单细胞水平的基因表达分析在研究mhc与免疫疾病及肿瘤方面具有更显著的优势。但是目前市面上并无针对单细胞开发的hla分型检测试剂盒,文献中针对单细胞的hla分型研究大多数采用scrna-seq的数据,这样的数据如果需要得到准确的单细胞hla分型信息就需要较大的测序
数据量,增加了不必要的成本。
技术实现要素:
11.针对上述情况,本发明一种单细胞水平检测hla-i/ii类基因表达分型和表达量的试剂盒及使用方法,在单细胞转录组水平上,靶向hla的i类主要集中在a、b、c三个基因的1-6号外显子,ii类集中在drb1、dra1、dpa1、dpb1、dqa1、dqb1六个基因的1-4号外显子,开发出一种单细胞水平检测hla-i/ii类基因表达分型和表达量组合物及方法。该组合物及方法不仅能够高分辨率第全面检测mhc的相关基因,并且能够精准区分单个细胞中hla多态情况,具有十分重要的应用价值。
12.为实现以上目的,本发明具体方案如下:一种单细胞水平检测hla-i/ii类基因表达分型和表达量的试剂盒,包含以下内容:(a)用于hla-i/ii类基因捕获的hlatargetmix1;(b)用于hla-i/ii类基因捕获的hlatargetmix2;(c)用于hla-i/ii类基因捕获的pcr试剂;和(d)用于捕获后dna文库构建的试剂。
13.进一步的,所述内容(a)适用于携带单细胞信息的cdna样品,所述单细胞信息为1-50bp的核酸序列,位于cdna的5’端、中间、或3’端。
14.进一步的,所述内容(a)用于hla-i/ii类基因捕获的hlatargetmix1,由包含靶向hlai和靶向hlaii某一位置区域的多条寡聚核苷酸、共用寡聚核苷酸组合而成。
15.进一步的,所述内容(b)用于hla-i/ii类基因捕获的hlatargetmix2,由包含靶向hlai和靶向hlaii另一位置区域的多条寡聚核苷酸、共用寡聚核苷酸组合而成。
16.进一步的,所述hlatargetmix1由共用寡聚核苷酸5’引物、靶向hla-i的a、b、c基因的7号外显子的引物、hla-ii的drb1、dra1、dpa1、dpb1、dqa1、dqb1基因4号外显子的引物组成。
17.进一步的,所述hlatargetmix2由共用寡聚核苷酸5’引物、靶向hla-i的a、b、c基因的6或7号外显子的引物、hla-ii的drb1、dra1、dpa1、dpb1、dqa1、dqb1基因4号外显子另一区域的引物组成。
18.更进一步的,所述hlatargetmix2中hla-i和ii的靶向引物结合位点位于hlatargetmix1中hla-i和ii的靶向引物的内侧。
19.本发明中,所有引物的保护范围在专利所给出的目的基因引物结合位点上下200bp的范围内,即hla-a,b,c和hla-dpa,dpb,dqa,dqb,dra,drb靶向引物结合位点第一个核苷酸和最后一个核苷酸上下游200bp的范围。
20.进一步的,所述hlatargetmix1的hla-i的a、b、c基因的上游引物(target在1号外显子)hla-itargetmix1-f为:5
’‑
cagacgccgaggatggcc-3’,下游引物(target在7号外显子)hla-itargetmix1-r为:5
’‑
cagagccctgggcactgt-3’;所述hlatargetmix1的hla-ii的drb、dra、dpa、dpb、dqa、dqb基因的上游引物(target在1号外显子)hla-iitargetmix1-f为:dpa-1:5
’‑
atgcgccctgaagacagaatgt-3’;
dpb-1:5
’‑
atgatggttctgcaggtttctgc-3’;dqa-1:5
’‑
atgatcctaaacaaagctctg-3’;dqb-1:5
’‑
gaaraagkctttgcggatccc-3`;dra-1:5
’‑
atggccataagtggagtccc-3’;drb-1:5
’‑
gtgctgagctcccsactgg-3’。
21.所述hla target mix1的hla-ii的drb、dra、dpa、dpb、dqa、dqb基因的下游引物(target在4号外显子)hla-ii target mix1-r为:dpa-1:5
’‑
ttatgatgaggacggtgccc-3’;dpb-1:5
’‑
atgaagatgcccactccaca-3’;dqa-1:5
’‑
ccttccaggatgggattcacaat-3’;dqb-1:5
’‑
gatgataaggcccagcccaa-3’;dra-1:5
’‑
gcttttgcgcaatcccttgat-3’;drb-1:5
’‑
tcctgaagtagatgaacagccc-3’;更进一步的,所述hla target mix2的hla-i的a、b、c基因上游引物(target在1号外显子)hla-i target mix2-f为:5`-tggccctgaccsagacctg-3`;所述hla target mix2的hla-i的a、b、c基因下游引物(target在7号外显子)hla-i target mix2-r为:a-2:5
’‑
tcacactttacaagctgtga-3’;b-2:5
’‑
tgccagaggctcttgaagtc-3’;c-2:5
’‑
tgcagaaagagatgccagagg-3’;所述hla target mix2的hla-ii的drb、dra、dpa、dpb、dqa、dqb基因上游引物(target在1号外显子)hla-ii target mix 2-f为:dpa-1:5
’‑
atgcgccctgaagacagaatgt-3’;dpb-1:5
’‑
atgatggttctgcaggtttctgc-3’;dqa-1:5
’‑
atgatcctaaacaaagctctg-3’;dqb-1:5
’‑
gaaraagkctttgcggatccc-3’;dra-1:5
’‑
atggccataagtggagtccc-3’;drb-1:5;-gtgctgagctcccsactgg-3’;所述hla target mix2的hla-ii的drb、dra、dpa、dpb、dqa、dqb基因下游引物(target在4号外显子))hla-ii target mix2-r为:dpa-2:5
’‑
ttatgatgaggacggtgccc-3’;dpb-2:5
’‑
ccactccacagatgatgagc-3’;dqa-2:5
’‑
ttccaggatgggattcacaatgg-3’;dqb-2:5
’‑
gatgataaggcccagcccaa-3’;dra-2:5
’‑
taatgatgcccaccagaccca-3’;drb-2:5
’‑
tcctgaagtagatgaacagccc-3’。
22.一种单细胞水平检测hla-i/ii类基因表达分型和表达量的试剂盒的使用方法,包含以下步骤:(i)携带单细胞信息的cdna样品,hla-i/ii靶向第一次富集及纯化;
(ii)hla-i/ii靶向第一次富集及纯化所得产物的第二次富集及纯化;(iii)捕获文库构建。
23.进一步的,所述步骤(i)携带单细胞信息的cdna样品,hla靶向第一次富集及纯化,是将携带单细胞信息的单细胞cdna和hla-i/ii靶向富集组分(a)、pcr组分(c)分别加入反应管,在pcr仪器上进行第一次hla-i/ii靶向富集,并使用磁珠、离心柱、分离柱等方法对第一次靶向富集的产物进行纯化,去掉其中过量的oligo及pcr组分,即得到第一次靶向富集及纯化后的产物。
24.进一步的,所述步骤(ii)hla-i/ii靶向第一次富集及纯化所得产物的第二次富集及纯化,是将第一次靶向富集及纯化后得到的产物作为第二次靶向富集的模板,与hla-i/ii靶向富集组分(b)、pcr组分(c)加入反应管,在pcr仪器上进行第二次靶向富集,使用磁珠、离心柱、分离柱等方法对反应产物进行纯化,即得到第二次靶向富集及纯化后的产物。
25.进一步的,所述步骤(iii)捕获文库构建的步骤为:使用打断酶在合适的条件下对步骤(ii)获得的第二次靶向富集及纯化后的产物进行酶切打断、末端修复、3’端加a,之后用连接酶进行接头连接,再使用磁珠、离心柱、分离柱等方法对连接产物进行纯化,纯化后通过pcr将测序接头和sample index加在所得片段的两端,再用磁珠、离心柱、分离柱等方法对反应产物再次进行纯化,即得到测序文库。
26.一种单细胞水平检测hla-i/ii类基因表达分型和表达量建库试剂盒及使用方法,应用于hla-i/ii类基因的捕获文库构建。
27.有益效果:1.本发明基于单细胞水平 hla-i/ii的表达分型和表达量的试剂盒及使用方法,使得测序文库更加有针对性,能够充分展现每个细胞的hla多态性;2.本发明基于cdna的hla-i/ii类基因的表达水平的分型及定量,能够有效展示单细胞的表达过程中的hla组合状态,而非dna水平单细胞内含的hla状态;转录过程中的hla分型才能够真实反映细胞免疫状态;3.本发明充分包含hla-i/ii的9个基因的基因分型,基因数量多而全面,能够更加真实地评估单细胞的免疫状态;4.本发明方法简单有效,流程稳定。
附图说明
28.图1 单细胞水平检测hla-i/ii类基因的表达分型和表达量技术流程图。
29.图2 单细胞水平检测hla-i/ii类基因的表达分型和表达量的文库结构图。
30.图3 单细胞水平检测hla-i/ii类基因的表达分型和表达量的分型结果图。
31.图4单细胞水平检测hla-i/ii类基因的表达分型和表达量的分型表达量统计图。
32.图5单细胞水平检测hla-i/ii类基因的表达分型和表达量的单细胞水平分布图。
33.图6所得某一hla亚型在不同单细胞水平分布统计图。
具体实施方式
34.为了更好地理解本发明,下面结合实施例进一步阐明本发明的内容,但本发明的内容不仅仅局限于下面的实施例。
35.实施例1 人类白细胞抗原hla在单细胞水平上的基因检测、分型及表达量评估(具体技术流程可参见图1)1.1 带细胞来源标记和分子标签cdna的获得及扩增此步骤需要用到携带单细胞信息的cdna样品,为了充分展示本发明的有益效果及本实验室的条件,本发明选择10x genetics平台的10x chromium single cell v(d)j reagent kits(v1.0)试剂盒获得的cdna产物作为初始投入样品。具体过程按照其说明书步骤得到扩增后的带细胞来源标记和分子标签cdna,样本来源可以是人的新鲜血液,新鲜及冻存组织等。扩增后的cdna需要用agencourt ampure xp beads用1x的浓度按照说明书进行纯化,去除杂质,纯化后的cdna需要用qubit检测浓度。
36.本实施例中,当检测到的cdna浓度达到1ng/ul及以上即可。所得到的纯化后的cdna可以在4℃保存72h,或在-20℃长期保存,避免反复冻融。
37.的靶向捕获及扩增1.2.1 hla-i/ii 第一次靶向富集:一次靶向富集使用hieff
®ꢀ
multiplex pcr kit,按照说明书将第一次富集所需要的pcr组分、通过10x 平台方法得到的扩增后cdna、5’端通用上游引物(与模板cdna的5’端携带的通用序列对应)和hla-i/ii target mix1中的下游引物组合分别加入反应管,在pcr仪器上按如下表1条件进行第一次靶向富集:表11.2.2 hla-i/ii第一次靶向富集后产物纯化:使用0.8x agencourt ampure xp beads磁珠按照说明书上的方法对反应产物进行纯化,去掉其中过量的oligo及pcr组分,获得第一次富集产物。
38.1.2.3 hla-i/ii第二次靶向富集:将纯化后的第一次富集产物分别加入反应管,使用hieff
®ꢀ
multiplex pcr kit,按照说明书在pcr仪器上按如下表2条件进行第二次靶向富集,第二次靶向富集上游引物仍然使用5’端通用上游引物,下游引物使用hla-i/ii target mix2中的下游引物组合:表2
1.2.4 hla-i/ii第二次靶向富集后产物双端纯化:使用0.5x和0.8x agencourt ampure xp beads磁珠按照说明书上的方法对反应产物进行纯化,筛选出所需长度的片段。
39.富集产物质检:富集产物使用agilent tapestation检测峰图,并检测qubit浓度。富集产物可在4℃保存72h,或在-20℃保存一周。
40.适用于illumina platform的二代测序文库建立及质检测序文库制备及纯化:使用打断酶在合适的条件下对富集dna酶切打断、末端修复、3’端加a,之后用连接酶进行接头连接,再使用0.8x agencourt ampure xp beads对连接产物进行纯化,之后通过pcr将测序接头和sample index加在片段的两端,再用0.8x agencourt ampure xp beads对反应产物纯化一次,即得到测序文库。
41.得到的二代测序文库需用qpcr进行定量,用使用qubit检测文库浓度,agilent tapestation screen tape and reagents检测产物片段大小(图2)。
42.实施例2 人类基因组dna水平上通过捕获方法获得hla基因分型2.1 人类基因组dna(gdna)的获得使用qiagen qiaamp dna mini kit 按照说明书的方法提取gdna,样本类型可以是新鲜或冻存的全血、新鲜或冻存的组织块、ffpe等。提取的gdna应使用nanodrop 检测纯度和浓度,浓度需达到50ng/ul以上,纯度od260/od280为1.8左右。
43.及hla-ii类基因的靶向捕获及扩增2.2.1 hla-i/ii 第一次靶向富集按照kapa hifi hotstart ready mix pcr kit的说明书将第一次富集所需要的pcr组分及模板cdna分别加入反应管,在pcr仪器上按如下表3条件进行第一次靶向富集,引物使用hla-i/ii target mix1-f和hla-i/ii target mix1-r组合。
44.表3
2.2.2 hla-i/ii第一次靶向富集后产物纯化:使用0.8x agencourt ampure xp beads磁珠按照说明书上的方法对反应产物进行纯化,去掉其中过量的oligo及pcr组分,获得第二次靶向富集的模板。
45.2.2.3 hla-i/ii第二次靶向富集:按照kapa hifi hotstart ready mix pcr扩增试剂盒的说明书将纯化后的第一次富集产物分别加入反应管,在pcr仪器上按如下表4条件进行第二次靶向富集,引物使用hla-i/ii target mix 2-f和hla-i/ii target mix 2-r组合。
46.表42.2.4 hla-i/ii第二次靶向富集后产物双端纯化:使用0.5x和0.8x agencourt ampure xp beads磁珠按照说明书上的方法对反应产物进行纯化,筛选出正确长度的片段。
47.2.2.5富集产物质检:富集产物使用agilent tapestation检测峰图,并检测qubit浓度。富集产物可在4℃保存72h或在-20℃保存一周。
48.适用于illumina platform的二代测序文库建立及质检按照“实施例1”中“1.3 适用于illumina platform的二代测序文库建立及质检”的反应体系及反应条件进行目的片段打断,末端修复,3’端加a,加接头及sample index,获得的文库需用agencourt ampure xp beads进行片段分选,得到的文库需用qpcr进行定量,用agilent tapestation screen tape and reagents检测产物片段大小。
49.实施例3 不同方法获得的原始下机数据进行hla基因分型及表达量分析3.1 原始下机fastq数据预处理原始下机fastq数据按照既往生信分析经验,采用fastqc、fastp、trimmatic、bowtie2等软件,对数据进行初始质控,去除低质量数据,去除接头,比对到参考基因组,并质控比对后数据质量。
50.分型分析利用cellranger、hla-vbseq等软件,构建单细胞matrix,并对hla进行分型并统计表达量。
51.不同方法所得hla结果对比分析不同方法所得hla分型及表达量结果,采用端对端的方式一一对比分析,分析结果见图3-6。
52.本发明一种单细胞水平检测hla-i/ii类基因的表达分型和表达量的组分及方法,使得测序文库更加有针对性,能够充分展现每个细胞的hla多态性;基于cdna的hla-i和
hla-ii的捕获建库试剂盒,能够有效展示单细胞的表达过程中的hla组合状态,而非dna水平单细胞内含的hla状态;转录过程中的hla分型才能够真实反映细胞免疫状态;充分包含hla-i和hla-ii的9个基因的基因分型,基因数量多而全面,能够更加真实地评估单细胞的免疫状态。
53.以上实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此为限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
转载请注明原文地址:https://tc.8miu.com/read-800.html