一种用于近视左眼球镜筛查的SNP标志物及其应用的制作方法

    专利查询2022-08-20  99


    一种用于近视左眼球镜筛查的snp标志物及其应用
    技术领域
    1.本发明属于生物医药领域,涉及一种用于近视左眼球镜筛查的snp标志物及其应用。


    背景技术:

    2.眼科疾病是指发生在眼部区域的疾病,常见眼科疾病有近视、散光、白内障、青光眼、中心浆液性视网膜病变、干眼症、交感性眼炎、夜盲症、弱视、沙眼、糖尿病视网膜病变、结膜炎、老花眼、色盲、视网膜色素变性、视网膜中央动脉阻塞、视网膜脱落、远视、针眼、雪盲症、霰粒肿、飞蚊症等。在调节放松的状态下,平行光线经眼球屈光系统后聚焦在视网膜之前,称为近视。
    3.屈光度是指屈光不正状态下所产生的度数大小,当屈光度发生时,一般多代表近视、散光、远视或是弱视等临床表现,近视、远视通常为球镜(s),散光为柱镜(c),目前采用等效球镜度数(spherical equivalent refraction,se)评价屈光度,等效球镜度数=球镜度数 散光度数*1/2。屈光度≤-0.50d可作为近视诊断的循证共识阈值。更具体地,近视的定义是当调节放松时,眼睛的等效球镜屈光不正≤-0.5d的情况。高度近视的定义是当调节放松时,眼睛的等效球镜屈光不正≤-6.00d的情况。低度近视的定义是当调节放松时,眼睛的等效球镜屈光不正≤-0.5且》-6.00d的情况。
    4.近视作为一种全球高发性疾病近年来受到国内外越来越多的关注,预计到2050年,近视将影响到全球近50%的人口,同时高度近视也将影响到全球近10%的人口。
    5.同时,近视也是目前影响我国青少年人群视觉健康的主要眼病,其中高度近视是引起我国眼病患者眼盲和低视力的主要原因之一,将给患者及其家庭带来严重的经济负担。对于孩子视力问题,预防很重要,而早发现、早干预、早治疗,是防止近视度数加深的关键。少年儿童时期的眼病对视力发育危害极大,及早发现和诊断影响视力的非屈光不正性眼病非常重要,许多的眼病如果不能得到及时的发现和治疗,将造成眼睛的终生残疾。虽然通过药物、光学治疗和行为矫正可以部分减缓其加深速度,但我们距离能够逆转过去几十年的趋势还有很长的路要走。这使得近视及其相关并发症成为了研究的重中之重。高度近视的发生涉及多因素复杂过程,发病机制仍不清楚,当下的各种光学矫正手段以及手术治疗方法,如屈光手术和巩膜加固手术,不能从根本上阻止及延缓高度近视眼底病变的发展,可以说目前缺乏行之有效的高度近视的治疗措施。由此可见,寻找更有效的方法对高度近视患者和高危人群进行早期检测、风险预测和早期干预具有重要的临床意义。
    6.单核苷酸多态性(single nucleotide polymorphisms,snp)是指在基因组水平上单个碱基的转换、颠换或由碱基的插入、缺失引起核苷酸变异导致的dna序列多态性,是人类可遗传的变异中最常见的一种,占所有已知多态性的80%以上,人群中变异频率高于1%,这也是区别于点突变的一个重要因素。在遗传学分析中,snps具有高频、稳定和易分析等特点。研究发现,snps与近视的发生发展具有较强的关联性。snps检测主要方法有时间飞行质谱(maldi-tofms)技术、荧光定量pcr技术、基因芯片技术、变形高效液相色谱等。
    7.随着高通量snp检测技术方法的出现,作为数量最多且易于批量检测的多态标记,snp在连锁分析与基因定位,包括复杂疾病的基因定位、关联分析、个体和群体对环境致病因子与药物的研究中将发挥愈来愈重要的作用。随着技术的发展,snp检测费用也越来越经济,snp标志物将成为新一代分子标记。


    技术实现要素:

    8.本发明提供了一种用于近视筛查的snp位点,所述snp位点包括以下任一组的位点组合:
    9.1)rs12549018、rs529268660、rs3741990、rs34649612、rs2452524、rs57747888、rs77561511、rs78422130、rs2073194、rs9981301、rs4624474、rs5845912、rs8137790;
    10.2)rs377223831、rs146160422、rs12129653、rs16861256、rs7542316、rs2231241、rs2231240、rs10911390、rs10911392、rs12045762、rs16861394、rs6661715、rs150943357、rs192688643、rs76657333、rs79162067、rs4387990、rs1981745、rs17466625、rs139051035、rs61732380、rs17029087、rs3817083、rs10026790、rs2718684、rs186309103、rs7717970、rs12519352、rs11133847、rs2304068、rs3734056、rs139635794、rs4959012、rs757262、rs757259、rs17181352、rs12549018、rs529268660、rs145293869、rs573212、rs117628421、rs139337135、rs522328、rs2228149、rs3751031、rs145854081、rs1042833、rs12228215、rs12811832、rs2305901、rs61941459、rs3741990、rs34649612、rs1060474、rs7157977、rs2277533、rs2452524、rs4904、rs2447927、rs1657074、rs1059676、rs9929443、rs113276760、rs732109、rs11260004、rs11882197、rs10411624、rs13535、rs2217652、rs2241356、rs74351326、rs4804105、rs57747888、rs397764300、rs16015、rs2286663、rs34364867、rs117237657、rs189041504、rs77561511、rs78422130、rs7258847、rs862708、rs4815467、rs2073194、rs6076122、rs78661674、rs2183573、rs9981301、rs4624474、rs9607524、rs5845912、rs9628315、rs8137790、rs76476219;
    11.3)rs28566954、rs377223831、rs41274480、rs146160422、rs16830693、rs1051097、rs12129487、rs12129653、rs12403630、rs58464768、rs148811681、rs41305862、rs17553619、rs71637410、rs16861256、rs7542316、rs7531786、rs2231241、rs2231240、rs10911390、rs10911391、rs10911392、rs12045762、rs16861394、rs6661715、rs138246957、rs182522436、rs13374714、rs13375853、rs2275856、rs6676149、rs3754234、rs2273584、rs6696123、rs11583387、rs3768066、rs3820553、rs1063128、rs3738521、rs76576389、rs150943357、rs34363861、rs117712357、rs71423514、rs76709099、rs192688643、rs151056400、rs116828761、rs28538922、rs138467334、rs115586700、rs76657333、rs143137431、rs79162067、rs75054661、rs4387990、rs117336796、rs145158569、rs12630803、rs3774765、rs1800766、rs74737650、rs1981745、rs17466625、rs12330397、rs139051035、rs10019009、rs61732380、rs17029087、rs3817083、rs10026790、rs11944752、rs1800591、rs3816873、rs2718684、rs7677415、rs3796936、rs3828506、rs186309103、rs11556167、rs9790356、rs9790628、rs4956981、rs13171103、rs4956987、rs7717970、rs12519352、rs11133847、rs117918201、rs26675、rs1697144、rs2304068、rs147518598、rs57930479、rs140779761、rs74403861、rs3734056、rs139635794、rs10900967、rs1611212、
    rs28400887、rs9261424、rs4959012、rs757262、rs757259、rs929156、rs3888778、rs75541627、rs117340770、rs9468812、rs60399658、rs189316271、rs186815309、rs11966699、rs73733155、rs3800023、rs2273264、rs6933125、rs17181352、rs8191890、rs142944427、rs1802846、rs1131372、rs3807589、rs200730019、rs17138865、rs17545405、rs775410128、rs555905346、rs6945709、rs2074690、rs200506987、rs3739308、rs3735959、rs145988500、rs6558165、rs6558166、rs149587418、rs55991828、rs151304651、rs77428666、rs141149968、rs12549018、rs529268660、rs7003945、rs200070447、rs1815549、rs139669465、rs145293869、rs1627784、rs573212、rs28369760、rs185006838、rs117628421、rs75361513、rs41415046、rs139337135、rs522328、rs515182、rs482712、rs10760500、rs2228149、rs34630110、rs703075、rs9337951、rs906220、rs906221、rs145472189、rs146884162、rs188054898、rs541533723、rs552775933、rs146804890、rs2280134、rs36088476、rs4757987、rs2986407、rs7808、rs3751031、rs4645933、rs139692587、rs76958954、rs145854081、rs5744247、rs202199158、rs117855259、rs117414825、rs2291075、rs117665966、rs1042833、rs17487041、rs12228215、rs12811832、rs11168338、rs138189784、rs75577568、rs2306436、rs369302829、rs2305901、rs61941459、rs3741990、rs34649612、rs1248046、rs145055159、rs117478978、rs200011804、rs150666338、rs1060474、rs10139379、rs8008670、rs8009789、rs8022395、rs7155123、rs199627749、rs7157977、rs79020288、rs183718030、rs9972231、rs563363438、rs2277533、rs2452524、rs78309240、rs4904、rs77707876、rs1545119、rs3748380、rs200336355、rs2745136、rs60526088、rs2738893、rs1054645、rs2447927、rs1657074、rs370627229、rs2301770、rs1059676、rs9929443、rs55969568、rs71220135、rs16943483、rs11859725、rs113276760、rs5818479、rs71395334、rs78806449、rs1043592、rs17682036、rs144911043、rs16971620、rs540183826、rs16973424、rs146684394、rs80345815、rs732109、rs79712753、rs28424873、rs189184481、rs61735591、rs7251165、rs146083008、rs147472740、rs4134853、rs11260004、rs117622602、rs11882197、rs10411624、rs13535、rs2217652、rs3826783、rs2230752、rs2241356、rs74351326、rs1978713、rs4804105、rs57747888、rs397764300_rs58960485、rs139817982、rs16015、rs151309111、rs2286663、rs34364867、rs117237657、rs189041504、rs1865094、rs2233156、rs2302987、rs148509022、rs188387562、rs407731、rs406968、rs388706、rs12052105、rs3745403、rs34604090、rs77561511、rs35336528、rs78422130、rs7258847、rs862708、rs2361119、rs4801478、rs4815467、rs2073194、rs6076122、rs78661674、rs11546155、rs114985890、rs2236001、rs3989369、rs8127537、rs2225425、rs2410104、rs1041439、rs2183573、rs1984748、rs9981301、rs4624474、rs1051367、rs2073733、rs885985、rs1803545、rs148650930、rs2072012、rs9607524、rs17523588、rs17848337、rs73165153、rs5845912、rs9628315、rs8137790、rs76476219、rs55861809、rs68178377。
    12.本发明还提供了检测前面所述的snp位点基因型的试剂;优选地,所述试剂包括扩增snp位点的试剂。
    13.本发明还提供了一种检测前面所述的snp位点基因型的试剂盒,所述试剂盒包含前面所述的试剂。
    14.snp位点的基因型可通过本领域中可得到的任何确立的方法来检测,包括但不限于,等位基因特异性杂交(ash)、单核苷酸延伸的检测、阵列杂交(任选地包括ash)、或其它检测单核苷酸多态性(snp)的方法、扩增片段长度多态性(aflp)检测、扩增可变序列检测、随机扩增的多态性dna(rapd)检测、限制性片段长度多态性(rflp)检测、自主序列复制检测、简单序列重复(ssr)检测、单链构象多态性(sscp)检测、同功酶标志物检测、northern分析、mrna或cdna的定量扩增等等。
    15.snp位点的基因型检测技术利用探针核酸与对应于该标志物的核酸的杂交。包括但不限于液相、固相、混合相、或原位杂交分析的杂交形式可用于等位基因检测。
    16.可以克隆和/或合成标志物基因座的核酸探针。任何合适的标记(label)可以与用于本发明的探针一起使用。适于和核酸探针一起使用的可检测的标记包括,例如,通过分光镜方法、放射性同位素方法、光化学方法、生化方法、免疫化学方法、电学方法、光学方法或化学方法可检测的任何组合物。有用的标记包括用于用标记的链霉亲和素偶联物染色的生物素、磁珠、荧光染料、放射性标记、酶、和量热标记物。其它的标记物包括结合至用荧光团、化学发光试剂和酶标记的抗体的配体。探针还可以组成用于产生放射性标记的扩增子的放射性标记pcr引物。用于标记核酸的标记策略和相应的检测策略可在例如haugland(2003)handbook of fluorescent probes and research chemicals ninth edition by molecular probes,inc.(eugene oreg.)中找到。
    17.snp还可以利用合适的基于pcr的检测方法检测,其中pcr扩增子的大小或序列指示了snp的不存在或存在。在这类方法中,pcr引物杂交至多态性区域侧翼的保守区域。
    18.用于本发明的合适引物可以使用任何合适的方法进行设计并合成。例如,寡核苷酸可以根据beaucage和caruthers(1981)描述的固相亚磷酰胺三酯法来化学合成,例如,使用市售的自动合成器,例如在needham-vandevanter等人(1984)中所描述的。寡核苷酸包括修饰的寡核苷酸,也可以从技术人员已知的各种商业来源处订购。任何核酸可以从任何各种商业来源定购,例如the midland certified reagent company(mcrcoligos.com)、the great american gene company(www.genco.com)、expressgen inc.(www.expressgen.com)、operon technologies inc.(alameda,calif.)和很多其它的。本文中鉴定的多态性的侧翼序列是公开可得的;因此,可以基于非常明白的碱基配对原则来构建合适的扩增引物。例如,通过杂交、阵列杂交、pcr、实时pcr、lcr等等来对任何扩增子的序列进行检测。
    19.在一些实施方式中,本发明的引物是放射性标记的,或通过任何合适的手段(例如,使用非放射性荧光标签)来标记,以允许在扩增反应之后不同大小扩增子的快速显现而无需任何其它的标记步骤或显现步骤。在一些实施方式中,引物没有被标记,并且在大小分辨之后,例如在琼脂糖或丙烯酰胺凝胶电泳之后使扩增子显现。在一些实施方式中,大小分辨之后的pcr扩增子溴化乙锭染色使得不同大小的扩增子显现。
    20.不意在将本发明的引物限制于产生任何特定大小的扩增子。例如,用来扩增本文中标志物基因座和等位基因的引物并不限制于扩增相关基因座的整个区域、或任何其亚区域。引物可以产生任何合适长度的扩增子用于检测。在一些实施方式中,标记物扩增产生长度为至少20个核苷酸,或者,长度为至少50个核苷酸,或者,长度为至少100个核苷酸,或者,长度为至少200个核苷酸的扩增子。可以使用本文所述的各种技术来检测任何大小的扩增
    子。碱基组成或大小的不同可以通过例如电泳的传统方法来检测。
    21.本发明还提供了一种近视诊断模型的构建方法,所述构建方法包括:1)检测受试者样本中前面所述的snp位点的基因型;2)利用数据挖掘方法对结果分析从而获得所述近视诊断模型。
    22.使用本发明的snp位点诊断近视时,可使用能够通过学习snp位点信息来诊断近视的数据挖掘方法。优选地,本发明诊断近视的方法可使用反向斑点杂交法和/或人工智能分析方法。
    23.进一步,所述人工智能方法包括线性回归、逻辑回归、神经网络分析、决策树、决策规则、规则拟合、支持向量机。
    24.本发明的近视诊断模型可包括诊断部、分类部及加权值赋予部,上述诊断部将从患者的遗传突变信息接收部接受到的突变信息用作输入信息,上述分类部可以使用神经网络作为分类器来执行对疾病进行分类的过程,上述加权值赋予部可通过对分类结果赋予加权值来诊断近视。
    25.神经网络分析是指一种通过构建一个以上的层(layer)并基于多个数据来执行判断的系统。例如,在神经网络分析中,输入层是将基因是否突变的信息作为数据输入到神经网络分析模型中的层,输出层是可以基于输入的各种信息并通过判断患者是否有近视来输出结果的层。隐层是可通过对各种判断标准(基因突变信息)赋予加权值来执行确认是否存在患者的过程(process)的层。
    26.在本发明的具体实施方案中,所述人工智能方法是逻辑回归。
    27.在本文中使用的“逻辑回归”(logistic regression)是指通过将数据拟合至逻辑曲线来预测事件发生的可能性的方法。本领域的技术人员将会理解怎样在本发明的背景中使用该方法。
    28.本发明还提供了一种近视评估系统,所述评估系统包括数据识别单元,所述数据识别单元基于前面所述的构建方法获得的近视诊断模型对待评估对象进行近视情况的有效识别。
    29.优选地,所述评估系统还包括数据收集单元:对待评估对象进行数据收集,所述数据包括snp数据。
    30.优选地,所述评估系统还包括模型创建单元:按照前面所述的构建方法创建近视诊断模型。
    31.优选地,所述评估系统还包括模型优化单元:对所述近视诊断模型进行优化。
    32.本发明还提供了一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以运行前面所述的近视诊断模型。
    33.本发明还提供了一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行如前面所述的近视诊断模型。
    34.应当理解,本文使用的“系统”、“装置”、“单元”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
    35.所属技术领域的技术人员知道,本发明可以实现为设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括
    固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“单元”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
    36.可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件,或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
    37.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
    38.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
    39.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
    40.本发明还提供了一种应用,所述应用包括以下任一项:
    41.1)前面所述的snp位点在制备诊断近视或预测左眼球镜进展风险的产品中的应用;优选地,所述产品包括检测试剂、检测试剂盒、诊断模型、评估系统、计算机程序产品、计算机可读存储介质;
    42.优选地,所述检测试剂如前面所述;
    43.优选地,所述检测试剂盒如前面所述;
    44.优选地,所述诊断模型根据前面所述的构建方法获得;
    45.优选地,所述评估系统如前面所述;
    46.优选地,所述计算机程序产品如前面所述;
    47.优选的,所述计算机可读存储介质如前面所述。
    48.2)利用前面所述的构建方法获得的诊断模型在制备诊断近视或预测左眼球镜进展风险的产品中的应用;
    49.优选地,所述产品包括评估系统、嵌入列线图的载体、计算机程序产品、计算机可
    读存储介质;
    50.优选地,所述评估系统如前面所述;
    51.优选地,所述计算机程序产品如前面所述;
    52.优选的,所述计算机可读存储介质如前面所述。
    附图说明
    53.图1显示诊断效能图。
    具体实施方式
    54.下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
    55.实施例1样本的收集、测序及数据分析
    56.样本的纳入标准:
    57.1)最差眼的等效球镜小于等于-6.00d;
    58.2)年龄6岁-18岁;
    59.3)无其他眼部疾病、先天性遗传病、其他全身性疾病和身体异常;
    60.4)没有眼部手术史;
    61.5)中国人;
    62.6)自愿参加且签署知情同意书。
    63.本发明是对2019年-2020年与温州医科大学附属眼视光医院与温州市政府合作开展的温州市全市中小学生近视筛查和干预项目的样本信息进行了整理,召集了符合上述纳入标准的10348(9852
    ‑‑
    8961)样本进行全外显子组的测序,记录他们左眼球镜(lsph)。同时,对这10348例高度近视患者进行全外显子组测序,获取全外显子组的snp,通过全外显子组关联分析获取性状相关的snp。
    64.具体实验步骤如下:
    65.实施例以标准操作程序(sop)采集符合标准的口腔黏膜样本,系统收集并随访符合纳入标准的病人,使用illumina novaseq6000测序系统,对全外显子进行测序,检测全外显子范围的snp,挖掘与高度近视人群左眼球镜(lsph)相关的snp标志物及其组合,并构建预测左眼球镜(lsph)进展风险的模型。
    66.1、采集口腔黏膜拭子:样本采集前半小时停止进食和饮水,以保证样本不受污染。采集后的口腔黏膜拭子放入灭菌的1.5ml ep管中,填好送检登记表常温运输到公司交于专业人员进行口腔黏膜拭子基因组dna提取。
    67.2、dna提取:使用tianamp swab dna kit从口腔黏膜拭子当中提取得到基因组dna,具体步骤如下:
    68.(1)将口腔黏膜拭子转置于2ml离心管中,用剪刀将棉签部分从其杆上剪下,加入400μl缓冲液ga。
    69.(2)加入20μl proteinase k溶液,涡旋10秒混匀,56℃放置60分钟,其间每15分钟
    涡旋混匀数次。
    70.(3)加入400μl缓冲液gb,充分颠倒混匀,70℃放置10分钟。此时溶液应变清亮,简短离心以去除管盖内壁的液滴,然后挤压去除拭子,将尽可能多的裂解液转移至新的离心管中。
    71.(4)加入200μl无水乙醇,充分颠倒混匀,简短离心以去除管盖内壁的液滴
    72.(5)将上一步所得溶液和絮状沉淀都加入一个吸附柱cr2中(吸附柱cr2放入收集管中),12,000rpm(~13,400
    ×
    g)离心30秒,倒掉收集管中的废液,将吸附柱cr2放回收集管中。
    73.(6)向吸附柱cr2中加入500μl缓冲液gb(使用前请先确认是否已加入无水乙醇),12,000rpm(~13,400
    ×
    g)离心30秒,倒掉收集管中的废液,将吸附柱cr2放回收集管中。
    74.(7)向吸附柱cr2中加入700μl漂洗液pw(使用前请先确认是否已加入无水乙醇),12,000rpm(~13,400
    ×
    g)离心30秒,倒掉收集管中的废液,将吸附柱cr2放回收集管中。
    75.(8)重复操作步骤7。
    76.(9)12,000rpm(~13,400
    ×
    g)离心2分钟,倒掉废液,将吸附柱cr2室温放置数分钟,以彻底晾干吸附材料中残余的漂洗液。
    77.(10)将吸附柱cr2转入一个干净的离心管中,向吸附膜中间位置悬空滴加20-50μl洗脱缓冲液tb,室温放置2-5分钟,12,000rpm(~13,400
    ×
    g)离心2分钟。
    78.(11)使用琼脂糖凝胶电泳和紫外分光光度计检测dna片段的浓度与纯度。dna在od260处有显著吸收峰,od260值为1相当于50μg/ml双链dna、40μg/ml单链dna。纯度(od 260/280)在1.7-1.9。单个样本通常可以得到0.5-3.5μg的dna。
    79.3、构建预文库:使用酶学方法将50ng基因组dna打断为200bp左右的小片段,之后进行末端修复和3’端加a操作,随后dna片段连接含barcode序列的测序接头,选择回收约320bp的片段,经过pcr扩增后获得预文库。
    80.4、液相杂交捕获操作:参照idt的xgen exome research panel v1.0(integrated dna technologies,san diego,usa)的标准流程,对预文库进行液相杂交捕获操作。
    81.5、获得外显子文库:捕获产物洗脱回收后,进行pcr扩增和纯化即获得外显子文库。文库用qpcr方法进行定量,并使用agilent 2100对条带大小做检测。
    82.6、illumina novaseq6000测序:使用illumina novaseq6000测序系统,对外显子文库进行150pe测序,原始图像使用casava v1.82软件进行碱基识别,生产原始测序数据。
    83.7、比对人类参考基因组:使用burrows-wheeler aligner(bwa)工具将测序片段比对到人类参考基因组(ucsc hg19),使用picard v1.57去除pcr重复序列。采用软件gatk进行变异检测,并对测序深度、覆盖深度及均一性等进行统计。
    84.8、数据质量控制
    85.对于样本:删除口腔拭子取样量不足,检出率小于90%,平均覆盖度小于10,平均基因型存在概率小于65%,基因型杂合率平均值偏离
    ±
    4标准差(sd),染色体异常、性别异常,具有亲缘关系和非东亚人群的样本。对于snp:将未通过vqsr质量控制的全外显子组检测结果,基因型检出率小于90%,哈代温伯格p值小于1e-06,变异allele数目(ac)为0的snp。
    86.9、统计分析方法
    87.通过snptest中的贝叶斯检验(bayesian tests)开展高度近视全外显子组数量性状研究,鉴定潜在的与高度近视临床状态显著相关的snp和基因。数量性状的bayesian tests是通过使用期望基因型(-method expected)的线性模型的共轭先验公式进行的。对于加性模型,公式为:
    88.yi=βgi ei,ei~n(0,σ2)。
    89.其中yi是第i个个体的残差表型。残差表型是通过减去一个基线项和估计任何指定的协变量来计算的。gi为第i个个体的预期基因型的加性编码,野生纯合型=“0”,杂合型=“1”,突变纯合型=“2”。
    90.σ2是模型的误差方差。并且σ2~ig(a,β),β~n(m
    β
    ,v
    β
    σ2),默认的a=3,β=2,m
    β
    =0,v
    β
    =0.02。将年龄和性别作为协变量进行校正。
    91.实验结果
    92.1、snps选择:
    93.利用snptest获取了8961个高度近视样本中共89095个常见变异与数量性状左眼球镜(lsph)的全基因组关联关系。
    94.通过3种阈值分别筛选snps进行建模:log10(bf)》2;log10(bf)》1.5;log10(bf)》1。
    95.2、原始snps基因型谱获取:
    96.利用python提取vcf中对应所需snps,选择加性模型(未突变设置为0,突变一个等位为1,突变两个等位为2),获取原始的snp基因型谱。
    97.3、snps基因型谱补缺失:
    98.计算原始snps基因型谱中每个样本中snps的缺失数目,如果缺失》5%(n_缺失/n_allsamples),去除对应的样本。对于缺失情况《5%的样本,利用人工神经网络进行补缺失。
    99.人工神经网络共三层,包括输入层,隐藏层以及输出层:输入层节点数为len(label_data),也就是完全没有缺失的snp;隐藏层设置20个节点;输出层设置3个节点;设置学习率为0.003,训练迭代次数设置为20次。
    100.4、分类模型:logistic regression
    101.1)根据数量性状左眼球镜(lsph),取不同阈值,分别建立模型,并考察auc值,取auc最大的模型的阈值作为最终分类模型的阈值。
    102.规则如下:
    103.①
    遍历左眼球镜(lsph)的所有值,分别作为阈值将样本分为两组;
    104.②
    每组样本数量不得少于100。
    105.2)利用逻辑回归对样本进行分类,参数如下:
    106.logisticregression(c=100,class_weight='balanced',dual=false,
    107.fit_intercept=true,intercept_scaling=1,max_iter=10,
    108.multi_class='ovr',n_jobs=1,penalty='l1',random_state=0,
    109.solver='liblinear',tol=0.0001,verbose=0,warm_start=false)
    110.尽管它的名字是逻辑回归,但它是一种用于分类而不是回归的线性模型。
    111.逻辑回归默认情况下会应用正则化。这才机器学习中很常见,其一个优点就是提高了数值的稳定性,没有正则化相当于把c设置为非常高的值。
    112.作为一个优化问题,二进制类l2惩罚逻辑回归最小化以下成本函数:
    [0113][0114]
    相似的,l1正则化逻辑回归解决以下优化问题:
    [0115][0116]
    利用sklearn.model_selection函数,选择0到100中的10个随机数字作为随机种子,分别将样本划分为10组训练集和验证集,进行10倍交叉验证,取10次结果的平均数作为模型结果,以保证模型的客观性,各模型的cutoff值及其auc值如表1所示。
    [0117]
    表1各模型的cutoff值及其auc值
    [0118][0119]
    以上表格中,所述model 2(logbf》2)所对应的snp组合为:
    [0120]
    rs12549018、rs529268660、rs3741990、rs34649612、rs2452524、rs57747888、rs77561511、rs78422130、rs2073194、rs9981301、rs4624474、rs5845912、rs8137790;
    [0121]
    以上表格中,所述model 3(logbf》1.5)所对应的snp组合为:
    [0122]
    rs377223831、rs146160422、rs12129653、rs16861256、rs7542316、rs2231241、rs2231240、rs10911390、rs10911392、rs12045762、rs16861394、rs6661715、rs150943357、rs192688643、rs76657333、rs79162067、rs4387990、rs1981745、rs17466625、rs139051035、rs61732380、rs17029087、rs3817083、rs10026790、rs2718684、rs186309103、rs7717970、rs12519352、rs11133847、rs2304068、rs3734056、rs139635794、rs4959012、rs757262、
    rs757259、rs17181352、rs12549018、rs529268660、rs145293869、rs573212、rs117628421、rs139337135、rs522328、rs2228149、rs3751031、rs145854081、rs1042833、rs12228215、rs12811832、rs2305901、rs61941459、rs3741990、rs34649612、rs1060474、rs7157977、rs2277533、rs2452524、rs4904、rs2447927、rs1657074、rs1059676、rs9929443、rs113276760、rs732109、rs11260004、rs11882197、rs10411624、rs13535、rs2217652、rs2241356、rs74351326、rs4804105、rs57747888、rs397764300(同rs58960485)、rs16015、rs2286663、rs34364867、rs117237657、rs189041504、rs77561511、rs78422130、rs7258847、rs862708、rs4815467、rs2073194、rs6076122、rs78661674、rs2183573、rs9981301、rs4624474、rs9607524、rs5845912、rs9628315、rs8137790、rs76476219;
    [0123]
    以上表格中,所述model 4(logbf》1)所对应的snp组合为:
    [0124]
    rs28566954、rs377223831、rs41274480、rs146160422、rs16830693、rs1051097、rs12129487、rs12129653、rs12403630、rs58464768、rs148811681、rs41305862、rs17553619、rs71637410、rs16861256、rs7542316、rs7531786、rs2231241、rs2231240、rs10911390、rs10911391、rs10911392、rs12045762、rs16861394、rs6661715、rs138246957、rs182522436、rs13374714、rs13375853、rs2275856、rs6676149、rs3754234、rs2273584、rs6696123、rs11583387、rs3768066、rs3820553、rs1063128、rs3738521、rs76576389、rs150943357、rs34363861、rs117712357、rs71423514、rs76709099、rs192688643、rs151056400、rs116828761、rs28538922、rs138467334、rs115586700、rs76657333、rs143137431(同rs368878844)、rs79162067、rs75054661、rs4387990、rs117336796、rs145158569、rs12630803、rs3774765、rs1800766、rs74737650、rs1981745、rs17466625、rs12330397、rs139051035、rs10019009、rs61732380、rs17029087、rs3817083、rs10026790、rs11944752、rs1800591、rs3816873、rs2718684、rs7677415、rs3796936、rs3828506、rs186309103、rs11556167、rs9790356、rs9790628、rs4956981、rs13171103、rs4956987、rs7717970、rs12519352、rs11133847、rs117918201、rs26675、rs1697144、rs2304068、rs147518598、rs57930479、rs140779761、rs74403861、rs3734056、rs139635794、rs10900967、rs1611212、rs28400887、rs9261424、rs4959012、rs757262、rs757259、rs929156、rs3888778、rs75541627、rs117340770、rs9468812、rs60399658、rs189316271、rs186815309、rs11966699、rs73733155、rs3800023、rs2273264、rs6933125、rs17181352、rs8191890、rs142944427、rs1802846、rs1131372、rs3807589、rs200730019、rs17138865、rs17545405、rs775410128、rs555905346、rs6945709、rs2074690、rs200506987、rs3739308、rs3735959、rs145988500、rs6558165、rs6558166、rs149587418、rs55991828、rs151304651、rs77428666、rs141149968、rs12549018、rs529268660、rs7003945、rs200070447、rs1815549、rs139669465、rs145293869、rs1627784、rs573212、rs28369760、rs185006838、rs117628421、rs75361513、rs41415046、rs139337135、rs522328、rs515182、rs482712、rs10760500、rs2228149、rs34630110、rs703075、rs9337951、rs906220、rs906221、rs145472189、rs146884162、rs188054898、rs541533723、rs552775933、rs146804890、rs2280134、rs36088476、rs4757987、rs2986407、rs7808、rs3751031、rs4645933、rs139692587、rs76958954、rs145854081、rs5744247、rs202199158、rs117855259、rs117414825、rs2291075、rs117665966、rs1042833、rs17487041、rs12228215、rs12811832、
    rs11168338、rs138189784、rs75577568、rs2306436、rs369302829、rs2305901、rs61941459、rs3741990、rs34649612、rs1248046、rs145055159、rs117478978、rs200011804、rs150666338、rs1060474、rs10139379、rs8008670、rs8009789、rs8022395、rs7155123、rs199627749、rs7157977、rs79020288、rs183718030、rs9972231、rs563363438、rs2277533、rs2452524、rs78309240、rs4904、rs77707876、rs1545119、rs3748380、rs200336355、rs2745136、rs60526088、rs2738893、rs1054645、rs2447927、rs1657074、rs370627229、rs2301770、rs1059676、rs9929443、rs55969568、rs71220135、rs16943483、rs11859725、rs113276760、rs5818479、rs71395334、rs78806449、rs1043592、rs17682036、rs144911043、rs16971620、rs540183826、rs16973424、rs146684394、rs80345815、rs732109、rs79712753、rs28424873、rs189184481、rs61735591、rs7251165、rs146083008、rs147472740、rs4134853、rs11260004、rs117622602、rs11882197、rs10411624、rs13535、rs2217652、rs3826783、rs2230752、rs2241356、rs74351326、rs1978713、rs4804105、rs57747888、rs397764300(同rs58960485)、rs139817982、rs16015、rs151309111、rs2286663、rs34364867、rs117237657、rs189041504、rs1865094、rs2233156、rs2302987、rs148509022、rs188387562、rs407731、rs406968、rs388706、rs12052105、rs3745403、rs34604090、rs77561511、rs35336528、rs78422130、rs7258847、rs862708、rs2361119、rs4801478、rs4815467、rs2073194、rs6076122、rs78661674、rs11546155、rs114985890、rs2236001、rs3989369、rs8127537、rs2225425、rs2410104、rs1041439、rs2183573、rs1984748、rs9981301、rs4624474、rs1051367、rs2073733、rs885985、rs1803545、rs148650930、rs2072012、rs9607524、rs17523588、rs17848337、rs73165153、rs5845912、rs9628315、rs8137790、rs76476219、rs55861809、rs68178377。
    [0125]
    再将以上模型进行优化,筛选最佳阈值(cutoff)及比绘制roc曲线(如表2、图1所示)
    [0126]
    表2、各模型最佳阈值及其auc值
    [0127]
    modelcutoffaucsnp数量model2-1.250.5113model3-3.750.5595model4-3.250.51333

    技术特征:
    1.一种用于近视筛查的snp位点,所述snp位点包括以下任一组的位点组合:1)rs12549018、rs529268660、rs3741990、rs34649612、rs2452524、rs57747888、rs77561511、rs78422130、rs2073194、rs9981301、rs4624474、rs5845912、rs8137790;2)rs377223831、rs146160422、rs12129653、rs16861256、rs7542316、rs2231241、rs2231240、rs10911390、rs10911392、rs12045762、rs16861394、rs6661715、rs150943357、rs192688643、rs76657333、rs79162067、rs4387990、rs1981745、rs17466625、rs139051035、rs61732380、rs17029087、rs3817083、rs10026790、rs2718684、rs186309103、rs7717970、rs12519352、rs11133847、rs2304068、rs3734056、rs139635794、rs4959012、rs757262、rs757259、rs17181352、rs12549018、rs529268660、rs145293869、rs573212、rs117628421、rs139337135、rs522328、rs2228149、rs3751031、rs145854081、rs1042833、rs12228215、rs12811832、rs2305901、rs61941459、rs3741990、rs34649612、rs1060474、rs7157977、rs2277533、rs2452524、rs4904、rs2447927、rs1657074、rs1059676、rs9929443、rs113276760、rs732109、rs11260004、rs11882197、rs10411624、rs13535、rs2217652、rs2241356、rs74351326、rs4804105、rs57747888、rs397764300、rs16015、rs2286663、rs34364867、rs117237657、rs189041504、rs77561511、rs78422130、rs7258847、rs862708、rs4815467、rs2073194、rs6076122、rs78661674、rs2183573、rs9981301、rs4624474、rs9607524、rs5845912、rs9628315、rs8137790、rs76476219;3)rs28566954、rs377223831、rs41274480、rs146160422、rs16830693、rs1051097、rs12129487、rs12129653、rs12403630、rs58464768、rs148811681、rs41305862、rs17553619、rs71637410、rs16861256、rs7542316、rs7531786、rs2231241、rs2231240、rs10911390、rs10911391、rs10911392、rs12045762、rs16861394、rs6661715、rs138246957、rs182522436、rs13374714、rs13375853、rs2275856、rs6676149、rs3754234、rs2273584、rs6696123、rs11583387、rs3768066、rs3820553、rs1063128、rs3738521、rs76576389、rs150943357、rs34363861、rs117712357、rs71423514、rs76709099、rs192688643、rs151056400、rs116828761、rs28538922、rs138467334、rs115586700、rs76657333、rs143137431、rs79162067、rs75054661、rs4387990、rs117336796、rs145158569、rs12630803、rs3774765、rs1800766、rs74737650、rs1981745、rs17466625、rs12330397、rs139051035、rs10019009、rs61732380、rs17029087、rs3817083、rs10026790、rs11944752、rs1800591、rs3816873、rs2718684、rs7677415、rs3796936、rs3828506、rs186309103、rs11556167、rs9790356、rs9790628、rs4956981、rs13171103、rs4956987、rs7717970、rs12519352、rs11133847、rs117918201、rs26675、rs1697144、rs2304068、rs147518598、rs57930479、rs140779761、rs74403861、rs3734056、rs139635794、rs10900967、rs1611212、rs28400887、rs9261424、rs4959012、rs757262、rs757259、rs929156、rs3888778、rs75541627、rs117340770、rs9468812、rs60399658、rs189316271、rs186815309、rs11966699、rs73733155、rs3800023、rs2273264、rs6933125、rs17181352、rs8191890、rs142944427、rs1802846、rs1131372、rs3807589、rs200730019、rs17138865、rs17545405、rs775410128、rs555905346、rs6945709、rs2074690、rs200506987、rs3739308、rs3735959、rs145988500、rs6558165、rs6558166、rs149587418、rs55991828、rs151304651、rs77428666、rs141149968、rs12549018、rs529268660、rs7003945、rs200070447、
    rs1815549、rs139669465、rs145293869、rs1627784、rs573212、rs28369760、rs185006838、rs117628421、rs75361513、rs41415046、rs139337135、rs522328、rs515182、rs482712、rs10760500、rs2228149、rs34630110、rs703075、rs9337951、rs906220、rs906221、rs145472189、rs146884162、rs188054898、rs541533723、rs552775933、rs146804890、rs2280134、rs36088476、rs4757987、rs2986407、rs7808、rs3751031、rs4645933、rs139692587、rs76958954、rs145854081、rs5744247、rs202199158、rs117855259、rs117414825、rs2291075、rs117665966、rs1042833、rs17487041、rs12228215、rs12811832、rs11168338、rs138189784、rs75577568、rs2306436、rs369302829、rs2305901、rs61941459、rs3741990、rs34649612、rs1248046、rs145055159、rs117478978、rs200011804、rs150666338、rs1060474、rs10139379、rs8008670、rs8009789、rs8022395、rs7155123、rs199627749、rs7157977、rs79020288、rs183718030、rs9972231、rs563363438、rs2277533、rs2452524、rs78309240、rs4904、rs77707876、rs1545119、rs3748380、rs200336355、rs2745136、rs60526088、rs2738893、rs1054645、rs2447927、rs1657074、rs370627229、rs2301770、rs1059676、rs9929443、rs55969568、rs71220135、rs16943483、rs11859725、rs113276760、rs5818479、rs71395334、rs78806449、rs1043592、rs17682036、rs144911043、rs16971620、rs540183826、rs16973424、rs146684394、rs80345815、rs732109、rs79712753、rs28424873、rs189184481、rs61735591、rs7251165、rs146083008、rs147472740、rs4134853、rs11260004、rs117622602、rs11882197、rs10411624、rs13535、rs2217652、rs3826783、rs2230752、rs2241356、rs74351326、rs1978713、rs4804105、rs57747888、rs397764300_rs58960485、rs139817982、rs16015、rs151309111、rs2286663、rs34364867、rs117237657、rs189041504、rs1865094、rs2233156、rs2302987、rs148509022、rs188387562、rs407731、rs406968、rs388706、rs12052105、rs3745403、rs34604090、rs77561511、rs35336528、rs78422130、rs7258847、rs862708、rs2361119、rs4801478、rs4815467、rs2073194、rs6076122、rs78661674、rs11546155、rs114985890、rs2236001、rs3989369、rs8127537、rs2225425、rs2410104、rs1041439、rs2183573、rs1984748、rs9981301、rs4624474、rs1051367、rs2073733、rs885985、rs1803545、rs148650930、rs2072012、rs9607524、rs17523588、rs17848337、rs73165153、rs5845912、rs9628315、rs8137790、rs76476219、rs55861809、rs68178377。2.检测权利要求1所述的snp位点基因型的试剂;优选地,所述试剂包括扩增snp位点的试剂。3.一种检测权利要求1的snp位点基因型的试剂盒,所述试剂盒包含权利要求2所述的试剂。4.一种近视诊断模型的构建方法,所述构建方法包括:1)检测受试者样本中权利要求1所述的snp位点的基因型;2)利用数据挖掘方法对结果分析从而获得所述近视诊断模型;优选地,所述数据挖掘方法包括反向斑点杂交法和/或人工智能分析方法;优选地,所述人工智能方法包括线性回归、逻辑回归、神经网络分析、决策树、决策规则、规则拟合、支持向量机。5.一种近视评估系统,所述评估系统包括数据识别单元,所述数据识别单元基于权利要求4所述的构建方法获得的近视诊断模型对待评估对象进行近视情况的有效识别。
    6.根据权利要求5所述的评估系统,其特征在于,所述评估系统还包括数据收集单元:对待评估对象进行数据收集,所述数据包括snp数据。7.根据权利要求5所述的评估系统,其特征在于,所述评估系统还包括模型创建单元:按照权利要求4的构建方法创建近视诊断模型。优选地,所述评估系统还包括模型优化单元:对所述近视诊断模型进行优化。8.一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以运行利用权利要求4的构建方法创建的近视诊断模型。9.本发明还提供了一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行利用权利要求4的构建方法创建的近视诊断模型。10.本发明还提供了一种应用,所述应用包括以下任一项:1)权利要求1所述的snp位点在制备诊断近视或预测左眼球镜进展风险的的产品中的应用;优选地,所述产品包括检测试剂、检测试剂盒、诊断模型、评估系统、计算机程序产品、计算机可读存储介质;优选地,所述检测试剂如权利要求2所述;优选地,所述检测试剂盒如权利要求3所述;优选地,所述诊断模型根据权利要求4所述的构建方法获得;优选地,所述评估系统如权利要求5所述;优选地,所述计算机程序产品如权利要求8所述;优选的,所述计算机可读存储介质如权利要求9所述。2)利用权利要求4所述的构建方法获得的诊断模型在制备诊断近视预测左眼球镜进展风险的产品中的应用;优选地,所述产品包括评估系统、嵌入列线图的载体、计算机程序产品、计算机可读存储介质;优选地,所述评估系统如权利要求5所述;优选地,所述计算机程序产品如权利要求8所述;优选的,所述计算机可读存储介质如权利要求9所述。

    技术总结
    本发明公开了一种用于近视左眼球镜筛查的SNP标志物及其应用,所述SNP标志物为多个SNP位点的集合。本发明的SNP标志物可用于预测左眼球镜的进展风险进而可用于近视筛查,SNP位点集合大大提高了诊断效能。位点集合大大提高了诊断效能。位点集合大大提高了诊断效能。


    技术研发人员:王宏 徐良德
    受保护的技术使用者:温州眼视光国际创新中心
    技术研发日:2022.04.13
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-10114.html

    最新回复(0)