一种癌症演化信息的挖掘方法及装置

    专利查询2025-08-11  14


    本发明涉及大数据分析与数据挖掘、生物信息学、系统生物学领域,具体涉及一种癌症演化信息的挖掘方法及装置。


    背景技术:

    1、癌症又称为恶性肿瘤,是一种由于机体细胞失去正常调控,进而发生不正常增生所引起的复杂疾病。目前癌症作为现代人类最难攻克的复杂疾病之一,其致病机理和疾病演变越来越受到人们的关注。

    2、目前关于癌症的演化和致病机理主要关注点落脚在癌症相关的驱动基因上。驱动基因是一类在癌症演化过程中能够起到驱动作用的一类生物分子,在癌症演化过程中扮演着十分重要的角色,已经成为研究疾病演化的一个关键生物信息。目前关于驱动基因,大部分研究更加关注单基因突变作为驱动基因,即对于癌症细胞累积突变中能够起到突变作用的基因称为“驱动基因”。目前关于驱动基因识别可以分为两个大类,早期的研究是主要基于突变数据进行处理,依据突变频率进行识别,例如:通过对于统计学相关指标进行数据统计和计算得到对应的统计量,并通过统计学分析得到驱动基因。后期由于数据维度的丰富,基于生物网络的方法逐渐成为主流方法,例如:在生物网络中使用随机游走并在收敛时识别驱动基因,还有如基于网络结构构造基因相关特征,并结合机器学习进行识别。在众多基于网络的方法中,网络平滑已经成为了一种比较成熟的技术用于将单基因突变产生的影响传递至邻居节点,并进而结合网络进行驱动基因识别,例如:方法nbs中的第一个步骤即就是应用随机游走算法进行网络平滑。但是目前这些方法仅仅关注的是将单点突变信息传递至一阶邻居节点,而非站在一个全局视角,将这种单点突变影响按照网络拓扑传递至全局网络。

    3、除了上面提到的驱动基因之外,含有驱动效应的相互作用也逐渐成为一种备受关注的驱动基因,其包含两个相互作用的基因节点,这种相互作用类比上面的单个基因能够更加全面地、详细地描述驱动基因在演化过程中的驱动效果。以含有驱动效应的相互作用作为主要识别目标,目前同样有许多手段用于衡量和区分相互作用的重要性。但是这些方法所描述的相互作用是局限的,无法提供关于含有驱动效应的相互作用的更多信息。

    4、从驱动基因入手,是为了寻找到一个支点来描述癌症阶段演化。癌症通常包含四个阶段,在这四个阶段的演化中,癌症抑或是肿瘤是如何一步步地由癌前状态逐渐转变为最终的致死态是一个过程量。将每个阶段的阶段相关驱动基因进行挖掘,即可以找到代表该阶段发展的关键生物分子,从而有利于人们理解癌症,干预癌症以及治疗癌症。

    5、然而,癌症的发生发展是具有阶段性的,目前在生物信息角度绝大多数方法都是将癌症病样本作为一个整体,缺少一种宏观的,直观的角度来观察癌症演化,将癌症按照阶段进行划分,对于癌症阶段间演化和演化过程中的致病机理关键信息进行挖掘和刻画的方法。


    技术实现思路

    1、本发明的目的是提供一种癌症演化信息的挖掘方法及装置,以清晰、有效、直观地描述癌症演化。

    2、为了实现上述任务,本发明采用以下技术方案:

    3、一种癌症演化信息的挖掘方法,包括:

    4、基于癌症阶段的阶段特异性功能交互网络,使用基于谣言传播算法的网络平滑方法,将单一基因节点突变信息的影响扩散至整个功能交互网络,用于平滑和重分配基因节点的突变频率;

    5、基于平滑后的功能交互网络,对网络中基因节点对之间相互作用进行引力建模;在引力建模的基础上,基于基因节点对之间的引力,通过高引力相互作用的提取以构建高引力网络,同时引入吸引引力和排斥引力,将表达关系融入引力模型;确定基因节点的综合引力并将其作为基因节点的权重;

    6、将各个癌症演化阶段的阶段特异性功能交互网络连接在一起,构建一个以层次形式进行展示的癌症阶段演化可视化模型,用以进行确定演化因子和过渡因子在内的癌症演化研究。

    7、进一步地,所述阶段特异性功能交互网络是针对癌症演化的阶段所建立的,网络的节点为基因节点,基因节点上的权值为该基因节点的突变次数,并将这个权值作为谣言在网络中进行传播,网络中的边为基因节点间的相互作用。

    8、进一步地,所述基于谣言传播算法的网络平滑方法,表示为:

    9、

    10、其中,n表示网络中的基因节点总数,u表示网络接收谣言的基因节点,vi表示剩余基因节点,有n-1个传谣的基因节点,均向节点u传播突变信息,t0表示传谣之前的初始时间点,t1表示传谣完成的时间点;pvi→u表示各个传谣的基因节点vi向基因节点u传播的突变信息,pvi(t0)表示各个传谣的基因节点在传谣之前的初始突变频数;kvi表示基因节点vi为基因节点u的第k阶邻居,dvi表示基因节点vi在网络中的度数,数学符号!为阶乘符号;pu(t0)表示基因节点u的初始突变频数,而pu(t1)表示基因节点u在传谣之后的突变频数。

    11、进一步地,所述将单一基因节点突变信息的影响扩散至整个功能交互网络,用于平滑和重分配基因节点的突变频率,包括:

    12、首先基于搭建好的阶段特异性功能交互网络,获取网络中各个基因节点的初始突变频数、各个基因节点在网络中的度数、各个基因节点的k阶邻居节点集合提前获取;

    13、其次,基于获取的信息,经过实验得到的传谣系数α来均衡平滑过程中接收到的突变信息和原始的突变信息;

    14、最终将网络中全部的基因节点依次作为接收谣言的基因节点接受谣言,经过谣言传播后网络中各个基因节点的突变频数。

    15、进一步地,对网络中基因节点对之间相互作用进行引力建模,引力模型为:

    16、

    17、其中p(t1)表示基因节点平滑后的突变频数,这里的px(t1)和py(t1)分别表示基因节点x和y的p(t1)值,这里用p(t1)值来类比基因节点在网络中的质量,而pcc(x,y)表示的是基因节点对x和y的皮尔逊相关系数,用于表示两个基因节点在基因表达时的相关性。

    18、进一步地,所述通过高引力相互作用的提取以构建高引力网络,包括:

    19、在功能交互网络中,使用引力模型进行建模之后,将这些基因节点对之间的相互作用对应的引力从高到低进行排序,并同时以含有驱动效应的相互作用作为目标,结合精确度指标进行综合考量;选择精确度不低于90%的情况下的所有相互作用作为最终的目标,将这些筛选出的相互作用的基因节点对组成的子网作为高引力网络。

    20、进一步地,所述引入吸引引力和排斥引力,将表达关系融入引力模型,包括:

    21、本发明中将基因节点对的皮尔逊相关系数pcc的正负号加入到考量中,对于pcc>0的两个基因节点对之间的相互作用,其在基因表达过程中由于是相互促进的,其表达产物蛋白在生物功能中的关系也比较紧密,因此可以认为其是相互吸引的,用吸引引力来描述这样的相互作用;反之对于pcc<0的两个基因节点对之间的相互作用,其在基因表达过程中由于是相互抑制的,其表达产物蛋白在生物功能中的关系也比较疏远,因此可以认为其是相互排斥的,即用排斥引力来描述这样的相互作用。

    22、进一步地,所述确定基因节点的综合引力并将其作为基因节点的权重,包括:

    23、

    24、其中d表示基因节点i的度数,gravityi表示基因节i与其邻居基因节点之间的引力,sumg为基因节点i的综合引力,即一个基因节点与其相邻的所有其他基因节点之间的引力和;

    25、将网络中的基因节点赋权节点综合引力的权重,能够从基因节点的视角去丰富整个模型。

    26、进一步地,所述构建一个以层次形式进行展示的癌症阶段演化可视化模型,用以进行确定演化因子和过渡因子在内的癌症演化研究,包括:

    27、利用所述网络平滑方法和引力模型在癌症演化的每个阶段的特异性功能交互网络上进行建模,建模后将各阶段的交互网络按顺序从上到下依次排列,以一种层次的形式进行搭建,将对应的驱动基因进行连接,形成一种自上而下的层次演化网络;

    28、通过确定各交互网络基因节点中的驱动基因和包含驱动效应的相互作用,统计相邻阶段出现的驱动基因和包含驱动效应的相互作用,将共同出现的分别相连,对于各个阶段的功能交互网络共同出现的标记为“演化因子”,即为始终伴随整个演化过程的驱动基因,而对于仅仅出现在相邻阶段而没有出现在全部阶段的标记为“过渡因子”,即为在演化过程中起阶段过渡效果的因子。

    29、一种癌症演化信息的挖掘装置,包括:

    30、网络平滑模块,用于基于癌症阶段的阶段特异性功能交互网络,使用基于谣言传播算法的网络平滑方法,将单一基因节点突变信息的影响扩散至整个功能交互网络,用于平滑和重分配基因节点的突变频率;

    31、引力建模模块,用于基于平滑后的功能交互网络,对网络中基因节点对之间相互作用进行引力建模;在引力建模的基础上,基于基因节点对之间的引力,通过高引力相互作用的提取以构建高引力网络,同时引入吸引引力和排斥引力,将表达关系融入引力模型;确定基因节点的综合引力并将其作为基因节点的权重;

    32、可视化展示模块,用于将各个癌症演化阶段的阶段特异性功能交互网络连接在一起,构建一个以层次形式进行展示的癌症阶段演化可视化模型,用以进行确定演化因子和过渡因子在内的癌症演化研究。

    33、一种计算机可读存储介质,所述介质中存储有计算机程序;计算机程序被处理器执行时,实现所述癌症演化信息的挖掘方法。

    34、与现有技术相比,本发明具有以下技术特点:

    35、本发明提供了一种乳腺癌演化过程中关键信息的挖掘方法,能清晰、有效且直观地描述癌症演化,为癌症的研究和治疗提供有力的支持。


    技术特征:

    1.一种癌症演化信息的挖掘方法,其特征在于,包括:

    2.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述阶段特异性功能交互网络是针对癌症演化的阶段所建立的,网络的节点为基因节点,基因节点上的权值为该基因节点的突变次数,并将这个权值作为谣言在网络中进行传播,网络中的边为基因节点间的相互作用。

    3.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述基于谣言传播算法的网络平滑方法,表示为:

    4.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述将单一基因节点突变信息的影响扩散至整个功能交互网络,用于平滑和重分配基因节点的突变频率,包括:

    5.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,对网络中基因节点对之间相互作用进行引力建模,引力模型为:

    6.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述通过高引力相互作用的提取以构建高引力网络,包括:

    7.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述引入吸引引力和排斥引力,将表达关系融入引力模型,包括:

    8.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述确定基因节点的综合引力并将其作为基因节点的权重,包括:

    9.根据权利要求1所述的癌症演化信息的挖掘方法,其特征在于,所述构建一个以层次形式进行展示的癌症阶段演化可视化模型,用以进行确定演化因子和过渡因子在内的癌症演化研究,包括:

    10.一种癌症演化信息的挖掘装置,其特征在于,包括:


    技术总结
    本发明公开了一种癌症演化信息的挖掘方法及装置,所述方法包括:基于癌症阶段的阶段特异性功能交互网络,使用基于谣言传播算法的网络平滑方法,将单一基因节点突变信息的影响扩散至整个功能交互网络,用于平滑和重分配基因节点的突变频率;对网络中基因节点对之间相互作用进行引力建模,基于基因节点对之间的引力,通过高引力相互作用的提取以构建高引力网络,同时引入吸引引力和排斥引力,将表达关系融入引力模型;确定基因节点的综合引力并将其作为基因节点的权重;将各个癌症演化阶段的阶段特异性功能交互网络连接在一起,构建一个以层次形式进行展示的癌症阶段演化可视化模型,用以进行确定演化因子和过渡因子在内的癌症演化研究。

    技术研发人员:陈伯林,张劲雷,韩有瑞,张建君,陈淑贤,尚学群
    受保护的技术使用者:西北工业大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-31208.html

    最新回复(0)