1.本发明涉及一种基于图表达技术的流行病传播分析方法、系统和可读介质,属于疾病传播分析技术领域,特别是基于智能算法分析的疾病传播分析领域。
背景技术:
2.流行病是指能在较短时间内广泛蔓延并且感染众多人口的传染病。流行病理论研究应用数学算法表达病因、宿主和环境之间构成的疾病流行规律,用数学模型来描述疾病流行的规律、人群的健康状况以及卫生事件的分布,从理论上探讨防止措施和效果。
3.图表达技术是网络分析挖掘的核心技术之一,其基于给定的含有n个节点的网络结构数据g=(v,e),其中,v为图的点集、e为图的边集,将节点表达为长度为d的向量并在向量中最大程度保留节点的结构拓扑信息。节点表达技术能将网络结构数据转化为向量形式,将紧密相连的节点映射为相似的向量表达,并在向量中保留原有的数据信息,在图数据挖掘中应用广泛。基于图表达技术的节点表达向量,结合部分已观测节点的传染病感染状态信息,使用机器学习模型,能够对其余未观测节点的传染病感染状态进行判别预测,适合相关流行病传播的分析研究。
4.现有主流的图表达技术,结合了经典随机漫步与神经网络表达模型两方面的技术,在此基础上实现了节点表达的功能。具体而言,这类算法首先借助经典随机漫步生成采样路径,在采样路径上使用窗口截取出目标节点在短期路径的上下文节点,以此作为目标节点的中间表达;然后,借助自然语言处理的skip-gram等神经网络表达模型,将上下文信息表达为向量。这类算法虽然具有一定有效性,但严重依赖经典随机漫步获取的拓扑信息。经典随机漫步技术,首先会遗漏采样路径之外的结构信息,其次会在采样路径的重叠区域造成信息冗余,因而采集的信息质量不高。此外,skip-gram等表达模型源于自然语言处理领域的技术,缺少了对图数据中非线性特性的显式挖掘,不能完全适应网络分析领域的数据特性。所以,现有图表达技术的技术性能受到了一定程度的限制,在流行病传播的分析研究中的应用效果也较为有限。
技术实现要素:
5.针对上述问题,本发明的目的是提供一种基于图表达技术的流行病传播分析方法、系统和可读介质,其基于目标节点的中间表达实现表达向量的学习,实现更高质量的节点表达功能,实现对未观测节点感染状态的有效判别,为流行病的传播分析提供更好支撑。
6.为实现上述目的,本发明提出了以下技术方案:一种基于图表达技术的流行病传播分析方法,包括:基于流行病传播数据和网络结构图模拟离散时间量子漫步,通过量子漫步挖掘网络结构图中各节点相似度;根据节点相似度,生成每个目标节点的中间表达;通过中间表达对神经网络模型进行训练,获得节点的表达向量;基于已知节点的表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。
7.进一步,各节点相似度的计算方法为:基于网络结构图,调用qsim算法,以任一节点为起始点进行离散时间量子漫步,并求取其他节点与该节点的相似度,遍历所有节点,获得相似度矩阵,节点相似度计算公式为:
8.p=qsim(g,d,n)
9.其中,g表示网络结构图,n表示网络结构图的节点数,d表示网络结构图的直径,n与d均可由网络结构g计算求取。p为相似度矩阵,元素p
ij
表示j节点与i节点的相似度。
10.进一步,生成每个目标节点的中间表达的方法包括:基于相似度矩阵进行初步采样;对初步采样结果进行精修;对精修的结果进行最终检查。
11.进一步,初步采样的具体方法为:将相似度矩阵进行归一化;根据节点与目标节点的相似度,计算各个节点出现在目标节点的中间表达中的概率;结合中间表达的尺寸,根据概率获得目标节点的中间表达中各节点个数,生成中间表达。
12.进一步,目标节点的中间表达中各节点的个数n
ij
的计算公式为:
[0013][0014]
其中,d表示网络结构图的直径,k表示中间表达的尺寸,p
ij
表示相似度矩阵p中节点j与目标节点i之间的相似度,[
·
]表示取整运算。
[0015]
进一步,精修的方法为:若初步生成的中间表达的尺寸小于k,则在相似度矩阵的目标节点对应的行中,选取本行节点中相似度最高的节点,将相似度最高的节点重复添加到初步生成的中间表达中,直至中间表达的尺寸等于k;若初步生成的中间表达的尺寸大于k,则在相似度矩阵的目标节点对应的行中,选取本行节点中相似度最低的节点,将相似度最低的节点重复删除,直至中间表达的尺寸等于k;若将相似度最低的节点全部删除后,中间表达的尺寸仍然大于k,则删除相似度次低的节点,以此类推,直至中间表达的尺寸等于k。
[0016]
进一步,最终检查的方法为:若经过精修的中间表达只包括同一节点的复制点,则将其中一个复制点强制修改为相似度次高的节点。
[0017]
进一步,神经网络模型的结构包括依次设置的全连接层、非线性函数层和softmax输出层。
[0018]
本发明还公开了一种基于图表达技术的流行病传播分析系统,包括:相似度计算模块,通过流行病传播数据和网络结构图模拟离散时间量子漫步,通过量子漫步挖掘网络结构图中各节点相似度;中间表达生成模块,用于根据节点相似度,生成每个目标节点的中间表达;模型训练模块,用于通过中间表达对神经网络模型进行训练,获得节点的表达向量;结果输出模块,用于将已知节点的表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。
[0019]
本发明还公开了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据上述任一项的基于图表达技术的流行病传播分析方法。
[0020]
本发明由于采取以上技术方案,其具有以下优点:
[0021]
1、本发明能够将节点在社交网络中的拓扑信息转化为低维表达向量,显著提升疫情传播分析中对于社交网络数据的处理速度。
[0022]
2、本发明避免了传统方法中经典随机漫步造成的信息损失,能够有效利用量子漫步节点相似度中的高质量结构信息,节点表达与后期分析判别的结果质量更高。
[0023]
3、本发明避免了传统方法无法挖掘网络结构中非线性特性的问题,能够有效学习网络数据中潜在的非线性特性,显著提升节点表达与后期分析判别的质量结果。
[0024]
4、本发明结合量子漫步与神经网络等新兴技术,生成更高质量的节点表达,在基于社交网络的疫情传播分析领域能提供更好的应用支撑。
[0025]
5、本发明使用高质量的节点表达,兼容其他机器学习的分类技术,实现对节点个体的传染病感染状态进行有效的判别预测,为疫情分析领域输出更高精度的分析结果。
附图说明
[0026]
图1是本发明一实施例中基于图表达技术的流行病传播分析方法的流程图;
[0027]
图2是本发明一实施例中神经网络模型的结构示意图。
具体实施方式
[0028]
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
[0029]
基于现有技术中基于图表达技术的流行病分析存在采集的信息质量不高,有效性较低的问题,本发明公开了基于图表达技术的流行病传播分析方法、系统和可读介质,其将网络结构中的节点表达为定长向量,为了有效利用量子漫步节点相似度中的高质量信息,基于初步采样、采样精修、最终检查这个三阶段流程的节点采样,将各个节点依据相似度信息生成对应的中间表达;并通过神经网络表达模型,基于中间表达进行学习,同时使用非线性函数来捕获数据中的非线性特性,生成节点的表达向量;使用机器学习分类算法,基于节点表达向量与用户指定的已观测节点的传染病传播状态,分析预测其余未观测节点的感染状态。本发明能够生成更高质量的节点表达、提供更高精度的感染状态判别,在基于社交网络的疫情传播分析领域能提供更好的应用支撑。下面通过实施例对本发明的方案进行详细说明。
[0030]
实施例一
[0031]
本实施例公开了一种基于图表达技术的流行病传播分析方法,如图1所示,包括:
[0032]
s1准备网络结构图与流行病传播数据。
[0033]
从因特网上下载社交网络数据karate,并以边表(edgelist)的形式储存,作为网络结构图g=(v,e),其中,v为图的点集、e为图的边集。设网络结构图中节点数为n,网络结构图中的节点表达向量的长度d(d<<n)。根据karate数据建立的网络结构图中,包括34个节点,即n=34,节点之间的边表征该社团内34个成员之间的社交关系。本实施例中使用karete网络作为用户指定的目标网络结构,但实际应用中可以采用任何适合的网络结构。
[0034]
在karate网络数据的基础上,用户还需要输入可观测节点的传染病感染状态信息。本实施例中,基于传染病传播的si模型(susceptible-infected模型),模拟传染病在该社团内的传播、生成所有节点的传染病感染状态信息。仿真设定p=0.4,即每个感染节点在
每个时刻均有0.4的概率感染其邻接节点;选取17号节点作为初始传染源,在感染40%成员后停止感染。将34个节点随机分为1:1的训练集(已观测节点)与测试集(未观测节点),本实施例旨在基于训练集节点的感染状态,结合后续挖掘的节点表达向量,预测测试集节点的感染情况,并与si模型模拟的真实结果对比。
[0035]
s2模拟离散时间量子漫步,基于量子漫步挖掘网络结构图中各节点相似度。
[0036]
各节点相似度的计算方法为:基于网络结构图g=(v,e),调用qsim算法,以任一节点为起始点进行离散时间量子漫步,并求取其他节点与该节点的相似度,遍历所有节点,获得相似度矩阵,节点相似度计算公式为:
[0037]
p=qsim(g,d,n)
[0038]
其中,g表示网络结构图,n表示网络结构图的节点数,d表示网络结构图的直径,若网络结构图不连通,则取各个连通分量中的最大值,p为相似度矩阵,元素p
ij
表示j节点与i节点的相似度,是d步量子漫步中的概率和,而非平均概率。
[0039]
s3根据节点相似度,生成每个目标节点的中间表达。
[0040]
对于任意一个目标节点i∈v,基于相似度矩阵p的信息,生成目标节点i的一组相似节点sample(i),以此来描述目标节点i,作为节点i的中间表达。生成中间表达分为三个阶段:初步采样阶段、采样精修阶段、最终检查阶段。即基于相似度矩阵p进行初步采样;对初步采样结果进行精修;对精修的结果进行最终检查。
[0041]
初步采样的具体方法为:对于某个节点j∈v,若该节点与目标节点i的相似度比其他点与目标节点i的相似度更高,则该节点在目标节点i的中间表达sample(i)的出现概率就比其他点高。故可以用该节点与目标节点i的相似度来表征节点出现在目标节点i的中间表达中的概率。
[0042]
由于元素p
ij
是d步量子漫步中的概率和,即qsim算法并未对相似度矩阵元素进行归一化,所以相似度矩阵元素有可能大于1,且相似度矩阵的某一行元素之和应当等于d,而并不等于1,因此相似度矩阵元素不能直接用作概率,故首先需要将相似度矩阵进行归一化,即每一个相似度矩阵元素除以d,以使一行元素之和等于1。
[0043]
计算各个节点出现在目标节点的中间表达中的概率,节点j在目标节点i的中间表达中的概率为:
[0044][0045]
结合中间表达的尺寸,即中间表达包含的节点数目,根据概率获得目标节点的中间表达中各节点个数,初步生成中间表达。节点j在中间表达中的个数为:
[0046][0047]
其中,d表示网络结构图的直径,k表示中间表达的尺寸,中间表达的尺寸是预先根据需要设定的,本实施例中预选中间表达的尺寸为6,p
ij
表示相似度矩阵p中节点j与目标节点i之间的相似度,[
·
]表示取整运算。
[0048]
对于给定的目标节点i,由于节点在初采样中进行了取整运算,所以初步生成的中间表达的尺寸并不一定等于预设的尺寸。在中间表达中存在较高相似度节点与较低相似度节点,数量过多的低相似度节点,会引入大量不必要噪音。故本实施例中精修过程希望尽可
能增加较高相似度节点的数量,而降低较低相似度节点的个数,从而减少低相似度节点的影响,突出高相似度节点。
[0049]
故本实施例中精修的具体方法为:
[0050]
若初步生成的中间表达的尺寸小于k,则在相似度矩阵的目标节点对应的行中,选取本行节点中相似度最高的节点,将相似度最高的节点重复添加到初步生成的中间表达中,直至中间表达的尺寸等于k;
[0051]
若初步生成的中间表达的尺寸大于k,则在相似度矩阵的目标节点对应的行中,选取本行节点中相似度最低的节点,将相似度最低的节点重复删除,直至中间表达的尺寸等于k;
[0052]
若将相似度最低的节点全部删除后,中间表达的尺寸仍然大于k,则删除相似度次低的节点,以此类推,直至中间表达的尺寸等于k。具体实现时,可以令p
ij
为正无穷,然后寻找相似度最低的点并降低相似度最低的节点的个数。
[0053]
基于这两个方案,采样精调阶段就能令sample(i)的节点的数量恰好等于k。而若|sample(i)|在初步采样阶段就已经等于k,则不必进行精修,直接进行最终检查即可。
[0054]
初步采样与采样精修都会使得高相似度节点在中间表达中的重复次数更多,但也可能存在中间表达中节点种类过于单一的问题,这样就会限制中间表达的表达能力,故需要进行最终检查。最终检查的方法为:若经过精修的中间表达只包括同一节点的复制点,则将其中一个复制点强制修改为相似度次高的节点。
[0055]
s4基于中间表达对神经网络模型进行训练,获得节点的表达向量。
[0056]
对于一个目标节点i,其中间表达sample(i)中的元素j点可以与目标节点i组成双节点元组(i,j)。对于sample(i)中j点的n
ij
个复制节点,会构造n
ij
个双节点元组(i,j)。对于任意一个双节点元组(i,j),本实施例中,使用神经网络模型进行训练,希望模型能基于输入的i节点来输出j节点。
[0057]
本实施例中神经网络模型如图2所示。输入层包括n个神经元,接收以独热码(one-hot encoding)形式的目标节点i,神经元数等于图的节点数n=34。隐藏层共有两层,第一层是d个神经元组成的嵌入层,也是实现节点表达主要功能的层,其中神经元数等于用户指定的向量长度,在本实施例中向量长度d=16;第二层是d个神经元组成的非线性函数层,使用sigmoid函数作为非线性层的激发函数。sigmoid函数的非线性层,能够有效学习网络结构数据中的非线性数据结构特性。sigmoid函数具体为:
[0058][0059]
其中,σ(x)表示sigmoid函数,x为目标函数的输入值,在本实施例中即为目标节点i。神经网络模型的最后一层输出层用以输出元组中j节点的独热码,使用softmax函数来实现输出的功能。
[0060]
神经网络模型的训练过程为训练整个模型的参数θ。在训练完成后,向网络中输入目标节点的独热码,就能获得节点对应的d长表达向量。
[0061]
假设模型在学习目标节点i自身的表达向量时,目标节点i点的表达向量记为ei;模型在学习其他点的向量表达时,i点的表达向量记为ii。根据最后一层中的softmax函数,输入i点时输出为j点对应的条件概率的计算公式如下:
[0062][0063]
基于上述公式,所有元组的整体条件概率的计算公式如下:
[0064][0065]
使用对数运算将条件概率的运算更新进行简化,其结果如下:
[0066]
logp(j|i)=σ(ij)
·
σ(ei)-log∑
i∈v
exp(σ(ii)
·
σ(ei))
[0067]
神经网络模型的训练目标是最大化所有元组的整体条件概率,故具体训练目标函数为:
[0068][0069]
为了训练目标函数首先进行的参数初始化,然后基于梯度下降训练参数对于双节点元组(i,j),由于表达向量ei与ii均由嵌入层输出,故这两类向量也由表达模型参数θ生成。在神经网络模型的训练的实现阶段,直接基于下式进行参数训练。
[0070][0071]
s5基于已知节点的所述表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。
[0072]
本实施例中,基于s1中划分的训练集与测试集,通过机器学习算法学习s4生成的训练集中可观测节点的表达向量及其传染病感染状态,基于测试集中未观测节点的表达向量预测判别其感染状态。本实施例中使用最近邻节点算法(knn)作为机器学习分类算法,基于训练集的表达向量与感染情况进行knn算法模型的训练,再使用训练后的knn算法基于测试集的节点向量信息,预测测试集个体的感染情况。
[0073]
基于knn算法预测的测试集结果,与使用si模型仿真模拟的测试集真实结果进行对比。对比结果显示,算法判别感染的auc精度为0.8071,精度水平较高。在本应用案例中,本方法能有效根据节点表达向量与已知的感染信息,对社交网络中的个体感染情况进行判断,在疫情传播分析领域具有重要应用。
[0074]
本发明接收用户输入,依次进行节点相似度的度量、中间表达的生成、表达模型的训练,输出每个节点对应的表达向量,并根据训练集节点的感染状态进行个体分析、预测其余节点的感染状态。用户输入的信息包括网络结构g、表达向量的长度d、中间表达的尺寸k,
以及可观测节点感染与否的状态。内部参数为网络节点数n与网络数据的直径d,算法可以根据输入的网络数据g自主求出。
[0075]
实施例二
[0076]
基于相同的发明构思,本实施例公开了一种基于图表达技术的流行病传播分析系统,包括:
[0077]
相似度计算模块,通过流行病传播数据和网络结构图模拟离散时间量子漫步,通过量子漫步挖掘网络结构图中各节点相似度;
[0078]
中间表达生成模块,用于根据节点相似度,生成每个目标节点的中间表达;
[0079]
模型训练模块,用于通过中间表达对神经网络模型进行训练,获得节点的表达向量;
[0080]
结果输出模块,用于将已知节点的表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。
[0081]
实施例三
[0082]
基于相同的发明构思,本实施例公开了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据上述任一项的基于图表达技术的流行病传播分析方法。
[0083]
综上所述,本发明使用节点采样与神经网络等方法,基于量子漫步节点相似度信息,实现对网络结构数据的节点表达,并基于节点表达实现对未知节点感染状态的预测。本发明避免了传统方法中经典随机漫步造成的信息损失以及无法挖掘网络结构中非线性特性的问题。该方法能够有效利用量子漫步节点相似度中的高质量结构信息,同时能够有效学习网络数据中潜在的非线性特性,节点表达的结果质量较高,能够更好地实现流行病传播预测的功能。利用该技术优势,可以为传染病传播分析研究的相关技术提供有效支持。
[0084]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0085]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0086]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0087]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0088]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。上述内容仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围。
技术特征:
1.一种基于图表达技术的流行病传播分析方法,其特征在于,包括:基于流行病传播数据和网络结构图模拟离散时间量子漫步,通过量子漫步挖掘所述网络结构图中各节点相似度;根据节点相似度,生成每个目标节点的中间表达;通过所述中间表达对神经网络模型进行训练,获得节点的表达向量;基于已知节点的所述表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。2.如权利要求1所述的流行病传播分析方法,其特征在于,所述节点相似度的计算方法为:基于所述网络结构图,调用qsim算法,以任一节点为起始点进行离散时间量子漫步,并求取其他节点与该节点的相似度,遍历所有节点,获得相似度矩阵,节点相似度计算公式为:p=qsim(g,d,n)其中,n表示网络结构图的节点数,d表示网络结构图的直径,g表示网络结构图,p为相似度矩阵,元素p
ij
表示j节点与i节点的相似度。3.如权利要求2所述的流行病传播分析方法,其特征在于,所述生成每个目标节点的中间表达的方法包括:基于所述相似度矩阵进行初步采样;对所述初步采样结果进行精修;对精修的结果进行最终检查。4.如权利要求3所述的流行病传播分析方法,其特征在于,所述初步采样的具体方法为:将所述相似度矩阵进行归一化;根据其他节点与目标节点的相似度,计算各个节点出现在目标节点的中间表达中的概率;结合中间表达的尺寸,根据所述概率获得目标节点的中间表达中各节点个数,生成中间表达。5.如权利要求4所述的流行病传播分析方法,其特征在于,所述目标节点的中间表达中各节点的个数n
ij
的计算公式为:其中,d表示网络结构图的直径,k表示中间表达的尺寸,p
ij
表示相似度矩阵p中节点j与目标节点i之间的相似度,[
·
]表示取整运算。6.如权利要求4所述的流行病传播分析方法,其特征在于,所述精修的方法为:若初步生成的中间表达的尺寸小于k,则在相似度矩阵的目标节点对应的行中,选取本行节点中相似度最高的节点,将所述相似度最高的节点重复添加到所述初步生成的中间表达中,直至所述中间表达的尺寸等于k;若初步生成的中间表达的尺寸大于k,则在相似度矩阵的目标节点对应的行中,选取本行节点中相似度最低的节点,将所述相似度最低的节点重复删除,直至所述中间表达的尺寸等于k;
若将相似度最低的节点全部删除后,中间表达的尺寸仍然大于k,则删除相似度次低的节点,以此类推,直至所述中间表达的尺寸等于k;其中,k表示中间表达的尺寸。7.如权利要求4所述的流行病传播分析方法,其特征在于,所述最终检查的方法为:若经过精修的中间表达只包括同一节点的复制点,则将其中一个复制点强制修改为相似度次高的节点。8.如权利要求1或2所述的流行病传播分析方法,其特征在于,所述神经网络模型包括依次设置的全连接层、非线性函数层和softmax输出层。9.一种基于图表达技术的流行病传播分析系统,其特征在于,包括:相似度计算模块,通过流行病传播数据和网络结构图模拟离散时间量子漫步,通过量子漫步挖掘所述网络结构图中各节点相似度;中间表达生成模块,用于根据节点相似度,生成每个目标节点的中间表达;模型训练模块,用于通过所述中间表达对神经网络模型进行训练,获得节点的表达向量;结果输出模块,用于将已知节点的所述表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。10.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至8任一项所述的基于图表达技术的流行病传播分析方法。
技术总结
本发明属于疾病传播分析技术领域,涉及一种基于图表达技术的流行病传播分析方法、系统和可读介质,包括:基于流行病传播数据和网络结构图模拟离散时间量子漫步,通过量子漫步挖掘网络结构图中各节点相似度;根据节点相似度,生成每个目标节点的中间表达;通过中间表达对神经网络模型进行训练,获得节点的表达向量;基于已知节点的表达向量对流行病传播模型进行训练,将未知节点的表达向量输入训练好的流行病传播模型,获得流行病传播分析预测结果。其能够生成更高质量的节点表达,在基于社交网络的疫情传播分析领域能提供更好的应用支撑。支撑。支撑。
技术研发人员:任洪广 王辛 胡明达 靳远 王博千 赵云祥 岳俊杰
受保护的技术使用者:中国人民解放军军事科学院军事医学研究院
技术研发日:2022.02.08
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-22529.html