疾病的确定方法、装置、设备以及存储介质与流程

    专利查询2022-08-15  117



    1.本公开涉及数据处理技术领域,尤其涉及人工智能、深度学习、ai医疗等,特别涉及一种疾病的确定方法、装置、设备以及存储介质。


    背景技术:

    2.传染病始终伴随着人类的发展进程,具备传染性、流行性等特点,严重威胁人类身体健康。在传染病防治的背景下,尽早对患者进行准确的传染病诊断,避免医院中传染病直报系统的人为误操作以及由于医疗资源紧张导致的潦草诊断成为防治重点。相关技术存在着实用性差、准确率低等缺陷。


    技术实现要素:

    3.本公开提供了一种疾病的确定方法、装置、设备以及存储介质。
    4.根据本公开的一方面,提供了一种疾病的确定方法,该方法可以包括以下步骤:
    5.根据疑似患者的描述信息,确定医疗实体信息;
    6.利用医疗实体信息,在疾病图谱中确定与疑似患者相关的子图谱,疾病图谱是预先构建的,疾病图谱中至少包括疾病以及与疾病对应的多个实体项;
    7.利用疑似患者的描述信息、医疗实体和子图谱中的至少一种,对疑似患者进行指定类别的疾病确定。
    8.根据本公开的另一方面,提供了一种疾病的确定装置,该装置可以包括:
    9.医疗实体信息确定模块,用于根据疑似患者的描述信息,确定医疗实体信息;
    10.子图谱确定模块,用于利用医疗实体信息,在疾病图谱中确定与疑似患者相关的子图谱,疾病图谱是预先构建的,疾病图谱中至少包括疾病以及与疾病对应的多个实体项;
    11.疾病确定模块,用于利用疑似患者的描述信息、医疗实体和子图谱中的至少一种,对疑似患者进行指定类别的疾病确定。根据本公开的另一方面,提供了一种电子设备,包括:
    12.至少一个处理器;以及
    13.与该至少一个处理器通信连接的存储器;其中,
    14.该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
    15.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
    16.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本公开任一实施例中的方法。
    17.根据本公开的技术可以依赖于疾病图谱构建疑似患者的子图谱,并以此作为疾病确定参数,结合疑似患者的描述信息以及确定出的医疗实体信息,提高疾病确定的准确性。尤其对于传染性疾病,可以防止人为的诊断失误或瞒报情况,提升传染病防治效率。
    18.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
    附图说明
    19.附图用于更好地理解本方案,不构成对本公开的限定。其中:
    20.图1是根据本公开疾病的确定方法的流程图;
    21.图2是根据本公开确定子图谱的流程图之一;
    22.图3是根据本公开确定子图谱的流程图之二;
    23.图4是根据本公开疾病图谱的构建方式的流程图之一;
    24.图5是根据本公开疾病图谱的构建方式的流程图之二;
    25.图6是根据本公开对疑似患者进行指定类别的疾病确定的流程图之一;
    26.图7是根据本公开对疑似患者进行指定类别的疾病确定的流程图之二;
    27.图8是根据本公开确定医疗实体信息的流程图之一;
    28.图9是根据本公开确定医疗实体信息的流程图之二;
    29.图10是根据本公开疾病的确定装置的示意图;
    30.图11是用来实现本公开实施例的疾病的确定方法的电子设备的框图。
    具体实施方式
    31.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
    32.如图1所示,本公开提供一种疾病的确定方法,该方法可以包括以下步骤:
    33.s101:根据疑似患者的描述信息,确定医疗实体信息;
    34.s102:利用医疗实体信息,在疾病图谱中确定与疑似患者相关的子图谱,疾病图谱是预先构建的,疾病图谱中至少包括疾病以及与疾病对应的多个实体项;
    35.s103:利用疑似患者的描述信息、医疗实体和子图谱中的至少一种,对疑似患者进行指定类别的疾病确定。
    36.本公开的执行主体可以是服务器,具体可以是多种服务器中的一种,例如,台式计算机、笔记本电脑、云端计算器或者多个服务器构成的服务器集,本公开对服务器的产品类型不做限定。
    37.描述信息可以是疑似患者的诊断信息,例如门诊信息、手术记录信息、术后恢复信息等。另外,描述信息也可以是疑似患者输入的问诊信息等。例如,问诊信息可以是“头疼、发热并伴有腹痛是什么疾病”等。描述信息的载体可以是文字信息、语音信息或者是视频信息。在描述信息的载体为语音信息或者是视频信息的情况下,可以首先对其进行语音识别,从而转换为文字。
    38.对描述信息进行解析,可以得到医学实体。示例性地,医学实体可以包括症状、体征、疾病、检查项、检验项、年龄、性别中的一种或多种。对描述信息进行解析可以基于自然语音处理技术中的命名实体识别,以得到对应的医疗实体。
    39.利用确定出的医疗实体信息,可以在疾病图谱中确定与疑似患者相关的子图谱。其中,疾病图谱可以是预先构建的。疾病图谱中至少可以包括中心节点和子节点。其中,中心节点可以是疾病名称,子节点可以是与医疗实体对应的实体项。中心节点和子节点可以利用边连接。
    40.结合表1所示为疾病知识图谱中所包括的实体项,表1中以第i类疾病为示例进行展示。其中,第i类疾病可以作为疾病图谱的中心节点,别名、病原体、传染源等实体项可以作为子节点。每个实体项中可以包含对应内容。
    41.以第i类疾病为新型冠状病毒肺炎为示例,实体项为“别名”的对应内容可以包括“新冠”、“新冠肺炎”、“covid-19”、“2019冠状病毒病”等。实体项为“传播途径”的对应内容可以包括“飞沫传播”、“接触传播”、“粪-口传播”等。以上仅以“别名”、“传播途径”两个实体项为示例进行展示,其他实体项可以根据实际情况填写对应内容。
    [0042][0043][0044]
    表1
    [0045]
    疾病图谱的构建方式可以由人工从医学资料中进行提取并进行汇编。或者,疾病图谱的构建方式还可以利用自动化的方式,通过对不同种类疾病的诊断信息进行解析进行
    标签。“体征”标签可以对应实体项。
    [0060]
    另外,结构化处理还可以将相同含义但不同表述方式的内容进行归一化。例如,可以将“体温37度”、“低烧”等归一化为“低烧”的表述。归一化的结果可以对应实体项的内容。
    [0061]
    利用每个实体项的内容,与疾病图谱进行匹配。例如,疑似患者其中一个实体项的内容为“低烧”。则可以将疾病图谱中“体征”为“低烧”的子节点确定为选中的节点。
    [0062]
    上述是以实体项的内容与疾病图谱中的内容完全相同作为匹配依据。另外,还可以根据相似性作为比较依据。例如,在疾病图谱中“体征”为“发烧”的情况下,可以比较“低烧”与“发烧”的相似性。在相似性大于对应的相似性阈值的情况下,也可以将疾病图谱中“体征”为“低烧”的子节点确定为选中的节点。
    [0063]
    所有被选中的节点可以构成与疑似患者相关的子图谱的节点。
    [0064]
    通过上述过程,可以做到千人千面,从完备的疾病图谱中勾勒出疑似患者的子图谱,从而为疑似患者的疾病确认提供数据支持。
    [0065]
    如图3所示,在一种实施方式中,步骤s202可以包括以下过程:
    [0066]
    s301:遍历疾病图谱中的各实体项,得到遍历结果,遍历结果包括各实体项的内容,以及每个实体项的内容对应的权重,权重为动态变化的;
    [0067]
    s302:将医疗实体信息与遍历结果进行比对,在内容相似度高于对应阈值的情况下,基于权重确定疑似患者相关的子图谱。
    [0068]
    通过遍历疾病图谱中的各实体项,可以解析出每个实体项的内容,以及每个实体项的内容对应的权重。其中,权重可以是在构建疾病图谱时确定的,也可以是在疾病图谱构建后根据不同疾病的发展情况进行动态调整的。
    [0069]
    对于权重的调整可以包括以下触发机制,例如,在某类疾病在目标时间段的感染人数超过对应阈值的情况下,可以将该类疾病中各节点的权重值提升。或者,在特定季节,可以调高部分在该季节容易高发的疾病中各节点的权重等。
    [0070]
    将根据医疗实体信息确定出的实体项的内容与遍历结果进行比对,在内容相似度高于对应阈值的情况下,可以确定出被选中的节点。进一步的,可以根据节点的权重进行筛选,例如,可以将权重值高于对应阈值的节点保留。另外,在确定疑似患者相关的子图谱的过程中,可以将保留下来的节点的权重作为该节点的参数。
    [0071]
    通过上述过程,可以结合动态变化的权重,可以增加子图谱的时效性。
    [0072]
    如图4所示,在一种实施方式中,疾病图谱的构建方式可以包括以下过程:
    [0073]
    s401:预先确定n个疾病种类,其中,n为正整数;
    [0074]
    s402:对于第i个疾病种类,对获取到的与第i个疾病种类相关的多个诊断信息进行预处理,得到实体项,其中,1≤i≤n,且i为正整数;
    [0075]
    s403:利用实体项在多个诊断信息中出现的频率,以及包含实体项的诊断信息在所有诊断信息中的占比,确定实体项与第i个疾病种类的关联关系;
    [0076]
    s404:利用关联关系,构建疾病图谱。
    [0077]
    可以根据疾病发展情况,结合各地区的差异,确定出n个疾病种类。以n个疾病种类中的第i个疾病种类为例,对疾病图谱的构建过程进行阐述。
    [0078]
    结合图5所示,对于第i个疾病种类,可以收集该疾病种类的病历数据库(对应图5中的病历数据)。收集过程可以包括所病历进行清洗、过滤,以筛选出与第i个疾病种类相关
    的病历。通过语义特征抽取,可以从筛选出的病历中解析得到症状、体征、检查项、检验项等候选实体内容。
    [0079]
    另一方面,还可以利用医学书籍作为模板库进行目标实体内容的标注(对应图5中的医学书籍)。通过标注结果对候选实体内容进行匹配,从而对候选实体内容进行扩充(对应图5中的数据合并)。例如,医学书籍中已经记录有第i个疾病种类的多个医疗实体内容,通过对病历的筛选,可以对医疗数据中的内容进行丰富。
    [0080]
    进一步的,还可以对候选实体内容进行校验(对应图5中的医学书籍),从而实现数据的去重和验证。
    [0081]
    最终可以利用词频-逆向文件频率算法(tf-idf,term frequency

    inverse document frequency)进行相关性计算,可以在解析得到的候选实体内容中筛选出与第i个疾病种类关系较近的目标实体内容。
    [0082]
    其中,tf可以用于表示词频,即表示关键字在目标实体内容中出现的频率。其中,以关键词是目标实体内容“发热”为例。tf的计算式如下所示:
    [0083][0084]
    式中tf
    i,j
    可以表示第j个关键词“发热”对于第i个疾病种类的重要程度。n
    i,j
    ·
    可以表示计数值,代表出现关键词“发热”在与第i个疾病种类相关的病历中出现的次数。
    [0085]nk,j
    可以表示计数值,代表出现关键词“发热”的病历中的词语总数量,k可以表示病历数量。
    [0086]
    idf可以用于表示逆文档频率。如果一个关键词越常见,那么分母就越大,逆文档频率就越小越接近0。lg表示对得到的值取对数。idf的计算式如下所示:
    [0087][0088]
    式中idf
    t
    可以表示关键词t(t可以表示发热)的重要性。|d|可以表示病历总数。df
    t
    表示包含关键词t的病历数目。
    [0089]
    通过计算tf和idf的乘积,可以得出目标实体内容与第i个疾病种类是否为强相关。在强相关的情况下,可以将该目标实体内容作为第i个疾病种类的子节点。
    [0090]
    通过上述过程,可以较为高效、准确地构建出疾病图谱。
    [0091]
    如图6所示,在一种实施方式中,在同时利用疑似患者的描述信息、医疗实体和子图谱的情况下,步骤s103可以包括以下过程:
    [0092]
    s601:确定疑似患者的描述信息的第一特征向量,以及确定医疗实体的第二特征向量;
    [0093]
    s602:基于第一特征向量和第二特征向量的互注意力计算结果,得到特征向量计算结果;
    [0094]
    s603:将特征向量计算结果与确定出的子图谱的特征向量进行拼接,得到向量集合;
    [0095]
    s604:利用向量集合进行指定类别的疾病确定。
    [0096]
    结合图7所示,首先,对于描述信息和医疗实体中的文本,通过独热编码(one-hot)进行编码操作,编码后的描述信息和医疗实体通过embedding向量层(对应图7中的文本嵌
    入层和实体嵌入层)进行处理,转换为向量形式。
    [0097]
    对于医疗实体,将通过embedding向量层得到的结果作为第二特征向量。
    [0098]
    对于描述信息,在通过embedding向量层后,得到向量结果。还可以通过多重卷积神经网络(multi-conv neural network)对向量结果进行特征提取,以得到n维向量表示。n维向量表示可以对应第一特征向量。即,第一特征向量和第二特征向量的维度可以相同。
    [0099]
    基于第一特征向量和第二特征向量,可以进行互注意力计算。互注意力计算的目的在于通过第一特征向量和第二特征向量的相互校验机制,实现对第一特征向量和第二特征向量的增强处理。互注意力计算的结果可以作为疑似患者的表示内容,在图7中记为患者表示。
    [0100]
    对于子图谱,可以首先通过知识嵌入层进行编码。
    [0101]
    知识嵌入层的本质也可以利用one-hot编码进行相应的固定纬度的向量表示。优选的,知识嵌入层可以比前述的文本嵌入层和实体嵌入层多一项操作,即通过病历内包含的具体病况以及子图谱链接相关症状与疾病。例如,病历内包含症状“发热”,在子图谱中通过“发热”召回与其有边链接的相关病况,并进行特征化。编码后的知识嵌入层可以通过图卷积神经网络(spatial-based graphconvolution)进行处理,提取子图谱的特征向量。子图谱的特征向量在图7中记为患者表示。
    [0102]
    将互注意力计算的结果与子图谱的特征向量进行拼接,得到向量集合。利用全连接层对向量集合中的各项数据进行融合处理,最终可以通过分类模型(sigmoid)得到指定类别的疾病的确定结果。其中,确定结果可以是健康(疑似患者未对应任何疾病),也可以是一种疾病或多种疾病。
    [0103]
    上述预测过程可以利用端到端神经网络执行。由此在训练过程中,可以使模型内的各个子模型联动训练,提高疾病确定的准确率。在训练过程中,可以将描述信息样本、医疗实体样本和子图谱样本输入至端到端神经网络,神经网络得到疾病预测结果。利用该预测结果和预先标注的真实结果进行比较,从而根据比较的差异对端到端神经网络中的参数进行联动调整,最终以预测结果和预先标注的真实结果的比较差异在允许范围内。
    [0104]
    通过上述过程,可以实现多种疾病的确定。
    [0105]
    如图8所示,在一种实施方式中,步骤s101可以包括以下过程:
    [0106]
    s801:对描述信息进行预处理,以提取描述信息的特征向量;
    [0107]
    s802:对特征向量进行识别,得到医疗实体信息。
    [0108]
    结合表2所示,以描述信息为门诊病历为例进行说明。
    [0109]
    提取字段提取医学实体类型主诉症状、体征、疾病现病史症状、体征、疾病体格检查检查项、检查可见、体温辅助检查检验项、检验结果患者信息年龄、性别、所属人群
    [0110]
    表2
    [0111]
    结合图9所示,可以根据门诊病历信息中的不同内容进行语义特征抽取(对应图9中的语义特征抽取)。例如,可以对“主诉”部分、“现病史”部分、“体格检查”部分、“辅助信
    息”部分和“患者信息”部分进行文字提取。由此可以提高文字提取的精度。
    [0112]
    对于提取出的文字,可以利用双向长短时记忆循环神经网络(bi-lstm,bi-directional lstm rnn)进行各分词的特征向量的提取。随后,可以利用各分词的特征向量实现对于医学实体名词的初步确定。进而,可以利用条件随机场模型(crf,conditional random field)对初步确定结果进行医疗实体判别,从而输出医疗实体信息。
    [0113]
    另外,对于病历中的内容或者输出的医疗实体信息(对应图9中的模板库匹配),还可以与模板库进行匹配,将医疗实体信息进行校正,从而提高识别准确率。
    [0114]
    进一步的,还可以包括对医疗实体进行实体校验的过程(对应图9中的校验)。
    [0115]
    在实体校正后,还可以进一步包括医疗实体推理的过程(对应图9中的推理)。例如,医疗实体信息为体温37.1度,那么推理结果可以是低热;又例如,医疗实体信息为白细胞计数2,那么推理结果可以是白细胞计数偏低。上述推理过程可以利用医学知识库为依据。
    [0116]
    通过上述过程,可以实现对于医疗实体信息的自动化确认(对应图9中的病历结构化)。
    [0117]
    在一种实施方式中,还包括以下步骤:
    [0118]
    将指定类别的疾病确定结果发送至信息展示端。
    [0119]
    信息展示端可以包括疑似患者的移动设备、疑似患者主治医生的移动设备,还可以包括疾病管理平台等。
    [0120]
    在一种实施方式中,指定类别的疾病可以包括具有传染性的疾病。
    [0121]
    通过将疾病确定结果的发送,可以使相关责任人及时掌握疾病的确定情况,从而可以快速应对。
    [0122]
    如图10所示,本公开提供一种疾病的确定装置,该装置可以包括:
    [0123]
    医疗实体信息确定模块1001,用于根据疑似患者的描述信息,确定医疗实体信息;
    [0124]
    子图谱确定模块1002,用于利用医疗实体信息,在疾病图谱中确定与疑似患者相关的子图谱,疾病图谱是预先构建的,疾病图谱中至少包括疾病以及与疾病对应的多个实体项;
    [0125]
    疾病确定模块1003,用于利用疑似患者的描述信息、医疗实体和子图谱中的至少一种,对疑似患者进行指定类别的疾病确定。
    [0126]
    在一种实施方式中,子图谱确定模块1002可以包括:
    [0127]
    实体项内容确定子模块,用于对医疗实体信息进行结构化处理,得到至少一个实体项的内容;
    [0128]
    子图谱确定执行子模块,用于利用每个实体项的内容,与疾病图谱进行匹配,得到与疑似患者相关的子图谱。
    [0129]
    在一种实施方式中,子图谱确定执行子模块可以包括:
    [0130]
    遍历结果获取单元,用于遍历疾病图谱中的各实体项,得到遍历结果,遍历结果包括各实体项的内容,以及每个实体项的内容对应的权重,权重为动态变化的;
    [0131]
    子图谱确定执行单元,用于将医疗实体信息与遍历结果进行比对,在内容相似度高于对应阈值的情况下,基于权重确定疑似患者相关的子图谱。
    [0132]
    在一种实施方式中,子图谱确定模块1002还可以包括:
    [0133]
    疾病种类确定子模块,用于预先确定n个疾病种类,其中,n为正整数;
    [0134]
    实体项确定子模块,用于对于第i个疾病种类,对获取到的与第i个疾病种类相关的多个诊断信息进行预处理,得到实体项,其中,1≤i≤n,且i为正整数;
    [0135]
    关联关系确定子模块,用于利用实体项在多个诊断信息中出现的频率,以及包含实体项的诊断信息在所有诊断信息中的占比,确定实体项与第i个疾病种类的关联关系;
    [0136]
    构建执行子模块,用于利用关联关系,构建疾病图谱。
    [0137]
    在一种实施方式中,在同时利用疑似患者的描述信息、医疗实体和子图谱的情况下,疾病确定模块1003可以包括:
    [0138]
    特征向量确定子模块,用于确定疑似患者的描述信息的第一特征向量,以及确定医疗实体的第二特征向量;
    [0139]
    互注意力计算子模块,用于基于第一特征向量和第二特征向量的互注意力计算结果,得到特征向量计算结果;
    [0140]
    向量拼接子模块,用于将特征向量计算结果与确定出的子图谱的特征向量进行拼接,得到向量集合;
    [0141]
    疾病确定执行子模块,用于利用向量集合进行指定类别的疾病确定。
    [0142]
    在一种实施方式中,医疗实体信息确定模块901可以包括:
    [0143]
    预处理子模块,用于对描述信息进行预处理,以提取描述信息的特征向量;
    [0144]
    医疗实体信息确定执行子模块,用于对特征向量进行识别,得到医疗实体信息。
    [0145]
    在一种实施方式中,还可以包括发送模块,用于将指定类别的疾病确定结果发送至信息展示端。
    [0146]
    在一种实施方式中,指定类别的疾病包括具有传播风险的疾病。
    [0147]
    本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
    [0148]
    根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
    [0149]
    图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
    [0150]
    如图11所示,设备1100包括计算单元1110,其可以根据存储在只读存储器(rom)1120中的计算机程序或者从存储单元1180加载到随机访问存储器(ram)1130中的计算机程序,来执行各种适当的动作和处理。在ram 1130中,还可存储设备1100操作所需的各种程序和数据。计算单元1110、rom 1120以及ram 1130通过总线1140彼此相连。输入/输出(i/o)接口1150也连接至总线1140。
    [0151]
    设备1100中的多个部件连接至i/o接口1150,包括:输入单元1160,例如键盘、鼠标等;输出单元1170,例如各种类型的显示器、扬声器等;存储单元1180,例如磁盘、光盘等;以及通信单元1190,例如网卡、调制解调器、无线通信收发机等。通信单元1190允许设备1100
    通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
    [0152]
    计算单元1110可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1110的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1110执行上文所描述的各个方法和处理,例如疾病的确定方法。例如,在一些实施例中,疾病的确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1180。在一些实施例中,计算机程序的部分或者全部可以经由rom 1120和/或通信单元1190而被载入和/或安装到设备1100上。当计算机程序加载到ram 1130并由计算单元1110执行时,可以执行上文描述的疾病的确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元1110可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行疾病的确定方法。
    [0153]
    本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
    [0154]
    用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
    [0155]
    在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
    [0156]
    为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
    [0157]
    可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据
    服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
    [0158]
    计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
    [0159]
    应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
    [0160]
    上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

    技术特征:
    1.一种疾病的确定方法,包括:根据疑似患者的描述信息,确定医疗实体信息;利用所述医疗实体信息,在疾病图谱中确定与所述疑似患者相关的子图谱,所述疾病图谱是预先构建的,所述疾病图谱中至少包括疾病以及与所述疾病对应的多个实体项;利用所述疑似患者的描述信息、所述医疗实体和所述子图谱中的至少一种,对所述疑似患者进行指定类别的疾病确定。2.根据权利要求1所述的方法,其中,所述利用所述医疗实体信息,在疾病图谱中确定与所述疑似患者相关的子图谱,包括:对所述医疗实体信息进行结构化处理,得到至少一个实体项的内容;利用每个所述实体项的内容,与所述疾病图谱进行匹配,得到所述与所述疑似患者相关的子图谱。3.根据权利要求2所述的方法,其中,所述利用每个所述实体项的内容,与所述疾病图谱进行匹配,得到所述与所述疑似患者相关的子图谱,包括:遍历所述疾病图谱中的各所述实体项,得到遍历结果,所述遍历结果包括各所述实体项的内容,以及每个实体项的内容对应的权重,所述权重为动态变化的;将所述医疗实体信息与所述遍历结果进行比对,在内容相似度高于对应阈值的情况下,基于所述权重确定所述疑似患者相关的子图谱。4.根据权利要求1至3任一所述的方法,其中,所述疾病图谱的构建方式,包括:预先确定n个疾病种类,其中,n为正整数;对于第i个疾病种类,对获取到的与所述第i个疾病种类相关的多个诊断信息进行预处理,得到实体项,其中,1≤i≤n,且i为正整数;利用所述实体项在多个诊断信息中出现的频率,以及包含所述实体项的诊断信息在所有诊断信息中的占比,确定所述实体项与所述第i个疾病种类的关联关系;利用所述关联关系,构建所述疾病图谱。5.根据权利要求1所述的方法,其中,在同时利用所述疑似患者的描述信息、所述医疗实体和所述子图谱的情况下,对所述疑似患者进行指定类别的疾病确定,包括:确定所述疑似患者的描述信息的第一特征向量,以及确定所述医疗实体的第二特征向量;基于所述第一特征向量和所述第二特征向量的互注意力计算结果,得到特征向量计算结果;将所述特征向量计算结果与确定出的所述子图谱的特征向量进行拼接,得到向量集合;利用所述向量集合进行指定类别的疾病确定。6.根据权利要求1所述的方法,其中,所述根据疑似患者的描述信息,确定医疗实体信息,包括:对所述描述信息进行预处理,以提取所述描述信息的特征向量;对所述特征向量进行识别,得到医疗实体信息。7.根据权利要求1所述的方法,还包括:将所述指定类别的疾病确定结果发送至信息展示端。
    8.根据权利要求1至7任一所述的方法,所述指定类别的疾病包括具有传播风险的疾病。9.一种疾病的确定装置,包括:医疗实体信息确定模块,用于根据疑似患者的描述信息,确定医疗实体信息;子图谱确定模块,用于利用所述医疗实体信息,在疾病图谱中确定与所述疑似患者相关的子图谱,所述疾病图谱是预先构建的,所述疾病图谱中至少包括疾病以及与所述疾病对应的多个实体项;疾病确定模块,用于利用所述疑似患者的描述信息、所述医疗实体和所述子图谱中的至少一种,对所述疑似患者进行指定类别的疾病确定。10.根据权利要求9所述的装置,其中,所述子图谱确定模块,包括:实体项内容确定子模块,用于对所述医疗实体信息进行结构化处理,得到至少一个实体项的内容;子图谱确定执行子模块,用于利用每个所述实体项的内容,与所述疾病图谱进行匹配,得到所述与所述疑似患者相关的子图谱。11.根据权利要求10所述的装置,其中,所述子图谱确定执行子模块,包括:遍历结果获取单元,用于遍历所述疾病图谱中的各所述实体项,得到遍历结果,所述遍历结果包括各所述实体项的内容,以及每个实体项的内容对应的权重,所述权重为动态变化的;子图谱确定执行单元,用于将所述医疗实体信息与所述遍历结果进行比对,在内容相似度高于对应阈值的情况下,基于所述权重确定所述疑似患者相关的子图谱。12.根据权利要求9至11任一所述的装置,其中,所述子图谱确定模块,包括:疾病种类确定子模块,用于预先确定n个疾病种类,其中,n为正整数;实体项确定子模块,用于对于第i个疾病种类,对获取到的与所述第i个疾病种类相关的多个诊断信息进行预处理,得到实体项,其中,1≤i≤n,且i为正整数;关联关系确定子模块,用于利用所述实体项在多个诊断信息中出现的频率,以及包含所述实体项的诊断信息在所有诊断信息中的占比,确定所述实体项与所述第i个疾病种类的关联关系;构建执行子模块,用于利用所述关联关系,构建所述疾病图谱。13.根据权利要求9所述的装置,其中,在同时利用所述疑似患者的描述信息、所述医疗实体和所述子图谱的情况下,所述疾病确定模块,包括:特征向量确定子模块,用于确定所述疑似患者的描述信息的第一特征向量,以及确定所述医疗实体的第二特征向量;互注意力计算子模块,用于基于所述第一特征向量和所述第二特征向量的互注意力计算结果,得到特征向量计算结果;向量拼接子模块,用于将所述特征向量计算结果与确定出的所述子图谱的特征向量进行拼接,得到向量集合;疾病确定执行子模块,用于利用所述向量集合进行指定类别的疾病确定。14.根据权利要求9所述的装置,其中,所述医疗实体信息确定模块,包括:预处理子模块,用于对所述描述信息进行预处理,以提取所述描述信息的特征向量;
    医疗实体信息确定执行子模块,用于对所述特征向量进行识别,得到医疗实体信息。15.根据权利要求9所述的装置,其中,还包括发送模块,用于将所述指定类别的疾病确定结果发送至信息展示端。16.根据权利要求9至15任一所述的装置,其中,所述指定类别的疾病包括具有传播风险的疾病。17.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8中任一项所述的方法。18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至8中任一项所述的方法。19.一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

    技术总结
    本公开提供了疾病的确定方法、装置、设备以及存储介质,涉及数据处理技术领域,尤其涉及人工智能、深度学习、AI医疗等领域。具体实现方案为:根据疑似患者的描述信息,确定医疗实体信息;利用医疗实体信息,在疾病图谱中确定与疑似患者相关的子图谱,疾病图谱是预先构建的,疾病图谱中至少包括疾病以及与疾病对应的多个实体项;利用疑似患者的描述信息、医疗实体和子图谱中的至少一种,对疑似患者进行指定类别的疾病确定。通过上述过程,可以提高疾病确定的准确性。确定的准确性。确定的准确性。


    技术研发人员:郭佳昌 梅祥 陈俊 代小亚 黄海峰
    受保护的技术使用者:北京百度网讯科技有限公司
    技术研发日:2022.02.18
    技术公布日:2022/5/25
    转载请注明原文地址:https://tc.8miu.com/read-8016.html

    最新回复(0)