本发明涉及生物信息学、基因检测和医学领域,特别涉及一种基于大模型的风险预测变异位点筛选评价系统及方法,尤其涉及基于人工智能的风险预测变异位点筛选评价系统及方法。
背景技术:
1、在精准医学的大背景下,遗传变异位点的识别、评估和筛选对于疾病风险预测和个性化医疗具有重要意义。传统的变异位点筛选方法通常依赖于手工查阅文献和专家经验,存在效率较低、较难大规模查阅文章、人工查阅的文献数量有限且不一定全面、费时费力、易受主观因素影响等问题,难以系统化和规模化。
2、因此,亟需一种基于人工智能的风险预测变异位点筛选评价系统及方法,能够高效、准确地筛选和评估变异位点,以便辅助临床基因检测和风险预测。
技术实现思路
1、基于此,有必要针对上述技术问题,提供基于人工智能的风险预测变异位点筛选评价系统及方法。
2、根据本发明的第一方面,提供了基于人工智能的风险预测变异位点筛选评价系统,包括文献检索模块、评价指标提取模块、评分模块、变异位点筛选模块和用户交互模块;所述文献检索模块用于接收并响应用户交互模块发送的目标风险因素关键词查询请求,通过llm大语言模型调用文献数据库api,查找搜索与目标风险因素关键词相关的目标文献数据列表,并将目标文献数据列表发送至用户交互模块;所述评价指标提取模块用于从目标文献数据列表中提取出所有目标文献数据包含变异位点的评价指标字段和关键指标字段,基于关键指标字段,从组学数据库中获取与变异位点相关的基因变异位点组学信息字段,以及对关键指标字段和基因变异位点组学信息字段进行结构化处理,得到以csv格式数据存储的变异位点的所有字段信息,并将变异位点的所有字段信息发送至用户交互模块;所述评分模块用于根据预设的评价指标,构建变异位点评价体系,并对每项评价指标赋予相应的评分标准,以及根据各项评价指标和相应的评分标准,综合所有目标文献数据,计算各变异位点对应的每项评价指标评分和综合评分;其中,所述预设的评价指标与评价指标字段之间形成映射关系;所述变异位点筛选模块用于对各变异位点的综合评分由高到低排序,根据预设的变异位点评级规则,对变异位点进行位点评级,得到各变异位点的变异位点评级结果,并将各变异位点对应的每项评价指标评分、综合评分和对应的变异位点评级结果发送至用户交互模块;接收并响应用户交互模块发送的筛选条件查询请求或目标变异位点查询请求,对变异位点进行动态位点筛选,得到对应筛选条件查询请求的条件筛选结果或对应目标变异位点查询请求的目标筛选结果,并将得到的条件筛选结果或目标筛选结果发送至用户交互模块;以及对条件筛选结果和/或目标筛选结果进行动态组合处理和命名处理,创建出风险位点panel;所述用户交互模块用于获取用户输入的目标风险因素关键词查询请求、筛选条件查询请求和目标变异位点查询请求,将目标风险因素关键词查询请求发送至文献检索模块,将筛选条件查询请求和目标变异位点查询请求发送至变异位点筛选模块,存储、查找搜索、显示和导出目标文献数据列表、变异位点的所有字段信息、各变异位点对应的每项评价指标评分、综合评分、对应的变异位点评级结果、条件筛选结果和目标筛选结果,以及显示和管理创建的风险位点panel对应的相关信息。
3、可选地,所述文献检索模块包括:第一响应子模块,用于接收并响应用户交互模块发送的目标风险因素关键词查询请求;用户输入预处理子模块,用于对目标风险因素关键词查询请求中包含的目标风险因素关键词进行去除停用词预处理和词干提取预处理,得到有效关键词;扩展和解析子模块,用于通过llm大语言模型对有效关键词进行解析处理,得到与有效关键词相关的解析医学术语关键词和扩展同义词;查询字符串生成子模块,用于根据解析医学术语关键词和扩展同义词,生成与文献数据库进行交互的查询字符串;筛选子模块,用于通过文献数据库api调用文献数据库,基于查询字符串,对文献数据库的所有文献数据的标题和摘要进行筛选处理,或采用字符相似度算法,计算文献数据的标题或摘要与查询字符串的相似度,筛选出与目标风险因素关键词相关的文献数据;第一格式化处理子模块,用于对筛选出的与目标风险因素关键词相关的文献数据进行格式化处理,得到以json格式数据存储的目标文献数据,基于目标文献数据,生成目标文献数据列表,并将目标文献数据列表发送至用户交互模块。
4、可选地,所述评价指标提取模块包括:文献数据预处理子模块,用于对目标文献数据列表中的所有目标文献数据进行数据清洗处理和标准化处理,得到目标文献处理数据;第一信息提取子模块,用于通过机器学习算法对目标文献处理数据进行信息提取处理,提取出评价指标字段和关键指标字段;所述评价指标字段包括杂志影响力字段、样本量字段、研究人群字段、证据级别字段、变异位点or/hr值字段和变异位点文献报道次数字段,所述关键指标字段包括对应变异位点的基因名字段、refsnp标识符字段、风险因素字段和效应等位基因字段;第二信息提取子模块,用于根据关键指标字段,从组学数据库中获取与变异位点相关的基因变异位点组学信息字段;所述基因变异位点组学信息字段包括基因字段、cds突变语法字段、氨基酸替换字段、染色体字段、hg起始位置字段、hg结束位置字段、参考序列字段、替代序列字段、链字段、基因组组装版本字段、位置字段、maf值字段和变异机制字段;第二结构化处理子模块,用于对关键指标字段和基因变异位点组学信息字段进行结构化处理,得到以csv格式数据存储的变异位点的所有字段信息,并将变异位点的所有字段信息发送至用户交互模块,所述变异位点的所有字段信息包括对应变异位点的关键指标字段和基因变异位点组学信息字段。
5、可选地,所述评分模块包括:评价体系构建子模块,用于根据预设的评价指标,构建变异位点评价体系,并对每项评价指标赋予相应的评分标准;其中,所述预设的评价指标与评价指标字段之间形成映射关系,所述评价指标包括杂志影响力、样本量、研究人群、证据级别、变异位点or/hr值和变异位点文献报道次数;评分计算子模块,用于根据各项评价指标和相应的评分标准,综合所有目标文献数据,计算各变异位点对应的每项评价指标评分和综合评分。
6、可选地,所述变异位点筛选模块包括:位点评级子模块,用于对各变异位点的综合评分由高到低排序,根据预设的变异位点评级规则,对变异位点进行位点评级,得到各变异位点的变异位点评级结果,并将各变异位点对应的每项评价指标评分、综合评分和对应的变异位点评级结果发送至用户交互模块;第二响应子模块,用于接收并响应用户交互模块发送的筛选条件查询请求或目标变异位点查询请求,对变异位点进行动态位点筛选,得到对应筛选条件查询请求的条件筛选结果或对应目标变异位点查询请求的目标筛选结果,并将得到的条件筛选结果或目标筛选结果发送至用户交互模块;风险位点panel创建子模块,用于根据用户需求,对筛选结果进行动态组合处理和命名处理,创建出风险位点panel。
7、可选地,所述用户交互模块包括:panel管理子模块,用于显示、新增、删减和更新创建的风险位点panel对应的相关信息,所述风险位点panel对应的相关信息包括panelid、名称、位点数和位点信息,所述位点信息包括变异位点对应的每项评价指标评分、综合评分、异位点评级结果、与对应变异位点相关的目标文献数据、与对应变异位点相关的评价指标字段、与对应变异位点相关的关键指标字段以及基因变异位点组学信息字段;位点管理子模块,获取用户输入的目标风险因素关键词查询请求、筛选条件查询请求和目标变异位点查询请求,将目标风险因素关键词查询请求发送至文献检索模块,将筛选条件查询请求和目标变异位点查询请求发送至变异位点筛选模块,存储、查找搜索、显示和导出目标文献数据列表、变异位点的所有字段信息、各变异位点对应的每项评价指标评分、综合评分、对应的变异位点评级结果、条件筛选结果和目标筛选结果。
8、可选地,所述位点管理子模块还包括:变异位点子模块,用于获取用户输入的目标变异位点查询请求,将目标变异位点查询请求发送至变异位点筛选模块,存储、查找搜索、显示和导出目标筛选结果,以及存储、查找搜索和显示变异位点的所有字段信息;风险预测子模块,用于获取用户输入的目标风险因素关键词查询请求和筛选条件查询请求,存储、查找搜索、显示和导出目标文献数据列表、各变异位点对应的每项评价指标评分、综合评分、对应的变异位点评级结果和条件筛选结果。
9、根据本发明的第二方面,提供了基于人工智能的风险预测变异位点筛选评价方法,该方法包括:通过用户交互模块获取用户输入的目标风险因素关键词查询请求、筛选条件查询请求和目标变异位点查询请求,将目标风险因素关键词查询请求发送至文献检索模块,将筛选条件查询请求和目标变异位点查询请求发送至变异位点筛选模块;通过文献检索模块接收并响应用户交互模块发送的目标风险因素关键词查询请求,通过llm大语言模型调用文献数据库api,查找搜索与目标风险因素关键词相关的目标文献数据列表,并将目标文献数据列表发送至用户交互模块;通过评价指标提取模块从目标文献数据列表中提取出所有目标文献数据包含变异位点的评价指标字段和关键指标字段,基于关键指标字段,从组学数据库中获取与变异位点相关的基因变异位点组学信息字段,以及对关键指标字段和基因变异位点组学信息字段进行结构化处理,得到以csv格式数据存储的变异位点的所有字段信息,并将变异位点的所有字段信息发送至用户交互模块;通过评分模块根据预设的评价指标,构建变异位点评价体系,并对每项评价指标赋予相应的评分标准,以及根据各项评价指标和相应的评分标准,综合所有目标文献数据,计算各变异位点对应的每项评价指标评分和综合评分;其中,所述预设的评价指标与评价指标字段之间形成映射关系;通过变异位点筛选模块对各变异位点的综合评分由高到低排序,根据预设的变异位点评级规则,对变异位点进行位点评级,得到各变异位点的变异位点评级结果,并将各变异位点对应的每项评价指标评分、综合评分和对应的变异位点评级结果发送至用户交互模块;接收并响应用户交互模块发送的筛选条件查询请求或目标变异位点查询请求,对变异位点进行动态位点筛选,得到对应筛选条件查询请求的条件筛选结果或对应目标变异位点查询请求的目标筛选结果,并将得到的条件筛选结果或目标筛选结果发送至用户交互模块;以及对条件筛选结果和/或目标筛选结果进行动态组合处理和命名处理,创建出风险位点panel;通过用户交互模块存储、查找搜索、显示和导出目标文献数据列表、变异位点的所有字段信息、各变异位点对应的每项评价指标评分、综合评分、对应的变异位点评级结果、条件筛选结果和目标筛选结果,以及显示和管理创建的风险位点panel对应的相关信息。
10、根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
11、根据本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
12、本发明的优点及有益效果在于:本发明提供的基于人工智能的风险预测变异位点筛选评价系统及方法,该系统支持自动化实现地文献检索、评价指标提取、位点评分、变异位点筛选等功能,首先,通过llm大语言模型解析用户输入的目标风险因素关键词,并自动生成查询字符串,通过调用文献数据库api,以便实现对文献的精准检索;随后,利用机器学习算法自动提取文献中的评价指标和关键指标,并从组学数据库中获取与变异位点相关的基因变异位点组学信息,对提取的关键指标字段和基因变异位点组学信息字段进行结构化存储,并通过评分模块进行综合评价,按照预设的规则和评分标准计算变异位点的综每项评价指标评分和综合评分;最后,通过变异位点筛选模块根据评分结果进行排序和筛选,用户通过用户交互模块与系统进行交互,查看筛选结果并导出相关数据,以及用户根据实际需要,可进行panel位点的个性化组合来构建风险位点panel。本系统不仅能够有效提高变异位点筛选的效率和准确性,还能够有效地筛选出高质量的变异位点,以便为疾病风险预测、个性化医疗和临床基因检测提供重要支持。
1.基于人工智能的风险预测变异位点筛选评价系统,其特征在于,包括文献检索模块、评价指标提取模块、评分模块、变异位点筛选模块和用户交互模块;
2.根据权利要求1所述的基于人工智能的风险预测变异位点筛选评价系统,其特征在于,所述文献检索模块包括:
3.根据权利要求2所述的基于人工智能的风险预测变异位点筛选评价系统,其特征在于,所述评价指标提取模块包括:
4.根据权利要求3所述的基于人工智能的风险预测变异位点筛选评价系统,其特征在于,所述评分模块包括:
5.根据权利要求4所述的基于人工智能的风险预测变异位点筛选评价系统,其特征在于,所述变异位点筛选模块包括:
6.根据权利要求5所述的基于人工智能的风险预测变异位点筛选评价系统,其特征在于,所述用户交互模块包括:
7.根据权利要求6所述的基于人工智能的风险预测变异位点筛选评价系统,其特征在于,所述位点管理子模块还包括:
8.基于人工智能的风险预测变异位点筛选评价方法,其特征在于,该方法包括:
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求8中所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求8中所述方法的步骤。