本发明涉及图像识别,尤其是指一种小样本直肠癌mr图像的完全可解释的分期预测方法、装置及介质。
背景技术:
1、直肠的核磁共振(magnetic resonance,mr)图像能够提供直肠的高软组织对比度的详细图像,这使得医务人员能够较准确的评估直肠癌的分期,从而为制定有效的治疗方案提供重要依据。一般来说,对于t1和t2期的直肠癌,医务人员通常不建议进行术前治疗,而是直接进行手术。然而,对于t3和t4期的直肠癌,依据现行的直肠癌治疗指南,术前化学放疗通常被视为标准治疗方法。由于术前化学放疗对身体可能造成不可逆的损伤且费用昂贵,因此准确预测t2和t3期直肠癌的分期成为直肠癌分期预测及后续治疗的关键环节。传统的直肠癌mr图像的分期预测方法依赖于手工提取的特征,例如血管结构或局部斑块等特征,然而,提取这些特征通常需要本领域医护人员丰富的专业知识和经验,人工成本高,分期预测速度慢。
2、近年来,随着人工智能技术在医学研究中的不断发展,越来越多的机器学习模型被应用于直肠癌mr图像的预测任务中。但大多数研究都不可避免地面临以下两个困境:(1)缺乏可解释性,包括缺乏基于模型的可解释性和缺乏基于结果的可解释性。现有的直肠癌预测分期模型大多基于深度神经网络,但深度神经网络本身是黑盒模型,由于其抽象的输入特征和无法解释的结构,所以对结果或者是模型都缺乏可解释性;(2)小样本学习问题,由于患者的隐私和安全问题,研究者通常无法获取足够数量的直肠癌mr图像,所以小样本学习是医学研究中机器学习模型经常面临的挑战,它往往会导致模型拟合不足、泛化能力差以及分类器不稳定等问题。尽管现有的一些基于数据层面如数据增强、数据合成等或算法层面如l1、l2和其他正则化技术的小样本学习方法已被用于医学图像预测任务,但其存在缺乏可解释性、过拟合风险或者计算复杂度高的问题。
3、因此,一种在少量直肠癌mr图像上仍可以实现完全可解释的直肠癌分期预测,且分期预测效率较高的方法亟待提出。
技术实现思路
1、为此,本发明所要解决的技术问题在于克服现有技术中难以在小样本直肠癌mr图像上实现完全可解释的直肠癌分期预测,且保证较高的分期预测效率的问题。
2、为解决上述技术问题,本发明提供了一种小样本直肠癌mr图像的完全可解释的分期预测方法,包括以下步骤:
3、对直肠癌mr图像进行预处理;
4、计算预处理后的直肠癌mr图像的共生矩阵并通过共生矩阵提取预处理后的直肠癌mr图像的d维物理特征,将预处理后的直肠癌mr图像的真实标签作为第d+1维物理特征,则共有d+1维物理特征;
5、根据预处理后的直肠癌mr图像及其真实标签确定k个聚类,聚类表征直肠癌分期阶段;对预处理后的所有直肠癌mr图像的d+1维物理特征使用模糊c均值算法,输出k个聚类的相关信息,其中,相关信息包括第k个聚类下,所有预处理后的直肠癌mr图像的第d维特征的均值,方差及第k个聚类的协方差矩阵;其中,k=1,2,...,k;d=1,2,...,d+1;
6、以k个聚类的相关信息训练tsk模糊系统,得到初始直肠癌分期预测模型;将预处理后的直肠癌mr图像及其真实标签输入初始直肠癌分期预测模型,输出预处理后的直肠癌mr图像的分期预测值;
7、根据预处理后的直肠癌mr图像的分期预测值,以预处理后的直肠癌mr图像的预测误差、输出方差和改进的特征分布损失,构建初始直肠癌分期预测模型中模糊规则的规则权重的凸优化目标函数;其中,改进的特征分布损失包括将特征分布损失进行泰勒展开并舍去所有高于两次的项;
8、结合预处理后的直肠癌mr图像的d+1维物理特征,以解析解的形式对凸优化目标函数求解,得到优化后的直肠癌分期预测模型中模糊规则的规则权重,从而得到优化后的直肠癌分期预测模型。
9、优选地,对直肠癌mr图像进行预处理包括:强度归一化、直方图均衡化预处理。
10、优选地,d+1维物理特征具体包括:能量、对比度、相关性、熵、同质性、真实标签;其中,d+1维物理特征表征直肠癌mr图像的纹理和结构信息。
11、优选地,第k个聚类的协方差矩阵,表达式如下:
12、,
13、其中,表示第k个聚类下所有预处理后的直肠癌mr图像的第 i维特征和第 j维特征之间的协方差组成的 d× d的矩阵, i, j=1,2,…, d;
14、表示第k个聚类下所有预处理后的直肠癌mr图像的第 j维特征和第 d+1维特征之间的协方差组成的 d×1的向量;
15、表示第k个聚类下所有预处理后的直肠癌mr图像的第 d+1维特征和第 j维特征之间的协方差组成的1× d的向量;
16、表示第k个聚类下所有预处理后的直肠癌mr图像的第 d+1维特征和第 d+1维特征的协方差;
17、第k个聚类的协方差矩阵的逆矩阵,表达式如下:
18、,
19、其中,表示中前d行前d列的元素组成的矩阵;表示中第d+1列中前d行的元素组成的向量;表示中第d+1行中前d列元素组成的向量;表示中第d+1行第d+1列处的元素。
20、优选地,以k个聚类的相关信息训练tsk模糊系统,得到初始直肠癌分期预测模型包括:
21、根据k个聚类定义k条一阶模糊规则,其中和分别表示第k条模糊规则的前件均值参数、前件方差参数;其中,k=1,2,…,k,表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征的均值,d=1,2,...,d;表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征和第d维特征的方差;
22、,k=1,2,…,k表示对应的第k条模糊规则的后件常数项参数,表示对应的第k条模糊规则的后件多项式系数;其中表示第k个聚类下所有预处理后的直肠癌mr图像第 d+1维特征的均值,表示由第k个聚类下所有预处理后的直肠癌mr图像的每维特征的均值组成的列向量。
23、优选地,改进的特征分布损失,表达式如下:
24、,
25、其中,表示每条模糊规则的规则权重组成的列向量,表示第k条模糊规则的规则权重,其中k=1,2,...,k;表示的转置;是一个k×1的列向量,其中第k个元素由第k条模糊规则的前件参数决定:;
26、其中,表示第k个聚类下所有预处理后的直肠癌mr图像的d维特征的正态密度分布函数;表示第n张预处理后的直肠癌mr图像 d维特征的列向量,表示第k个聚类下所有预处理后的直肠癌mr图像的第 i维特征和第 j维特征之间的协方差组成的 d× d的矩阵, i, j=1,2,…, d;表示由第k个聚类下所有预处理后的直肠癌mr图像的每维特征的均值组成的列向量;表示的转置;n表示预处理后的直肠癌mr图像的数量;
27、初始直肠癌分期预测模型中模糊规则的规则权重的凸优化目标函数,表达式如下:
28、,
29、,
30、其中,表示预处理后的直肠癌mr图像的预测误差,表示预处理后的直肠癌mr图像的输出方差,表示预处理后的直肠癌mr图像的改进的特征分布损失;表示第n张预处理后的直肠癌mr图像的分期预测值,是第n张预处理后的直肠癌mr图像对应的真实标签,和表示预设的正超参数,取值范围分别为和;
31、表示一个k×1的列向量;其中第k个元素由第k条模糊规则的前件参数和后件参数相乘决定:
32、,
33、其中,表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征的正态密度分布函数;表示第n张直肠癌mr图像第d维特征;表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征的均值,表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征和第d维特征的方差;表示的伪逆;表示第k个聚类下所有预处理后的直肠癌mr图像第 d+1维特征的均值;
34、表示一个k×1的列向量,其中第k个元素的计算公式如下:
35、。
36、优选地,以解析解的形式对凸优化目标函数求解,得到优化后的直肠癌分期预测模型中模糊规则的规则权重包括:使用凸优化技术对凸优化目标函数直接求解,得到规则权重的解析解即全局最优解,归一化规则权重的解析解,将归一化后的规则权重的解析解作为优化后的初始直肠癌分期预测模型中模糊规则的规则权重。
37、优选地,规则权重的解析解,表达式如下:
38、,
39、其中,是一个k×1的列向量,第k个元素由第k条模糊规则的前件参数决定:;表示的转置;表示第k个聚类下所有预处理后的直肠癌mr图像的d维特征的正态密度分布函数,其中,表示第n张预处理后的直肠癌mr图像的 d维特征的列向量;是第n张预处理后的直肠癌mr图像对应的真实标签;表示第k个聚类下所有预处理后的直肠癌mr图像的第 i维特征和第 j维特征之间的协方差组成的 d× d的矩阵, i, j=1,2,…, d;表示由第k个聚类下所有预处理后的直肠癌mr图像的每维特征的均值组成的列向量;n表示预处理后的直肠癌mr图像的数量;
40、表示一个k×1的列向量;其中第k个元素由第k条模糊规则的前件参数和后件参数相乘决定:
41、,
42、其中, 表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征的正态密度分布函数;表示第n张直肠癌mr图像第d维特征;表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征的均值,表示第k个聚类下所有预处理后的直肠癌mr图像的第d维特征和第d维特征的方差;表示的伪逆;表示第k个聚类下所有预处理后的直肠癌mr图像第 d+1维特征的均值;
43、表示一个k×1的列向量,其中第 k个元素的计算公式如下:
44、,
45、其中,和表示预设的正超参数,取值范围分别为和,表示第个聚类的协方差矩阵,表示中第d+1行中前d列元素组成的向量;表示第个聚类的协方差矩阵的逆矩阵;表示中第d+1行第d+1列处的元素。
46、本发明还提供了一种小样本直肠癌mr图像的完全可解释的分期预测装置,包括:
47、预处理模块,用于对直肠癌mr图像进行预处理;
48、提取特征模块,用于计算预处理后的直肠癌mr图像的共生矩阵并通过共生矩阵提取预处理后的直肠癌mr图像的d维物理特征,将预处理后的直肠癌mr图像的真实标签作为第d+1维物理特征,则共有d+1维物理特征;
49、聚类模块,用于根据预处理后的直肠癌mr图像及其真实标签确定k个聚类,聚类表征直肠癌分期阶段;对预处理后的直肠癌mr图像的d+1维物理特征使用模糊c均值算法,输出k个聚类的相关信息,其中,相关信息包括第k个聚类下,所有预处理后的直肠癌mr图像的第d维特征的均值,方差及第k个聚类的协方差矩阵;其中,k=1,2,...,k;d=1,2,...,d+1;
50、生成初始模型模块,用于以k个聚类的相关信息训练tsk模糊系统,得到初始直肠癌分期预测模型;将预处理后的直肠癌mr图像及其真实标签输入初始直肠癌分期预测模型,输出预处理后的直肠癌mr图像的分期预测值;
51、构建凸优化目标函数模块,用于根据预处理后的直肠癌mr图像的分期预测值,以预处理后的直肠癌mr图像的预测误差、输出方差和改进的特征分布损失,构建初始直肠癌分期预测模型中模糊规则的规则权重的凸优化目标函数;其中,改进的特征分布损失包括将特征分布损失进行泰勒展开并舍去所有高于两次的项;
52、优化模型模块,用于结合预处理后的直肠癌mr图像的d+1维物理特征,以解析解的形式对凸优化目标函数求解,得到优化后的直肠癌分期预测模型中模糊规则的规则权重,从而得到优化后的直肠癌分期预测模型。
53、本发明还提供了一种小样本直肠癌mr图像的完全可解释的分期预测计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的小样本直肠癌mr图像的完全可解释的分期预测方法的步骤。
54、本发明的上述技术方案相比现有技术具有以下有益效果:
55、本发明所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,首先计算预处理后的直肠癌mr图像的共生矩阵并通过共生矩阵提取预处理后的直肠癌mr图像的物理特征,这些物理特征表征了直肠癌mr图像的纹理和结构信息,例如病变组织和正常组织之间的纹理、结构差异,有助于医生依据这些特征进行诊断。其次根据预处理后的直肠癌mr图像及其真实标签确定k个聚类,每个聚类表征不同的直肠癌分期阶段;对预处理后的直肠癌mr图像的物理特征使用模糊c均值算法,输出k个聚类的相关信息;根据k个聚类定义了k条模糊规则,将k个聚类的相关信息训练tsk模糊系统,可以确定k条模糊规则的前件部分的参数、后件部分的参数,得到初始直肠癌分期预测模型;通过k个聚类的相关信息,模型可以学习如何根据直肠癌mr图像的特征预测分配适当的癌症分期。然后,将特征分布损失进行泰勒展开并舍去所有高于二次的项作为改进的特征分布损失,平衡了实际预测时计算的复杂度和精度,能够支持对小样本直肠癌mr图像的预测;以训练误差、输出方差和改进的特征分布损失构建初始直肠癌分期预测模型中模糊规则的规则权重的凸优化目标函数,简化了优化过程,减少了对直肠癌mr图像的过拟合风险,提高了直肠癌分期模型的泛化能力;结合预处理后的直肠癌mr图像的d+1维物理特征,以解析解的形式对凸优化目标函数求解,保证了对直肠癌分期预测训练过程的快速性和高效性,得到优化后的规则权重,从而得到优化后的直肠癌分期预测模型。
56、由于优化后的直肠癌分期预测模型基于tsk模糊系统,使得其中的直肠癌分期规则具有可读性,直观且易于理解,使得每个直肠癌分期规则都可以明确解释预测结果的依据。本发明方法提供了比许多“黑盒”模型(如深度学习模型)更为直观和易于理解的决策过程,从而增强了直肠癌分期预测模型的可解释性,有助于医疗人员分析和理解直肠癌mr图像的含义。同时本发明方法提高了在小样本直肠癌mr图像上分期预测的准确性。实验结果表明,本发明方法在测试性能、训练时间和可解释性方面均优于其他方法。
1.一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,对直肠癌mr图像进行预处理包括:强度归一化、直方图均衡化预处理。
3.根据权利要求1所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,d+1维物理特征具体包括:能量、对比度、相关性、熵、同质性、真实标签;其中,d+1维物理特征表征直肠癌mr图像的纹理和结构信息。
4.根据权利要求1所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,第k个聚类的协方差矩阵,表达式如下:
5.根据权利要求4所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,以k个聚类的相关信息训练tsk模糊系统,得到初始直肠癌分期预测模型包括:
6.根据权利要求4所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,改进的特征分布损失,表达式如下:
7.根据权利要求1所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,以解析解的形式对凸优化目标函数求解,得到优化后的直肠癌分期预测模型中模糊规则的规则权重包括:使用凸优化技术对凸优化目标函数直接求解,得到规则权重的解析解即全局最优解,归一化规则权重的解析解,将归一化后的规则权重的解析解作为优化后的初始直肠癌分期预测模型中模糊规则的规则权重。
8.根据权利要求7所述的一种小样本直肠癌mr图像的完全可解释的分期预测方法,其特征在于,规则权重的解析解,表达式如下:
9.一种小样本直肠癌mr图像的完全可解释的分期预测装置,其特征在于,包括:
10.一种小样本直肠癌mr图像的完全可解释的分期预测计算机可读存储介质,其特征在于,包括: