本专利申请案是2023年3月29日申请的第pct/us2023/016649号国际专利申请案进入中国国家阶段的专利申请案,所述国际专利申请案主张2022年3月29日申请的美国临时专利申请案序号63/362,124的权益及优先权,上述每个专利申请案的全部内容均以引用的方式并入到本文中。本发明系关于处理细胞计数数据的方法及装置。特别地,本发明系关于用于血液科恶性疾病分类的处理细胞计数数据的方法及装置。
背景技术:
1、血液科恶性疾病为血液、骨髓及淋巴结的癌症。此等血液科恶性疾病与大量的发病率及死亡率相关,且对生活质量产生不利影响。必须对血液科恶性疾病进行精确分类,以便为每位新来的患者选择适当的治疗策略。血液科恶性疾病起源于且在不同程度上再现产生血细胞及其他对免疫刺激有反应的细胞的细胞谱系及细胞发育阶段的复杂多样性。此导致不同的疾病特征及预后。举例而言,急性淋巴母细胞性白血病(all)及急性骨髓性白血病(aml)分别由淋巴细胞及骨髓细胞的异常引起。急性前髓细胞性白血病(apl)为aml的一种亚型,且其他类型的血液科恶性疾病诸如慢性淋巴细胞性白血病(cll)及多种淋巴瘤均具有不同的症状、预后,且需要不同的治疗策略。
技术实现思路
1、由于血液科恶性疾病的种类繁多,因此快速且精确的分类对于有效疾病管理及治愈患者的第一步至关重要。
2、流动式细胞测量术(flow cytometry,fc)自骨髓、血液或淋巴组织检体的高通量个别细胞流生成数据,用于高质量的血液科恶性疾病筛查、诊断及监测。经荧光标签标记的抗体允许借由流动式细胞测量术表征细胞蛋白质(亦即抗原)的复杂表现。检体样本中的数千或数百万个细胞系使用一组多种抗体进行评估,该等抗体借由专门用于不同荧光标签发射的通道相互区分,从而产生大量数据点。医师或检查员依靠可视觉化工具在二维散点图上显示指示细胞群中成对抗原表现的荧光,且随后他们执行分级门控程序以鉴别异常细胞群。在医师或检查员对多对抗体-荧光组合进行解读后,可接着结合对形态学发现的评估及其他适当测试来确定患者的血液科恶性疾病的类型。fc的手动门控过程为费力的且受医师间主观性的影响。目前的工具辅助门控过程且大多仅提供无监督的细胞群丛集。此等工具的目的为快速鉴别似乎形成相关丛集的细胞群;然而,产生解释的最终程序本身保持不变。
3、区分血液科恶性疾病的类型对于确定新诊断患者的治疗策略至关重要。流动式细胞测量术(fc)可借由量测数千个抗体结合细胞上的多参数荧光标记物用作诊断指标,但对于血液学家及实验室专业人士而言,大规模细胞测量术数据的人工解读长期以来一直是一项耗时且复杂的任务。一些实施例导致表示学习算法的开发,以执行样本级自动分类。在此项工作中,吾等提出分块池化策略,将大规模fc数据纳入用于自动血液科恶性疾病分类的监督深度表示学习程序中。使用判别式训练的表示学习策略及固定大小的分块及池化设计为本发明中所提供的框架的两个特征。其提高fc样本级嵌入(或池化)的判别能力,且同时解决由于在习知基于分布的方法中不可避免地使用降采样来推导fc表示而导致的鲁棒性问题。本发明中所提供的框架在两个数据集上进行评估。吾等框架优于其他基线方法,在upmc(匹兹堡大学医学中心,university of pittsburgh medical center)数据集上的四类识别实现92.3%的未加权平均召回率(uar)及在hema.to数据集上的五类识别实现85.0%的uar。吾等进一步比较吾等提出的框架与传统降采样方法的鲁棒性。对块大小及错误案例的影响的分析揭示关于fc数据中不同血液科恶性疾病特征的进一步洞察。
4、本发明提供新颖的方法或装置来有效地处理细胞计数数据,且因此可帮助医师或检查员有效地确定患者的血液科恶性疾病的类型。此外,传统的处理细胞计数数据的方法需要过多的计算能力及存储器空间。本发明中所提供的新颖方法或装置可节省计算能力、存储器空间及消耗的电力。
5、为了应对计算能力及存储器空间的瓶颈,提出对细胞计数数据进行随机降采样的操作,然此类随机降采样可能会产生不必要的变异性,且亦有丢弃重要细胞数据或残余肿瘤细胞数据的风险。本发明中所提供的新颖方法或装置可减少不必要的变异性及丢弃重要细胞数据或残余肿瘤细胞数据的风险。
6、本文所揭示的例示性实施例系关于解决与先前技术中所呈现的一或多个问题相关的问题,以及提供额外特征,该等特征在结合随附图式时借由参考以下实施方式将变得显而易见。根据各种实施例,本文揭示例示性系统、方法、装置及计算机程序产品。然而,应理解,此等实施例以举例方式呈现而非限制,且对于阅读本发明的一般熟习此项技术者将显而易见,可对所揭示的实施例进行各种修改,同时保持在本发明的范畴内。
7、本发明的一实施例提供一种处理细胞计数数据的方法。所述方法包含:将第一数据矩阵划分成第一多个第一子矩阵;将该等第一子矩阵中的各者编码成一个相应的矢量表示,以获得第一多个矢量表示;及将所述第一多个矢量表示聚合成第一集合表示。所述第一数据矩阵指示第一组细胞的第一多个特性。
8、本发明的另一实施例提供一种用于处理细胞计数数据的装置。所述装置包含处理器及与处理器耦接的存储器。处理器执行存储于存储器中的计算机可读指令以执行操作。该等操作包含:接收指示第一组细胞的第一多个特性的第一数据矩阵;借由处理器,将所述第一数据矩阵划分成第一多个第一子矩阵;借由处理器,将所述等第一子矩阵中的各者编码成一个相应的矢量表示,以获得第一多个矢量表示;及借由处理器,将所述第一多个矢量表示聚合成第一集合表示。
1.一种处理细胞计数数据的方法,其特征在于,包含:
2.如权利要求1所述的方法,其特征在于,进一步包含:
3.如权利要求2所述的方法,其特征在于,进一步包含:
4.如权利要求1所述的方法,其特征在于,编码该等第一子矩阵中的各者包括转置该等第一子矩阵中的各者。
5.如权利要求1所述的方法,其特征在于,该等第一子矩阵中的各者基于以下中的至少一者经编码成一个相应的矢量表示:费舍尔矢量编码方法或局部聚合描述符矢量编码方法。
6.如权利要求5所述的方法,其特征在于,进一步包含:
7.如权利要求1所述的方法,其特征在于,将所述第一多个矢量表示聚合成所述第一集合表示包括基于所述第一多个矢量表示的特征维度聚合所述第一多个矢量表示。
8.如权利要求7所述的方法,其特征在于,基于该等特征维度聚合所述第一多个矢量表示包括对所述第一多个矢量表示的各特征维度执行以下函数中的至少一者:
9.如权利要求7所述的方法,其特征在于,所述第一多个矢量表示的该等特征维度的数目与所述第一多个特性的数目相关联。
10.如权利要求1所述的方法,其特征在于,所述第一数据矩阵系自所述第一组细胞的抗体荧光量测中获得。
11.一种处理细胞计数数据的装置,其特征在于,包含:
12.如权利要求11所述的装置,其特征在于,该等操作进一步包含:
13.如权利要求12所述的装置,其特征在于,该等操作进一步包含:
14.如权利要求11所述的装置,其特征在于,编码该等第一子矩阵中的各者包括转置该等第一子矩阵中的各者。
15.如权利要求11所述的装置,其特征在于,该等第一子矩阵中的各者基于以下中的至少一者经编码成一个相应的矢量表示:费舍尔矢量编码方法或局部聚合描述符矢量编码方法。
16.如权利要求15所述的装置,其特征在于,该等操作进一步包含:
17.如权利要求11所述的装置,其特征在于,将所述第一多个矢量表示聚合成所述第一集合表示包括基于所述第一多个矢量表示的特征维度聚合所述第一多个矢量表示。
18.如权利要求17所述的装置,其特征在于,基于该等特征维度聚合所述第一多个矢量表示包括对所述第一多个矢量表示的各特征维度执行以下函数中的至少一者:
19.如权利要求17所述的装置,其特征在于,所述第一多个矢量表示的该等特征维度的数目与所述第一多个特性的数目相关联。
20.如权利要求11所述的装置,其特征在于,所述第一数据矩阵系自所述第一组细胞的抗体荧光量测中获得。
