一种自适应模型的训练方法、装置及终端设备

    专利查询2025-04-18  16


    本申请属于跨域分类,尤其涉及一种自适应模型的训练方法、装置及终端设备。


    背景技术:

    1、近年来,随着信息技术的飞速发展,机器学习在人们的日常生活中发挥着重要的作用。监督学习是机器学习中的一个最成熟、应用最为广泛的分支。传统的监督学习要求训练数据与样本数据都来源于相同的联合概率分布口。在这个条件下,利用已标记的训练数据学得的模型能够对未标记样本数据做出很好的预测。遗憾的是,这个假设条件在实际的应用问题中,如文档分类、情感分析、物体识别、遥感图像分类等领域,往往不容易成立。更多的情况是,训练数据与样本数据是在不同的环境(联合分布)中采集的。为了能够训练出好的预测模型,一个最直接的做法是在测试环境中再采集一批训练数据并对其进行标注,用于替代原先的训练数据。

    2、然而,对数据进行重新的收集和标记往往需要较高的时间和人力成本。例如在医疗影像分析领域,要求专业的医生对医疗影像进行标注,需要不少的时间以及不菲的资金开销。此时,如何有效利用己有的训练数据来获得在样本数据上表现良好的预测模型,成为一个至关重要的问题。


    技术实现思路

    1、本申请实施例提供了一种自适应模型的训练方法、装置及终端设备,可以更好地实现知识的转移,同时提高目标模型的聚类能力和泛化能力。

    2、第一方面,本申请实施例提供了一种自适应模型的训练方法,包括:

    3、获取目标域的初始训练模型,其中,初始训练模型是基于目标域的样本数据集对源域模型进行初始化处理得到的,初始训练模型包含分类权重不同的第一分类器和第二分类器;

    4、采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合;

    5、分别采用不同的样本处理策略对多个样本集合中的每个样本集合进行样本分类处理,并计算每个处理后样本集合对应的分类损失;

    6、根据每个处理后样本集合对应的分类损失,更新第二分类器的分类权重;

    7、返回执行采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合的步骤,直至检测到对初始训练模型中第二分类器的调整达到预定次数之后,将初始训练模型作为目标域的目标训练模型。

    8、第二方面,本申请实施例提供了一种自适应模型的训练装置,包括:

    9、获取模块,用于获取目标域的初始训练模型,其中,初始训练模型是基于目标域的样本数据集对源域模型进行初始化处理得到的,初始训练模型包含分类权重不同的第一分类器和第二分类器;

    10、分类模块,用于采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合;

    11、处理模块,用于分别采用不同的样本处理策略对多个样本集合中的每个样本集合进行样本分类处理,并计算每个处理后样本集合对应的分类损失;

    12、更新模块,用于根据每个处理后样本集合对应的分类损失,更新第二分类器的分类权重;

    13、确定模块,用于返回执行采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合的步骤,直至检测到对初始训练模型中第二分类器的调整达到预定次数之后,将初始训练模型作为目标域的目标训练模型。

    14、第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面任一项的方法。

    15、第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一项的方法。

    16、第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项的方法。

    17、本申请实施例提供的一种自适应模型的训练方法、装置及终端设备,所述方法包括:获取目标域的初始训练模型,其中,初始训练模型是基于目标域的样本数据集对源域模型进行初始化处理得到的,初始训练模型包含分类权重不同的第一分类器和第二分类器;采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合;分别采用不同的样本处理策略对多个样本集合中的每个样本集合进行样本分类处理,并计算每个处理后样本集合对应的分类损失;根据每个处理后样本集合对应的分类损失,更新第二分类器的分类权重;返回执行采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合的步骤,直至检测到对初始训练模型中第二分类器的调整达到预定次数之后,将初始训练模型作为目标域的目标训练模型。利用上述技术方案,通过利用初始训练模型将样本数据集中的样本数据进行分类,得到多个样本集合,以及分别采用不同的样本处理策略对多个样本集合中的每个样本集合进行样本分类处理,并计算每个处理后样本集合对应的分类损失,能够更好地更新第二分类器的分类权重,完成初始训练模型的训练得到目标域的目标训练模型,提高目标模型的聚类能力和泛化能力。



    技术特征:

    1.一种自适应模型的训练方法,其特征在于,包括:

    2.如权利要求1所述的自适应模型的训练方法,其特征在于,所述多个样本集合包括:核心样本集合、邻居样本集合和混淆样本集合,所述第一分类器为固定权重分类器,所述第二分类器为分类权重根据训练过程中的分类损失来进行更新的目标分类器;

    3.如权利要求2所述的自适应模型的训练方法,其特征在于,所述分别采用不同的样本处理策略对所述多个样本集合中的每个样本集合进行样本分类处理,包括:

    4.如权利要求2所述的自适应模型的训练方法,其特征在于,所述分别采用不同的样本处理策略对所述多个样本集合中的每个样本集合进行样本分类处理,包括:

    5.如权利要求2所述的自适应模型的训练方法,其特征在于,所述分别采用不同的样本处理策略对所述多个样本集合中的每个样本集合进行样本分类处理,包括:

    6.如权利要求2所述的自适应模型的训练方法,其特征在于,所述针对所述样本数据集中的每个样本数据,利用所述固定权重分类器计算每个所述样本数据的核心分类参数,包括:

    7.如权利要求2所述的自适应模型的训练方法,其特征在于,所述针对所述样本数据集中的每个样本数据,利用所述目标分类器计算每个所述样本数据的混淆分类参数,包括:

    8.如权利要求1所述的自适应模型的训练方法,其特征在于,所述获取目标域的初始训练模型,包括:

    9.一种自适应模型的训练装置,其特征在于,包括:

    10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。


    技术总结
    本申请适用于跨域领域,提供一种自适应模型的训练方法、装置及终端设备,该方法包括:获取目标域的初始训练模型;采用初始训练模型中的第一分类器和第二分类器将样本数据集中的样本数据进行分类,得到多个样本集合;分别采用不同的样本处理策略对多个样本集合中的每个样本集合进行样本分类处理,并计算每个处理后样本集合对应的分类损失;根据每个处理后样本集合对应的分类损失,更新第二分类器的分类权重;返回执行分类的步骤,直至检测到对初始训练模型中第二分类器的调整达到预定次数之后,将初始训练模型作为目标域的目标训练模型。该方法能够完成初始训练模型的训练得到目标域的目标训练模型,提高目标模型的聚类能力和泛化能力。

    技术研发人员:陆玉武,刘纯志
    受保护的技术使用者:华南师范大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-27648.html

    最新回复(0)