模型获取方法、装置、电子设备及存储介质与流程

    专利查询2025-11-04  2


    本公开涉及计算机,尤其涉及人工智能,具体涉及一种模型获取方法、装置、电子设备及存储介质。


    背景技术:

    1、随着人工智能技术的持续进步,众多云平台已经提供了人工智能模型的开发功能。然而,当前的这些云平台所提供的模型开发模式,无法为用户打造一个完整的、端到端的解决方案,因此,存在可用性较低的问题。


    技术实现思路

    1、本公开提供了一种模型获取方法、装置、电子设备及存储介质。

    2、根据本公开的第一方面,提供了一种模型获取方法,包括:

    3、从多个候选任务场景中选取目标任务场景;其中,目标任务场景对应有至少一个候选模型、且至少一个候选模型中每个候选模型用于解决目标任务场景下的特定任务;

    4、从至少一个候选模型中选取初选模型;

    5、响应于作用在训练设置界面上的模型训练指示操作,向服务器发送模型训练请求,以使服务器基于模型训练请求,对初选模型进行多轮训练,得到模型训练结果;

    6、基于模型训练结果,确定目标模型。

    7、根据本公开的第二方面,提供了一种模型获取装置,包括:

    8、任务场景选取单元,用于从多个候选任务场景中选取目标任务场景;其中,目标任务场景对应有至少一个候选模型、且至少一个候选模型中每个候选模型用于解决目标任务场景下的特定任务;

    9、模型选取单元,用于从至少一个候选模型中选取初选模型;

    10、请求发送单元,用于响应于作用在训练设置界面上的模型训练指示操作,向服务器发送模型训练请求,以使服务器基于模型训练请求,对初选模型进行多轮训练,得到模型训练结果;

    11、模型获取单元,用于基于模型训练结果,确定目标模型。

    12、根据本公开的第三方面,提供了一种电子设备,包括:

    13、至少一个处理器;

    14、与该至少一个处理器通信连接的存储器;

    15、该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。

    16、根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

    17、根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

    18、采用本公开能够提高目标模型的可用性。

    19、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



    技术特征:

    1.一种模型获取方法,包括:

    2.根据权利要求1所述的方法,其中,所述从所述至少一个候选模型中选取初选模型,包括:

    3.根据权利要求2所述的方法,其中,所述模型信息包括应用示例、模型简介和用户评价中的至少一者。

    4.根据权利要求1~3中任一所述的方法,其中,所述初选模型具有至少一个计算模块、且所述至少一个计算模块中每个计算模块对应有至少一个候选子模型;所述方法还包括:

    5.根据权利要求4所述的方法,其中,所述将所述至少一个计算模块中的每个计算模型作为待确定模块,从与所述待确定模块对应的至少一个候选子模型中选取目标子模型,以使所述初选模型具有明确的模型结构,包括:

    6.根据权利要求5所述的方法,其中,所述子模型信息包括精度、推理耗时和模型大小中的至少一者。

    7.根据权利要求1所述的方法,其中,所述响应于作用在训练设置界面上的模型训练指示操作,向服务器发送模型训练请求,以使所述服务器根据所述模型训练请求,对所述初选模型进行训练,得到模型训练结果,包括:

    8.根据权利要求1或7所述的方法,其中,所述模型训练结果包括与所述多轮训练一一对应的多个候选中间模型,以及与所述多个候选中间模型一一对应的多个模型性能表征值;所述基于所述模型训练结果,确定目标模型,包括:

    9.根据权利要求1所述的方法,还包括:

    10.根据权利要求1所述的方法,其中,所述目标模型为图像处理模型,所述方法还包括:

    11.根据权利要求1所述的方法,其中,所述目标模型为文档处理模型,所述方法还包括:

    12.一种模型获取装置,包括:

    13.根据权利要求12所述的装置,其中,所述模型选取单元用于:

    14.根据权利要求13所述的装置,其中,所述模型信息包括应用示例、模型简介和用户评价中的至少一者。

    15.根据权利要求12~14中任一所述的装置,其中,所述初选模型具有至少一个计算模块、且所述至少一个计算模块中每个计算模块对应有至少一个候选子模型;所述装置还包括模型结构确定单元,用于:

    16.根据权利要求15所述的装置,其中,所述模型结构确定单元用于:

    17.根据权利要求16所述的装置,其中,所述子模型信息包括精度、推理耗时和模型大小中的至少一者。

    18.根据权利要求12所述的装置,其中,所述请求发送单元用于:

    19.根据权利要求12或18所述的装置,其中,所述模型训练结果包括与所述多轮训练一一对应的多个候选中间模型,以及与所述多个候选中间模型一一对应的多个模型性能表征值;所述模型获取单元用于:

    20.根据权利要求12所述的装置,还包括模型部署控制单元,用于:

    21.根据权利要求12所述的装置,其中,所述目标模型为图像处理模型,所述装置还包括第一应用单元,用于:

    22.根据权利要求12所述的装置,其中,所述目标模型为文档处理模型,所述装置还包括第二应用单元,用于:

    23.一种电子设备,包括:

    24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~11中任一项所述的方法。

    25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1~11中任一项所述的方法。


    技术总结
    本公开涉及计算机技术领域,尤其涉及人工智能技术领域,具体涉及一种模型获取方法、装置、电子设备及存储介质。具体实现方案为:从多个候选任务场景中选取目标任务场景;其中,目标任务场景对应有至少一个候选模型、且至少一个候选模型中每个候选模型用于解决目标任务场景下的特定任务;从至少一个候选模型中选取初选模型;响应于作用在训练设置界面上的模型训练指示操作,向服务器发送模型训练请求,以使服务器基于模型训练请求,对初选模型进行多轮训练,得到模型训练结果;基于模型训练结果,确定目标模型。采用本公开用户能够提高目标模型的可用性。

    技术研发人员:崔程,郜廷权,殷晓婷,孙婷,杜宇宁,李梦柳,刘毅,于佃海,马艳军
    受保护的技术使用者:北京百度网讯科技有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-31635.html

    最新回复(0)