一种AI大模型的优化方法、系统、终端设备及存储介质与流程

    专利查询2025-07-16  13


    本发明涉及ai大模型的优化领域,尤其涉及一种ai大模型的优化方法、系统、终端设备及存储介质。


    背景技术:

    1、在当前的ai技术生态中,大模型集成多种子模型以提供综合性服务已成为一种趋势。集成多种子模型ai大模型可以广泛应用于多个不同领域,提高人们的工作效率和生活质量。不同的子模型可以提供不同的功能,例如问答子模型可以提供问答功能,绘画子模型可以提供绘画功能。但目前很多子模型存在响应速度慢和吞吐率低,导致用户的使用体验较差。


    技术实现思路

    1、本发明提供了一种ai大模型的优化方法及系统,解决了目前很多子模型因响应速度慢和吞吐率低导致用户的使用体验较差的问题。

    2、为了解决上述技术问题,本发明一实施例提供了一种ai大模型的优化方法,包括:

    3、获取实时用户行为数据和ai大模型的各子模型实时负载数据;

    4、将所述ai大模型的各子模型实时负载数据输入到训练好的资源预测模型,以使训练好的资源预测模型根据各子模型的实时负载数据进行预测,得到未来一段时间内各子模型的资源需求;

    5、根据所述未来一段时间内各子模型的资源需求确定资源分配策略;

    6、将实时用户行为数据输入到训练好的行为预测模型,以使训练好的行为预测模型根据时用户行为数据进行预测,得到子模型请求预测结果;

    7、根据子模型请求预测结果,通过缓存一致性协议和缓存策略确定预加载策略;

    8、根据资源分配策略和预加载策略,对ai大模型进行优化。

    9、进一步的,所述资源预测模型的模型训练,包括:

    10、获取ai大模型的各子模型历史负载数据;

    11、对所述ai大模型的各子模型历史负载数据进行数据预处理,得到处理后的各子模型历史负载数据,并将处理后的各子模型历史负载数据划分第一训练集和第一验证集;

    12、通过待训练的资源预测模型的lstm层,对所述第一训练集进行时间序列特征提取,生成时间序列负载特征数据;

    13、通过待训练的资源预测模型的自注意力层,对时间序列负载特征数据进行特征增强,得到增强后的时间序列负载特征数据;

    14、通过待训练的资源预测模型的第一全连接层对增强后的时间序列负载特征数据进行数据整合和非线性变换,生成未来一段时间内各子模型的资源需求;

    15、根据未来一段时间内各子模型的资源需求和实际一段时间内各子模型的资源需求进行比较计算损失值,根据损失值对待训练的资源预测模型的参数进行优化,直至损失值收敛,得到初步训练的资源预测模型;

    16、通过第一验证集对初步训练的资源预测模型进行性能评估,根据性能评估结果调整模型超参数,得到训练好的资源预测模型。

    17、进一步的,所述根据所述未来一段时间内各子模型的资源需求确定资源分配策略,包括:

    18、根据所述未来一段时间内各子模型的资源需求,确定各子模型资源需求的优先级;

    19、根据资源的总运行时间和故障时间,结合可用性百分比评估指标计算公式,计算得到可用性百分比评估指标数值,根据可用性百分比评估指标数值判断资源可用性,确定可用的资源;

    20、根据各子模型资源需求的优先级和可用的资源,对各子模型进行动态调整资源分配。

    21、进一步的,所述行为预测模型的模型训练,包括:

    22、获取历史用户行为数据;

    23、对所述历史用户行为数据进行数据预处理,得到处理后的历史用户行为数据,并将处理后的历史用户行为数据划分为第二训练集和第二验证集;

    24、通过待训练的行为预测模型中tcn层对所述第二训练集进行特征提取,得到第一时间序列行为特征数据;

    25、通过待训练的行为预测模型中gru层对所述第一时间序列行为特征数据进行特征提取,得到第二时间序列行为特征数据;

    26、通过待训练的行为预测模型中自注意力层对第二时间序列行为特征数据进行特征增强,得到第三时间序列行为特征数据;

    27、通过待训练的行为预测模型中第二全连接层对第三时间序列行为特征数据进行数据整合和非线性变换,生成子模型请求预测结果;

    28、根据子模型请求预测结果与实际子模型请求结果进行比较计算损失值,根据损失值对待训练的行为预测模型的参数进行优化,直至损失值收敛,得到初步训练的行为预测模型;

    29、通过第二验证集对初步训练的行为预测模型进行性能评估,根据性能评估结果调整模型超参数,得到训练好的行为预测模型。

    30、进一步的,所述根据子模型请求预测结果,通过缓存一致性协议和缓存策略确定预加载策略,包括:

    31、根据子模型请求预测结果,确定各子模型请求的频率,并根据各子模型请求的频率确定各子模型请求的优先级;

    32、根据各子模型请求的优先级和预设缓存容量,采用主动缓存加载策略将对请求优先级高的子模型数据加载到缓存中;

    33、当请求优先级高的子模型数据完成加载到缓存时,根据剩余的缓存容量,按照优先级顺序处理中、低优先级的请求,并加载相应的子模型数据到缓存中;

    34、当缓存中存储的子模型数据完成应用时,通过缓存淘汰策略对完成应用的子模型数据进行淘汰替换;

    35、在将子模型数据加载或淘汰替换过程中,通过缓存一致性协议管理缓存中子模型数据的状态。

    36、进一步的,所述待训练的行为预测模型中gru层包括更新门、重置门和隐藏状态更新;其中,所述隐藏状态更新包括候选隐藏状态更新和当前隐藏状态更新;

    37、所述更新门的计算公式如下:;其中,是更新门的权重矩阵;是更新门的偏置向量;是前一个时间步的隐藏状态;是当前时间步的输入特征向量;是sigmoid激活函数;表示更新门的值;

    38、所述重置门的计算公式如下:;其中,是重置门的权重矩阵;是重置门的偏置向量;是当前时间步的输入特征向量;表示重置门的值;

    39、所述候选隐藏状态更新的计算公式如下:;其中,是候选隐藏状态的权重矩阵;是候选隐藏状态的偏置向量;表示逐元素乘法;表示双曲正切激活函数;表示候选隐藏状态的值;

    40、所述当前隐藏状态更新的计算公式如下:;其中,表示更新门的值;表示重置门的值;表示候选隐藏状态;表示逐元素乘法;表示当前隐藏状态的值。

    41、在上述方法项实施例的基础上,本发明对应提供了系统项实施例;

    42、本发明一实施例提供了一种ai大模型的优化系统,包括数据采集模块、资源需求预测模块、资源分配策略确定模块、子模型请求预测模块、预加载策略确定模块和ai大模型优化模块;

    43、所述数据采集模块用于获取实时用户行为数据和ai大模型的各子模型实时负载数据;

    44、所述资源需求预测模块用于将所述ai大模型的各子模型实时负载数据输入到训练好的资源预测模型,以使训练好的资源预测模型根据各子模型的实时负载数据进行预测,得到未来一段时间内各子模型的资源需求;

    45、所述资源分配策略确定模块用于根据所述未来一段时间内各子模型的资源需求确定资源分配策略;

    46、所述子模型请求预测模块用于将实时用户行为数据输入到训练好的行为预测模型,以使训练好的行为预测模型根据时用户行为数据进行预测,得到子模型请求预测结果;

    47、所述预加载策略确定模块用于根据子模型请求预测结果,通过缓存一致性协议和缓存策略确定预加载策略;

    48、所述ai大模型优化模块用于根据资源分配策略和预加载策略,对ai大模型进行优化。

    49、进一步的,所述一种ai大模型的优化系统,还包括:模型训练模块;其中,所述模型训练模块包括资源预测模型训练单元和行为预测模型训练单元;

    50、所述资源预测模型训练单元用于资源预测模型的模型训练;

    51、所述行为预测模型训练单元用于行为预测模型的模型训练。

    52、在上述方法项实施例的基础上,本发明对应提供了终端设备项实施例,包括:处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,处理器执行所述计算机程序时,实现如本发明所述的一种ai大模型的优化方法。

    53、在上述方法项实施例的基础上,本发明对应提供了计算机可读存储介质项实施例,包括:存储的计算机程序,在计算机程序运行时,控制计算机可读存储介质所在的设备执行如本发明所述的一种ai大模型的优化方法。

    54、相比于现有技术,本发明实施例具有如下有益效果:

    55、本发明通过资源预测模型对各子模型实时负载数据进行预测,生成未来一段时间内各子模型的资源需求,进而确定资源分配策略,并通过行为预测模型对实时用户行为数据进行预测,生成子模型请求预测结果,通过缓存一致性协议和缓存策略对子模型请求预测结果确定预加载策略,最后根据资源分配策略和预加载策略对ai大模型进行优化,即利用资源分配策略动态且合理地调整ai大模型的资源分配,减少计算资源的损耗,并利用预加载策略将ai大模型的各子模型进行预加载,减少模型加载时间,提高ai大模型中各子模型的响应速度和吞吐量,解决了目前很多子模型因响应速度慢和吞吐率低导致用户的使用体验较差的问题。


    技术特征:

    1.一种ai大模型的优化方法,其特征在于,包括:

    2.根据权利要求1所述的一种ai大模型的优化方法,其特征在于,所述资源预测模型的模型训练,包括:

    3.根据权利要求1所述的一种ai大模型的优化方法,其特征在于,所述根据所述未来一段时间内各子模型的资源需求确定资源分配策略,包括:

    4.根据权利要求1所述的一种ai大模型的优化方法,其特征在于,所述行为预测模型的模型训练,包括:

    5.根据权利要求1所述的一种ai大模型的优化方法,其特征在于,所述根据子模型请求预测结果,通过缓存一致性协议和缓存策略确定预加载策略,包括:

    6.根据权利要求4所述的一种ai大模型的优化方法,其特征在于,所述待训练的行为预测模型中gru层包括更新门、重置门和隐藏状态更新;其中,所述隐藏状态更新包括候选隐藏状态更新和当前隐藏状态更新;

    7.一种ai大模型的优化系统,其特征在于,包括:数据采集模块、资源需求预测模块、资源分配策略确定模块、子模型请求预测模块、预加载策略确定模块和ai大模型优化模块;

    8.根据权利要求7所述的一种ai大模型的优化系统,其特征在于,还包括:模型训练模块;其中,所述模型训练模块包括资源预测模型训练单元和行为预测模型训练单元;

    9.一种ai大模型的优化终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的一种ai大模型的优化方法。

    10.一种存储介质,其特征在于,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行如权利要求1至6中任意一项所述的一种ai大模型的优化方法。


    技术总结
    本发明公开了一种AI大模型的优化方法、系统、终端设备及存储介质,所述方法通过资源预测模型对各子模型实时负载数据进行预测,预测未来一段时间内各子模型的资源需求,进而确定资源分配策略,并通过行为预测模型对实时用户行为数据进行预测,生成子模型请求预测结果,通过缓存一致性协议和缓存策略对子模型请求预测结果确定预加载策略,最后利用资源分配策略动态且合理地调整资源分配,减少计算资源的损耗,并利用预加载策略将AI大模型的各子模型进行预加载,减少模型加载时间,实现提高AI大模型中各子模型的响应速度和吞吐量,解决了目前很多子模型因响应速度慢和吞吐率低导致用户的使用体验较差的问题。

    技术研发人员:林景,朱峻修
    受保护的技术使用者:广州兴趣岛信息科技有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-30334.html

    最新回复(0)