优化大语言模型的提示词的方法及装置与流程

    专利查询2026-01-21  6


    本公开涉及机器学习,尤其涉及一种优化大语言模型的提示词的方法及装置。


    背景技术:

    1、大语言模型能够根据给定的提示生成高质量的文本,具备强大的自然语言处理能力,然而,生成结果的质量在很大程度上取决于提示词的质量。设计有效的提示词需要深厚的专业知识和丰富的实践经验,即使是经验丰富的用户优化提示词也需要大量的迭代和试验,费时费力,效率低下。在实际应用中,如何有效地优化提示词以驱动模型输出高质量的文本,仍然是一个具有挑战性的问题。


    技术实现思路

    1、有鉴于此,本公开实施例提供了一种优化大语言模型的提示词的方法、装置、电子设备及计算机可读存储介质,以解决现有技术中优化大语言模型提示词效率低的问题。

    2、本公开实施例第一方面,提供了一种优化大语言模型的提示词的方法,包括:获取训练数据,其中,训练数据包含原始文本、基础提示词和目标文本;基于原始文本和目标文本,利用大语言模型生成初始提示词;根据基础提示词对初始提示词进行词插入操作,得到多条候选提示词;基于各条候选提示词和原始文本,利用大语言模型生成各条候选提示词对应的重写文本;计算目标文本和各条候选提示词对应的重写文本之间的相似度;为对应相似度最高的候选提示词进行词修剪操作,得到多条目标提示词;基于各条目标提示词和原始文本,利用大语言模型生成各条目标提示词对应的重写文本;计算目标文本和各条目标提示词对应的重写文本之间的相似度;将对应相似度最高的目标提示词作为针对大语言模型优化后的提示词。

    3、本公开实施例第二方面,提供了一种优化大语言模型的提示词的装置,包括:获取模块,被配置为获取训练数据,其中,训练数据包含原始文本、基础提示词和目标文本;第一生成模块,被配置为基于原始文本和目标文本,利用大语言模型生成初始提示词;词插入模块,被配置为根据基础提示词对初始提示词进行词插入操作,得到多条候选提示词;第二生成模块,被配置为基于各条候选提示词和原始文本,利用大语言模型生成各条候选提示词对应的重写文本;第一计算模块,被配置为计算目标文本和各条候选提示词对应的重写文本之间的相似度;词修剪模块,被配置为为对应相似度最高的候选提示词进行词修剪操作,得到多条目标提示词;第三生成模块,被配置为基于各条目标提示词和原始文本,利用大语言模型生成各条目标提示词对应的重写文本;第二计算模块,被配置为计算目标文本和各条目标提示词对应的重写文本之间的相似度;确定模块,被配置为将对应相似度最高的目标提示词作为针对大语言模型优化后的提示词。

    4、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。

    5、本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。

    6、本公开实施例与现有技术相比存在有益效果是:获取训练数据,其中,训练数据包含原始文本、基础提示词和目标文本;基于原始文本和目标文本,利用大语言模型生成初始提示词;根据基础提示词对初始提示词进行词插入操作,得到多条候选提示词;基于各条候选提示词和原始文本,利用大语言模型生成各条候选提示词对应的重写文本;计算目标文本和各条候选提示词对应的重写文本之间的相似度;为对应相似度最高的候选提示词进行词修剪操作,得到多条目标提示词;基于各条目标提示词和原始文本,利用大语言模型生成各条目标提示词对应的重写文本;计算目标文本和各条目标提示词对应的重写文本之间的相似度;将对应相似度最高的目标提示词作为针对大语言模型优化后的提示词。采用上述技术手段,可以解决现有技术中优化大语言模型提示词效率低的问题,进而提高优化大语言模型提示词的效率。



    技术特征:

    1.一种优化大语言模型的提示词的方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,基于所述原始文本和所述目标文本,利用大语言模型生成初始提示词之后,所述方法还包括:

    3.根据权利要求2所述的方法,其特征在于,计算所述目标文本和各条目标提示词对应的重写文本之间的相似度之后,所述方法还包括:

    4.根据权利要求1所述的方法,其特征在于,基于所述原始文本和所述目标文本,利用大语言模型生成初始提示词之后,所述方法还包括:

    5.根据权利要求4所述的方法,其特征在于,通过执行词插入循环处理所述初始提示词,得到对应相似度最高的候选提示词,包括:

    6.根据权利要求4所述的方法,其特征在于,通过执行词修剪循环处理对应相似度最高的候选提示词,得到对应相似度最高的目标提示词,包括:

    7.根据权利要求1所述的方法,其特征在于,基于所述原始文本和所述目标文本,利用大语言模型生成初始提示词之后,所述方法还包括:

    8.一种优化大语言模型的提示词的装置,其特征在于,包括:

    9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法的步骤。

    10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。


    技术总结
    本公开提供了一种优化大语言模型的提示词的方法及装置。该方法包括:基于原始文本和目标文本,利用大语言模型生成初始提示词;根据基础提示词对初始提示词进行词插入操作,得到多条候选提示词;基于各条候选提示词和原始文本,利用大语言模型生成各条候选提示词对应的重写文本;计算目标文本和各条候选提示词对应的重写文本之间的相似度;为对应相似度最高的候选提示词进行词修剪操作,得到多条目标提示词;基于各条目标提示词和原始文本,利用大语言模型生成各条目标提示词对应的重写文本;计算目标文本和各条目标提示词对应的重写文本之间的相似度;将对应相似度最高的目标提示词作为针对大语言模型优化后的提示词。

    技术研发人员:蒋佩钊
    受保护的技术使用者:北京龙智数科科技服务有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-33506.html

    最新回复(0)