基于记忆循环网络增强的大语言模型人机交互方法及系统与流程

    专利查询2026-01-20  4


    本发明涉及计算机人工智能领域及操作系统系统领域,具体涉及一种基于记忆循环网络增强的大语言模型人机交互方法及系统。


    背景技术:

    1、让机器在同用户(或用户应用程序)交流的同时能够学习到用户的习惯、要求、操作方式或者对某项工作的综合解决能力,从而实现人机优势互补、信息交互的群体智能系统是人工智能不懈追求的重要目标,能够极大改善用户对机器的操作感受、提高计算机或者智能系统的工作和服务效率,并能将智能服务应用到更为丰富的场景和领域。

    2、通过扩大预训练语言模型的参数量和数据量,大语言模型(large languagemodel)能够在效果显著提升的同时,展示出泛化和推理能力等方面的特殊能力,如上下文学习能力、逐步推理能力等、人机对话能力和任务求解能力等。在此基础上,多模态大模型(mllm)进一步引入了多模态信息处理,能够接收多模态信息并对其进行推理,使人工智能更符合人类感知世界的方式,提供了更为用户友好的界面,并成为更全面的任务解决者。

    3、然而,现有ai技术包括(mllm)在面向用户进行学习和实现智能化操作方面仍存在欠缺,主要问题包括:(1)处理长上下文的能力有限,因为大模型通常有上下文规模限制,导致智能系统会在对输入的多重资料或信息的理解能力上受限,如果是分时间分阶段输送给大模型的图文等信息,难以被综合理解和应用推理。(2)服从复杂指令的能力不足,用户的指令通常也带有一定的语境,包含了情绪、指代等偶然性的信息,并且通常难以被完整性的输入给大模型,使大模型难以准确的理解复杂指令并按指令的真正含义给出解决方案。(3)对上下文修正和思维链完善学习的能力不足,用户的指令或者往往带有部分随意性和不完整性,通常要实现一个用户满意的推理或生成操作需要用户反复的尝试修正或多轮完善指令。在经历了较长时间间隔后,用户想复现或者改进一个实施过的推理也较为困难,增加了用户复杂度,造成体验差、效率低下。

    4、从本质上说,大模型(大语言模型)是经预先训练得到的各种知识,在对用户服务的过程中一般只提供推理,而无法对用户的习惯、行为和操作特征进行再学习和记忆,因此会造成其直接服务用户的各种能力限制。虽然chatgpt等大模型从用户界面来看有对话记忆功能,可以做到聊天记忆。但其所谓的记忆功能只是开发者将对话记录存储在缓存中,当发送消息给大模型时,程序会自动将最近的几次对话记录,即上下文(context),和提示词(prompt)组合成最终的提交请求(tokens),并发送给chatgpt进行推理生成。如果上下文和提示词的请求组合超过了tokens限制,那么它就会忘记之前的对话而只保留符合限制的上下文数目,这就是目前大模型在需求比较复杂的任务中无法克服的缺陷。此外,大模型的对话也很难对用户的情绪、对话方式进行区分和识别,由于用户带有较大主观性,其需要执行的服务或操作无需受到类型、方式等限制,有可能带有想象力,也有可能受到情绪或已执行的操作的影响,还有可能会因想起一个非常早期的操作而需要重演或者在其基础上进行修正改进。因此,大模型本质上的缺陷难以由其自身的技术发展进行弥补,必须要通过和用户的不断沟通、协同和融合才能吸收人工智能与人类智能各自的优点,在复杂应用中实现更为出色的能力。

    5、目前,诸如大语言模型等人工职能技术仍然无法完全脱离人类智能来获取非常好的任务自动执行效果,因此,智能系统的设计关键在于能够对人的个体习惯、记忆、甚至情绪等,以及所处环境因素进行整合计算,这里比较关键的是计算和记忆的融合,也就是说将人的各种主观因素和环境的客观因素融入推理之中。这些都可以围绕记忆系统进行实施,例如将人的历史行为、习惯、以及环境属性都存入一种记忆库中,智能模型在推理时能够从记忆库中获取到相应的信息。目前的智能记忆方式主要有两种技术,一种是有精确记忆能力,以记忆网络为代表的外部记忆槽方式,另一种是将记忆和神经网络相结合实现概率记忆的记忆神经网络方式。但这两种技术方式都没有提供一个能够智能选取记忆并组合高适配性的上下文的方案。因此,围绕人机融合智能问题,如何基于大语言模型技术实现了一种新型的记忆网络循环系统,使智能系统的输入端、处理阶段和输出段都能智能化地选取对推理有帮助的记忆,并跟人类智能协同进行有效的认知信息整合,从而提升对复杂问题处理解决的效率,已成为一项亟待解决的关键技术问题。


    技术实现思路

    1、本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于记忆循环网络增强的大语言模型人机交互方法及系统,本发明旨在使大语言模型的输入端、处理阶段和输出段都能智能化地选取对推理有帮助的记忆,并跟人类智能协同进行有效的认知信息整合,从而提升对复杂问题处理解决的效率。

    2、为了解决上述技术问题,本发明采用的技术方案为:

    3、一种基于记忆循环网络增强的大语言模型人机交互方法,包括下述步骤:

    4、s1,将用户或者用户程序发起的任务请求编码转换为可供记忆仓库查询记忆项的单维或多维对象,所述单维或多维对象中每一维度包含一组关键信息,所述关键信息为文本、声音、图像中部分或者全部模态的信息,所述多维对象为所有维度中的部分或全部,所有维度包括标准记忆和其他维度,所述其他维度包括知识、函数、动作、提醒和对一次计算机任务过程有刻画作用的记录中的部分或全部;

    5、s2,将单维或多维对象从记忆仓库查询记忆项,将查询得到的记忆项筛选后生成上下文,将上下文和预设的提示词组合后输入大语言模型;

    6、s3,获取大语言模型执行得到的输出结果;分析提取输出结果中的动作或者函数调用接口及其参数,结合参数执行动作或者调用函数调用接口,获取执行动作或者调用函数调用接口的评估结果,生成包含评估报告的任务结果;

    7、s4,判断任务请求是否完成,若已经完成,则将本次任务请求执行过程中的信息生成记忆项并添加至记忆仓库中。

    8、可选地,步骤s1包括:

    9、s1.1,获取用户或者用户程序发起的任务请求内容,所述任务请求内容包括执行任务所需的描述、要求、目的、资源中的一种或多种;

    10、s1.2,将任务请求内容按照指定的格式进行标准化转换;

    11、s1.3,将标准化转换后的任务请求内容结合包含所有维度信息的提示词并输入给大语言模型,从而得到可供记忆仓库查询记忆项的单维或多维对象。

    12、可选地,步骤s2包括:

    13、s2.1,将单维或多维对象中关键信息的嵌入式向量值;

    14、s2.2,将各个关键信息的嵌入式向量值查询记忆仓库中对应维度的记忆项,分别获得与该关键信息的向量距离最近的前n个记忆项的id以及向量距离;

    15、s2.3,针对所有关键信息的前n个记忆项,以和关键信息的向量距离的绝对值按照大小划分为m个距离区间,m个距离区间对应m种精度级别中的一种精度级别,从而将记忆项映射为m种精度级别中的一种;

    16、s2.4,根据记忆项的id及其精度级别从记忆仓库提取记忆项的内容,如果记忆项的属性字段为其他维度,则直接提取记忆项的内容;如果记忆项的属性字段为标准记忆,则从该记忆项的多种精度级别的内容中选择其精度级别对应的内容,从而生成单维或多维对象的各项记忆项的内容构成的上下文;

    17、s2.5,将上下文和预设的提示词组合,若组合后的内容超过大语言模型输入字符长度限制,则降低部分或全部记忆项的精度级别,跳转步骤s2.4;否则将组合后的内容输入大语言模型。

    18、可选地,步骤s3包括:

    19、s3.1,获取大语言模型执行得到的输出结果;

    20、s3.2,分析提取输出结果中的动作或者函数调用接口及其参数,结合参数执行动作或者调用函数调用接口;

    21、s3.3,获取执行动作或者调用函数调用接口的评估结果,所述评估结果为执行动作或者调用函数调用接口直接返回是否通过的评估结果,或者人工基于执行动作或者调用函数调用接口直接返回信息获得的是否通过的评估结果,或者数值模型或者大语言模型基于执行动作或者调用函数调用接口直接返回信息获得的是否通过的评估结果;

    22、s3.4,判断评估结果是否通过,若评估结果通过则跳转步骤s3.5;否则执行改进上下文:根据大语言模型执行得到的输出结果和执行动作或者调用函数调用接口的评估结果利用大语言模型生成新的上下文,将新的上下文加入步骤s2.4中得到的上下文中,跳转步骤s2.5;

    23、s3.5,生成包含评估报告的任务结果。

    24、可选地,步骤s3.4中执行改进上下文时还包括判断执行改进上下文的次数是否超过预设阈值,若尚未超过预设阈值,则根据大语言模型执行得到的输出结果和执行动作或者调用函数调用接口的评估结果利用大语言模型生成新的上下文,将新的上下文加入步骤s2.4中得到的上下文中,跳转步骤s2.5;否则执行下述方式中的一种:

    25、方式1:通过询问用户获取新的任务请求并跳转步骤s1;

    26、方式2:跳转步骤s2重新执行查询记忆项;

    27、方式3:调用在线搜索执行动作或者调用函数调用接口的关联问题,将关联问题的执行结果利用大语言模型生成的多维关键信息增加到任务请求的单维或多维对象中,跳转步骤s2重新执行查询记忆项。

    28、可选地,步骤s3.1中取大语言模型执行得到的输出结果还包括各个记忆项的记忆贡献度,根据记忆贡献度的大小将记忆贡献度映射为多种精度级别中的一种;如果某一记忆项的记忆贡献度大于预设阈值、且该记忆项的精度级不是多种精度级别中的最高精度级,则将该记忆项的精度级别上调一个精度级别;如果某一记忆项的记忆贡献度小于预设阈值、且该记忆项的精度级不是多种精度级别中的最低精度级,则将该记忆项的精度级别下调一个精度级别;如有上调或者下调精度级别的记忆项,则跳转步骤s2.4;否则跳转步骤s3.2。

    29、可选地,步骤s4中将本次任务请求执行过程中的信息生成记忆项并添加至记忆仓库中包括:

    30、s4.1,将任务请求的任务请求内容、单维或多维对象、上下文、大语言模型执行得到的输出结果、评估结果组合后利用大语言模型进行记忆总结生成记忆总结,所述记忆总结包括标准记忆、知识、函数、动作和提醒中的部分或者属性类型的记忆项的内容;

    31、s4.2,如果记忆总结包含标准记忆的记忆项的内容,则将该记忆项的内容利用大语言模型进行精度转换,生成多种精度级别的记忆项的内容;

    32、s4.3,将记忆总结中的各个记忆项的内容根据其属性类型,以及属性类型为标准记忆的记忆项的精度级别存储到记忆仓库中。

    33、此外,本发明还提供一种基于记忆循环网络增强的大语言模型人机交互系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行所述基于记忆循环网络增强的大语言模型人机交互方法。

    34、此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序或指令,该计算机程序或指令被编程或配置以通过处理器执行所述基于记忆循环网络增强的大语言模型人机交互方法。

    35、此外,本发明还提供一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被编程或配置以通过处理器执行所述基于记忆循环网络增强的大语言模型人机交互方法。

    36、和现有技术相比,本发明主要具有下述优点:

    37、1、本发明能够实现系统通过使用者的输入请求或者提示对知识、习惯、操作、编程能力等进行持续性学习,让系统能够灵活掌握复杂知识和操作,能够克服单纯的大语言模型或其它预训练模型系统只能记忆通过训练获得的知识,无法记忆或长期记忆同用户相关的个性化信息知识。

    38、2、本发明能够实现对各类输入信息的长期学习,并且能利用或分辨这些信息的相关性,并在利用它们时合理取舍。

    39、3、本发明能够根据用户的简单输入自动生成可用度较高的上下文,使大模型的输出更为符合要求。

    40、4、本发明能够方便地将一个用户或系统所生成的记忆复制给其他用户或系统,使用户或系统之间实现经验共享。


    技术特征:

    1.一种基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,包括下述步骤:

    2.根据权利要求1所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s1包括:

    3.根据权利要求1所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s2包括:

    4.根据权利要求3所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s3包括:

    5.根据权利要求4所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s3.4中执行改进上下文时还包括判断执行改进上下文的次数是否超过预设阈值,若尚未超过预设阈值,则根据大语言模型执行得到的输出结果和执行动作或者调用函数调用接口的评估结果利用大语言模型生成新的上下文,将新的上下文加入步骤s2.4中得到的上下文中,跳转步骤s2.5;否则执行下述方式中的一种:

    6.根据权利要求4所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s3.1中取大语言模型执行得到的输出结果还包括各个记忆项的记忆贡献度,根据记忆贡献度的大小将记忆贡献度映射为多种精度级别中的一种;如果某一记忆项的记忆贡献度大于预设阈值、且该记忆项的精度级不是多种精度级别中的最高精度级,则将该记忆项的精度级别上调一个精度级别;如果某一记忆项的记忆贡献度小于预设阈值、且该记忆项的精度级不是多种精度级别中的最低精度级,则将该记忆项的精度级别下调一个精度级别;如有上调或者下调精度级别的记忆项,则跳转步骤s2.4;否则跳转步骤s3.2。

    7.根据权利要求4所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s4中将本次任务请求执行过程中的信息生成记忆项并添加至记忆仓库中包括:

    8.一种基于记忆循环网络增强的大语言模型人机交互系统,包括相互连接的微处理器和存储器,其特征在于,所述微处理器被编程或配置以执行权利要求1~7中任意一项所述基于记忆循环网络增强的大语言模型人机交互方法。

    9.一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序或指令,其特征在于,该计算机程序或指令被编程或配置以通过处理器执行权利要求1~7中任意一项所述基于记忆循环网络增强的大语言模型人机交互方法。

    10.一种计算机程序产品,包括计算机程序或指令,其特征在于,该计算机程序或指令被编程或配置以通过处理器执行权利要求1~7中任意一项所述基于记忆循环网络增强的大语言模型人机交互方法。


    技术总结
    本发明公开了一种基于记忆循环网络增强的大语言模型人机交互方法及系统,本发明方法包括将用户或者用户程序发起的任务请求编码转换为可供记忆仓库查询记忆项的单维或多维对象,从记忆仓库查询记忆项,将查询得到的记忆项筛选后生成上下文,将上下文和预设的提示词组合后输入大语言模型;获取大语言模型执行得到的输出结果,执行输出结果并获取估结果,生成包含评估报告的任务结果;若任务请求是已经完成,则将本次任务请求执行过程中的信息生成记忆项并添加至记忆仓库中。本发明旨在使大语言模型的输入端、处理阶段和输出段都能智能化地选取对推理有帮助的记忆,并跟人类智能协同进行有效的认知信息整合,从而提升对复杂问题处理解决的效率。

    技术研发人员:董宇宸
    受保护的技术使用者:董宇宸
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-33494.html

    最新回复(0)