本发明涉及了一种自主代理系统,涉及自主代理、检索增强生成技术、生成式大模型领域,具体涉及一种基于检索增强生成技术与生成式大模型的自主代理系统。
背景技术:
1、近年来,随着深度学习和大模型的研究发展,大模型的生成幻觉(generationhallucination)与时效性不足等缺点日益显著。基于大型语言模型(large langragemodel,llm)的检索增强生成技术与自主代理成为热点研究方向,这些技术可以帮助大模型克服生成幻觉,获得更加具有时效性的信息,并具有更强的语言理解和生成能力,可以完成更复杂的任务。
2、自主代理(autonomous agent)指的是能够在某种程度上独立完成目标设定、决策和行动的软件系统或实体。自主代理通常能够独立地在环境中执行任务,通过代理能够与环境和其他代理进行交互,以获取信息或实现协作,并进一步进行逻辑推理,以期作出合理决策。
3、检索增强生成(retrieval-augmented generation)是指在生成任务中,通过检索外部知识源来辅助生成过程的一种方法。它结合了检索机制和生成模型的优势,可以提高生成结果的质量、多样性和覆盖率。检索增强生成在对话系统、文本摘要、机器翻译等任务中都取得了显著的效果提升。检索增强技术的主要挑战包括如何构建有效的检索索引,以及如何设计模型与检索机制的交互方式。
4、生成式大语言模型(generative large language model)是通过大规模文本数据训练得到的一类自然语言处理模型。这类模型通常基于transformer架构和自注意力机制,通过无监督或弱监督学习从海量文本中学习文本表征;大模型的参数量巨大,一般在60亿参数量以上。大模型可以生成连贯且语法正确的文本,被广泛应用于聊天机器人、文本摘要、机器翻译、文本生成等任务。虽然大模型在语言理解和文本生成方面大幅刷新了记录,但它们普遍存在生成幻觉、安全隐私、时效不足等问题。
技术实现思路
1、为了解决背景技术中存在的问题,本发明所提供一种基于检索增强生成技术与生成式大模型的自主代理系统。方法可以提升大模型在特定业务场景下文本生成的时效性和准确性、克服其生成幻觉问题,通过搭建业务知识库,基于rag技术,构建自主代理agent,辅助监督模型生成,更好地完成了大模型在垂直业务领域的适应化改造,为相关的大模型应用方案提供了重要的创新思路、技术突破和应用价值。
2、本发明采用的技术方案是:
3、一、一种基于检索增强生成技术与生成式大模型的自主代理系统,包括:
4、知识库模块,用于将收集的特定业务领域的数据集进行转化分隔后输入至知识库进行存储。
5、记忆模块,用于存储多轮对话中用户输入的提问query和对话内容以及通过检索增强生成rag检索后从记忆模块自身和知识库模块的知识库中召回的关联知识。
6、计划模块,用于根据从记忆模块中获得用户输入的提问query和对话内容以及关联知识制定一个闭环的可执行的计划清单。
7、执行模块,用于根据从计划模块中获得的计划清单进行执行后获得计划执行结果,从而通过反思的形式判断计划执行结果是否符合预期从而获得反思结果,将计划执行结果和反思结果存储至记忆模块中;将符合预期的计划执行结果的计划清单直接输出进行执行,将不符合预期的计划执行结果推送至计划模块中进行再计划直至符合预期。
8、所述的特定业务领域的数据集包括特定业务领域的长文本、表格和数据库等;将数据集统一转化为文本格式,然后按照分隔符分块并生成分块的摘要信息,将各个摘要及其分块文本共同建立知识库。以{摘要:分块文本}的索引形式建立知识库数据内容。特定业务领域如金融、工业制造、医疗等领域。
9、所述的记忆模块包括长期记忆子模块和短期记忆子模块,长期记忆子模块用于存储通过检索增强生成rag检索后从记忆模块自身和知识库模块的知识库中召回的关联知识,短期记忆子模块用于存储多轮对话中用户输入的提问query和对话内容以及执行模块的反思结果。两个子模块可以缓解agent在多轮对话过程中token长度超过大模型最大长度的限制问题。
10、所述的计划模块通过其中的提示词prompt根据多轮对话中用户输入的提问query和对话内容识别出用户的提问意图,即获得用户的请求内容,并将用户的请求内容和从记忆模块中获得的关联知识进行结合,最终制定获得一个闭环的可执行的计划清单;用户的请求内容被存储至记忆模块的短期记忆子模块中,关联知识被存储至记忆模块的长期记忆子模块中。计划模块是整个自主代理系统的核心模块,通常包括意图识别、检索增强、反思、再计划等功能。
11、所述的执行模块由大模型和工具函数组成,执行模块根据计划模块反馈的计划清单从而调用大模型获得计划执行文本,调用工具函数获得计划执行结果,将计划执行结果添加至执行模块中的提示词prompt中并进而反馈至计划模块中。大模型如glm、llama等,工具函数如搜索、python代码执行、画图等。
12、二、一种自主代理系统的处理方法,包括:
13、步骤1:基于具体应用场景,采集特定业务领域的数据集,并通过数据转化、分块、摘要生成和索引等方式,建立特定业务领域的行业知识库,便于后续rag检索,进而存储至知识库模块中。
14、步骤2:记忆模块中的长期记忆子模块存储通过检索增强生成rag检索后从记忆模块自身和知识库模块的知识库中召回的关联知识,短期记忆子模块存储多轮对话中用户输入的提问query和对话内容。
15、步骤3:计划模块通过其中的提示词prompt根据多轮对话中用户输入的提问query和对话内容识别出用户的请求内容,并将用户的请求内容和从记忆模块中获得的关联知识进行结合,对用户的请求内容进行信息增强,最终制定获得一个闭环的可执行的计划清单;用户的请求内容被存储至记忆模块的短期记忆子模块中,关联知识被存储至记忆模块的长期记忆子模块中。
16、步骤4:执行模块接受计划清单中的具体计划,按具体计划步骤执行计划清单,调用大模型获得计划执行文本,调用工具函数获得计划执行结果,将计划执行结果添加至执行模块中的提示词prompt中并进而反馈至计划模块中。
17、步骤5:计划模块接受执行模块的计划执行结果,通过反思的形式判断计划执行结果是否符合预期从而获得反思结果,将符合预期的计划执行结果的计划清单直接输出进行执行,将不符合预期的计划执行结果推送至计划模块中进行再计划直至符合预期;并将计划执行结果和反思结果存储至记忆模块中;反思结果即计划执行结果是否符合预期的判断结果。
18、步骤6:循环执行步骤4与步骤6,直到返回最终结果。
19、本发明的有益效果是:
20、1、缓解大模型生成幻觉:生成式大模型存在生成幻觉的问题,本发明通过引入外部知识检索可以从大规模知识库中检索到相关的事实、片段或文本,引入到生成过程中。这可以弥补生成模型知识匮乏的问题,生成更准确和丰富的内容。
21、2、提高生成内容时效性:大模型由于预训练阶段使用的语料库存在时效性滞后的问题,本发明通过检索增强生成技术,从实时更新的知识库中检索关联知识,从而弥补了大模型时效性不足的问题。
22、3、提高生成关联性:交互性代理能够与环境和工具进行交互,获取信息或实现协作。这增强了代理的灵活性和有效性。通过反思和再计划,可以有效提高计划执行的准确度,通过rag检索到的相关片段包含更广泛的语言模式,可以提高模型结果的关联性。
23、4、提高生成速度:由于知识库中保存的信息是通过召回的方式产生的,并不借助大模型额外生成,因此通过检索增强技术可以有效提升加速模型的生成过程。相比纯生成模型,检索增强生成在许多任务中可以取得更好的性能。
24、5、帮助用户理解大模型执行过程:由于自主代理会将每一步的模型计划以计划清单的形式展示出来,因此用户可以直观地看到模型对用户提问的意图拆解,以及每一步计划的执行过程,为最终生成结果提供依据,提高了生成式大模型的可解释性。
25、综上所述,本发明实现了使用检索增强生成技术的自主代理系统,有效缓解大模型的生成幻觉问题,提高了大模型的生成速度,并同时提高了生成内容的关联性、时效性以及准确性;另外,本发明通过设计计划模块的计划清单、执行模块的逐步执行等流程机制,帮助用户理解大模型的执行过程,提高最终结果的可解释性。
1.一种基于检索增强生成技术与生成式大模型的自主代理系统,其特征在于,包括:
2.根据权利要求1所述的基于检索增强生成技术与生成式大模型的自主代理系统,其特征在于:所述的特定业务领域的数据集包括特定业务领域的长文本、表格和数据库;将数据集统一转化为文本格式,然后按照分隔符分块并生成分块的摘要信息,将各个摘要及其分块文本共同建立知识库。
3.根据权利要求1所述的基于检索增强生成技术与生成式大模型的自主代理系统,其特征在于:所述的记忆模块包括长期记忆子模块和短期记忆子模块,长期记忆子模块用于存储通过检索增强生成rag检索后从记忆模块自身和知识库模块的知识库中召回的关联知识,短期记忆子模块用于存储多轮对话中用户输入的提问和对话内容以及执行模块的反思结果。
4.根据权利要求3所述的基于检索增强生成技术与生成式大模型的自主代理系统,其特征在于:所述的计划模块通过其中的提示词prompt根据多轮对话中用户输入的提问和对话内容识别出用户的提问意图,即获得用户的请求内容,并将用户的请求内容和从记忆模块中获得的关联知识进行结合,最终制定获得计划清单;用户的请求内容被存储至记忆模块的短期记忆子模块中,关联知识被存储至记忆模块的长期记忆子模块中。
5.根据权利要求1所述的基于检索增强生成技术与生成式大模型的自主代理系统,其特征在于:所述的执行模块由大模型和工具函数组成,执行模块根据计划模块反馈的计划清单从而调用大模型获得计划执行文本,调用工具函数获得计划执行结果,将计划执行结果添加至执行模块中的提示词prompt中并进而反馈至计划模块中。
6.根据权利要求1-5任一所述的自主代理系统的处理方法,其特征在于,包括: