一种基于RAG的文档问答方法、系统、设备及介质

    专利查询2025-06-17  20


    本发明涉及智能问答,具体涉及一种基于rag的文档问答方法、系统、设备及介质。


    背景技术:

    1、现有文档检索方法通过将文档进行切片并储存在向量数据库中,通过获取用户问题并与知识库中的文档进行匹配,然后利用推理大模型或问题转换大模型生成回答,并将问题及回答添加至历史对话集中。现有方法包括:

    2、(1)获取问答答案及一定数量的召回文档,通过预设的prompt提示引导问题转换大模型有效转换当前问题,并由大语言模型基于问题和召回文档生成答案。若答案满足预设的问答输出条件,则对答案进行切片,生成答案切片,并通过召回文档对答案切片进行溯源,确定答案切片的溯源结果;

    3、(2)通过检索知识库中与用户问题相匹配的文档数据,利用检索增强生成(retrieval-augmented generation,rag)推理大模型或问题转换大模型生成回答,并结合历史对话集分析当前问题与历史对话的相关性,以生成更准确的回答。系统在处理第一问题时直接检索并生成回答,而在处理第二及后续问题时,会先分析其与历史对话的匹配关系,然后根据分析结果进行问题预处理,再生成回答。

    4、现有的基于大型语言模型和rag的问答系统没有考虑对问题进行分类,在处理简单查询问题时,也通过rag的方式,造成了不必要的开销,影响客户体验;而对于非常复杂的问题有时可能无法提供充分的查询处理能力,导致回答的准确度下降。


    技术实现思路

    1、有鉴于此,本发明提供了一种基于rag的文档问答方法、系统、设备及介质,以解决简单问题的处理过程浪费资源及复杂问题的回答准确性低的问题。

    2、第一方面,本发明提供了一种基于rag的文档问答方法,方法包括:

    3、获取用户查询的目标问题,并利用预设分类器对目标问题的复杂度进行评估,得到目标问题的复杂度评估结果;

    4、根据目标问题的复杂度评估结果确定目标问题的答案生成方案,答案生成方案包括利用预设大语言模型直接生成答案,或,利用预设检索器检索预设文档得到与目标问题相关的外部知识,结合外部知识利用预设大语言模型生成答案。

    5、本发明提供的基于rag的文档问答方法,通过动态调整答案生成方案以优化对不同类型问题的问答响应,简化了对简单问题的处理过程,节约了计算资源,优化了问答过程,提高了对复杂问题的回答准确性。

    6、在一种可选的实施方式中,预设分类器的训练过程包括:

    7、获取用户查询的多个问题,并通过多种预设答案生成方案对各问题做出回答得到多种答案,各预设答案生成方案具有不同的复杂度;

    8、将多种答案与预设标准答案进行比较,确定各答案与预设标准答案的相似度;

    9、将各答案与预设标准答案的相似度进行比较,将相似度最大的答案对应的预设答案生成方案的复杂度作为对应问题的复杂度,复杂度从低到高包括第一复杂度、第二复杂度、第三复杂度;

    10、利用各问题及对应的复杂度对预设分类模型进行训练,得到预设分类器。

    11、本发明提供的基于rag的文档问答方法,利用具有不同复杂度的答案生成方案回答目标问题,通过比较答案确定问题的复杂度,再根据多个不同复杂度的问题对预设分类模型进行训练,得到预设分类器,实现对不同问题的分类,不同类型的问题采用不同的预设答案生成方案,既避免了简单问题浪费资源,也实现了提高复杂问题回答准确性的目的。

    12、在一种可选的实施方式中,根据目标问题的复杂度评估结果确定目标问题的答案生成方案,包括:

    13、若目标问题的复杂度评估结果为第一复杂度,则将目标问题输入预设大语言模型生成答案;

    14、若目标问题的复杂度评估结果为第二复杂度,则利用预设检索器获取外部知识,并将外部知识与目标问题共同输入预设大语言模型生成答案;

    15、若目标问题的复杂度评估结果为第三复杂度,则将利用预设检索器、预设大语言模型生成答案的过程进行迭代,直至生成的答案满足预设标准度评估要求。

    16、本发明提供的基于rag的文档问答方法,自动评估每个问题的复杂度,并针对不同复杂度的问题,采用不同的答案生成方案,减少了算力负担和不必要的标记开销,提高了问答准确性。

    17、在一种可选的实施方式中,将目标问题输入预设大语言模型生成答案,包括:

    18、根据复杂度为第一复杂度的目标问题确定第一标记序列;

    19、将第一标记序列输入预设大语言模型,输出第二标记序列;

    20、根据第二标记序列确定复杂度为第一复杂度的目标问题的第一答案。

    21、本发明提供的基于rag的文档问答方法,直接利用预设大语言模型对第一复杂度的目标问题进行回答,自动与用户提问进行交互,快速定位出目标问题对应的答案,并对答案进行归纳总结,大幅度降低了人工阅读查询的工作量,提高了问答效率。

    22、在一种可选的实施方式中,利用预设检索器获取外部知识,并将外部知识与目标问题共同输入预设大语言模型生成答案,包括:

    23、获取多个文档,并将各文档转换为文本数据;

    24、将文本数据进行向量化得到向量数据,并将向量数据存储到向量数据库中;

    25、根据复杂度为第二复杂度的目标问题,利用预设检索器检索向量数据库,得到外部知识;

    26、将外部知识与复杂度为第二复杂度的目标问题共同输入预设大语言模型,生成第二复杂度的目标问题的第二答案。

    27、本发明提供的基于rag的文档问答方法,对于第二复杂度的目标问题,结合检索器检索的外部知识,使文档信息提取更加精准细致,从而更加全面、准确地获取与目标问题相关的内容,提高了文档查询的准确率。

    28、在一种可选的实施方式中,将利用预设检索器、预设大语言模型生成答案的过程进行迭代,直至生成的答案满足预设要求,包括:

    29、根据复杂度为第三复杂度的目标问题,利用预设检索器检索向量数据库,得到外部知识;

    30、将外部知识与复杂度为第三复杂度的目标问题共同输入预设大语言模型,得到第三答案;

    31、判断第三答案是否满足预设准确性评估要求,若不满足,则返回利用预设检索器检索向量数据库的步骤,直至生成的第三答案满足预设准确性评估要求。

    32、本发明提供的基于rag的文档问答方法,对于第三复杂度的目标问题,采用循环迭代的方式进行回答,直至生成的第三答案满足预设准确性评估要求,保证了回答目标问题的准确性,提高了问答质量。

    33、第二方面,本发明提供了一种基于rag的文档问答系统,系统包括:

    34、复杂度评估模块,用于获取用户查询的目标问题,并利用预设分类器对目标问题的复杂度进行评估,得到目标问题的复杂度评估结果;

    35、答案生成方案确定模型,用于根据目标问题的复杂度评估结果确定目标问题的答案生成方案,答案生成方案包括利用预设大语言模型直接生成答案,或,利用预设检索器检索预设文档得到与目标问题相关的外部知识,利用外部知识及预设大语言模型生成答案。

    36、第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的方法。

    37、第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的方法。

    38、第五方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的方法。


    技术特征:

    1.一种基于rag的文档问答方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述预设分类器的训练过程包括:

    3.根据权利要求2所述的方法,其特征在于,根据所述目标问题的复杂度评估结果确定所述目标问题的答案生成方案,包括:

    4.根据权利要求3所述的方法,其特征在于,将所述目标问题输入预设大语言模型生成答案,包括:

    5.根据权利要求3所述的方法,其特征在于,利用预设检索器获取外部知识,并将所述外部知识与所述目标问题共同输入所述预设大语言模型生成答案,包括:

    6.根据权利要求5所述的方法,其特征在于,将利用所述预设检索器、预设大语言模型生成答案的过程进行迭代,直至生成的答案满足预设要求,包括:

    7.一种基于rag的文档问答系统,其特征在于,所述系统包括:

    8.一种计算机设备,其特征在于,包括:

    9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的方法。

    10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令用于使计算机执行权利要求1至6中任一项所述的方法。


    技术总结
    本发明涉及智能问答技术领域,公开了一种基于RAG的文档问答方法、系统、设备及介质,方法包括:获取用户查询的目标问题,并利用预设分类器对目标问题的复杂度进行评估,得到目标问题的复杂度评估结果;根据目标问题的复杂度评估结果确定目标问题的答案生成方案,答案生成方案包括利用预设大语言模型直接生成答案,或,利用预设检索器检索预设文档得到与目标问题相关的外部知识,结合外部知识利用预设大语言模型生成答案。本发明提供的基于RAG的文档问答方法,通过动态调整答案生成方案以优化对不同类型问题的问答响应,简化了对简单问题的处理过程,节约了计算资源,优化了问答过程,提高了对复杂问题的回答准确性。

    技术研发人员:宋洁,何冠楠,文浩然,罗东,龚起航,艾书荟,肖亨波
    受保护的技术使用者:北京大学长沙计算与数字经济研究院
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-29499.html

    最新回复(0)