对话中的实体识别方法、装置、设备及存储介质与流程

专利查询2025-11-11 39

本公开涉及车辆，尤其涉及一种对话中的实体识别方法、装置、设备及存储介质。

背景技术：

1、命名实体识别(named entity recognition,简称ner)是指给定一段文本，识别出文本中具有特定意义的实体词，包括人名、地名、机构名、专有名词等，在影视实体识别场景中，待识别的实体为影视片名或人物名。

2、目前的命名实体识别方法包括采用深度学习的方法，将任务表示为多分类任务或者序列标注任务，从数据中学习以进行命名实体识别。

3、随着大数据技术的发展和资源类数据的指数增长，视频媒资领域涌现了大量的影视相关实体，如影视作品名、演员名、导演名等非结构化数据，很多影视片名中经常出现网络用语、口语化用语等新词汇，例如“我有一点小糊涂”既是主题曲名，又是日常闲聊中的常见用语，在新上映的影视剧存在前述新词汇时，在识别此类实体词时难以与闲聊场景进行区分，因此，针对以上情况如何准确的从对话中提取命名实体是一个亟待解决的技术问题。

技术实现思路

1、为了解决上述技术问题，本公开提供了一种对话中的实体识别方法、装置、设备及存储介质。

2、第一方面，本公开实施例提供了一种对话中的实体识别方法，包括：

3、获取对话文本，其中，所述对话文本包括至少一个单句；

4、对所述对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量；

5、将每个单句与领域知识库中的实体信息进行匹配，以从所述领域知识库中确定包含于所述单句中的目标实体；

6、根据所述目标实体在领域知识库中对应的预设权重对所述第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量；

7、将所述第二特征向量输入实体识别模型，生成实体识别结果。

8、第二方面，本公开实施例提供了一种对话中的实体识别装置，包括：

9、获取模块，用于获取对话文本，其中，所述对话文本包括至少一个单句；

10、编码模块，用于对所述对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量；

11、匹配模块，用于将每个单句与领域知识库中的实体信息进行匹配，以从所述领域知识库中确定包含于所述单句中的目标实体；

12、生成模块，用于根据所述目标实体在领域知识库中对应的预设权重对所述第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量；

13、识别模块，用于将所述第二特征向量输入实体识别模型，生成实体识别结果。

14、第三方面，本公开实施例提供了一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述第一方面所述的对话中的实体识别方法。

15、第四方面，本公开实施例提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述的对话中的实体识别方法。

16、第五方面，本公开实施例提供了一种车辆，包括如上述第二方面所述的对话中的实体识别装置，或者，如上述第三方面所述的电子设备。

17、本公开实施例提供的技术方案与现有技术相比具有如下优点：通过对对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量，将每个单句与领域知识库中的实体信息进行匹配，以从领域知识库中确定包含于单句中的目标实体，根据目标实体对应的权重对第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量，将第二特征向量输入实体识别模型，生成实体识别结果，由此，通过引入领域知识库中实体信息进行交互计算，能够精准识别并挖掘用户对话中对应领域的实体词，提高实体识别模型的识别能力及准确度，提升用户的交互体验。

技术特征：

1.一种对话中的实体识别方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对所述对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量，包括：

3.如权利要求1所述的方法，其特征在于，根据所述目标实体在所述领域知识库中对应的预设权重对所述第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量，包括：

4.如权利要求1所述的方法，其特征在于，所述领域知识库为闲聊知识库和影视实体库，所述将每个单句与领域知识库中的实体信息进行匹配，以从所述领域知识库中确定包含于所述单句中的目标实体，包括：

5.如权利要求4所述的方法，其特征在于，还包括：

6.如权利要求1所述的方法，其特征在于，所述将所述第二特征向量输入实体识别模型，生成实体识别结果，包括：

7.一种对话中的实体识别装置，其特征在于，包括：

8.一种电子设备，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1-6中任一所述的对话中的实体识别方法。

10.一种车辆，其特征在于，包括：

技术总结
本公开涉及一种对话中的实体识别方法、装置、设备及存储介质，其中，方法包括：获取对话文本；对对话文本中的每个单句进行编码，生成每个单句对应的第一特征向量；将每个单句与领域知识库中的实体信息进行匹配，以从领域知识库中确定包含于单句中的目标实体；根据目标实体对应的权重对第一特征向量中的目标实体进行加权，生成每个单句对应的第二特征向量；将第二特征向量输入实体识别模型，生成实体识别结果。根据本公开的技术方案，能够提高实体识别模型的识别能力及准确度，提升用户的交互体验。

技术研发人员：徐洋,陈伟,江会星
受保护的技术使用者：北京罗克维尔斯科技有限公司
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-31869.html

专利

最新回复(0)