一种展会信息匹配方法、装置、存储介质及终端设备与流程

    专利查询2022-07-07  165



    1.本发明涉及信息技术服务领域,尤其涉及一种展会信息匹配方法、装置、存储介质及终端设备。


    背景技术:

    2.展会是在特定的时间、地点、期限,通过展示达到产品、服务、信息交流的社会形式。当今社会的商人通过展会去进行产品或技术的展示、商业渠道的拓展、销售的促进以及品牌的传播,通常可以理解为含有商业用途的宣传手段。在我们国家中,常见的展会有:博览会、展览会以及交易会等。由于展会能够在较短的时间内,最较小的空间里,用较少的成本去作出较大的生意,展会的发展也推动了社会经济的发展。而在如今高度信息化的时代,通过在网络上获取展会信息已经是人们了解展会信息的主要方式。随着行业竞争日益激烈,人与人之间的信息差逐渐缩小,能够更快获得最新、最全面信息的一方,将会收获更大的利益。但网络上的展会信息繁杂,非展会信息较多,网页广告导致的信息噪音较大,导致展会商家难以获得展会以往成交的数据,以及展会提供的展位信息,从而难以进一步的参展。
    3.在现有的展会信息获取技术中,存在一些腰部和长尾展会数据量大但收录率低、以及参展商信息不全的问题。因此,目前市面上亟需一种展会信息匹配策略,解决对展会信息匹配精准度不够的缺点。


    技术实现要素:

    4.本发明实施例提供一种展会信息匹配方法、装置、存储介质及终端设备,通过运用知识图谱技术,以提高展会信息匹配的精准度。
    5.为了解决上述问题,本发明一实施例提供一种展会信息匹配方法,包括:
    6.采集展会信息并进行预处理,获得第一展会数据;
    7.根据所述第一展会数据,通过知识图谱获得所述第一展会数据的实体数据;其中,所述实体数据包括:所述第一展会数据的概念、所述第一展会数据的对象属性以及每个所述第一展会数据的概念之间的关系;
    8.根据所述实体数据,通过预设的推荐规则构建知识图谱模型;
    9.识别用户输入的文本信息,在知识图谱模型中进行匹配关联,将匹配度达到第一预设值的实体数据作为第二展会数据,并将所述第二展会数据反馈给用户。
    10.作为上述方案的改进,所述采集展会信息并进行预处理,获得第一展会数据,具体为:
    11.从展会平台上采集展会信息,对所述展会信息进行校验和解析;
    12.通过数据清洗规则,对进行校验和解析后的展会信息进行梳理和整合,从而获得第一展会数据。
    13.作为上述方案的改进,所述对进行校验和解析后的展会信息进行梳理和整合,具
    体为:
    14.在对展会信息进行校验和解析后,对展会信息进行展会数据、展会和展商基础数据和展馆数据三个方面的梳理和整合;
    15.根据与所述展会信息的字段重合度超过第二预设值的数据源,从而获取展会数据;
    16.根据所述展会数据的数据内容的数量大于第三预设值的数据源,补充展会和展商基础数据,并根据所述展会数据的可靠性达到第四预设值的数据源,更新展会和展商基础数据,从而获取展会和展商基础数据;
    17.从展馆官网和公开的数据渠道,获取展馆数据。
    18.作为上述方案的改进,所述根据所述第一展会数据,通过知识图谱获得所述第一展会数据的实体数据,具体为:
    19.在所述知识图谱中找到所述第一展会数据相关的第一实体;
    20.根据所述知识图谱中的数据库,获取所述第一实体的知识集合;
    21.根据所述知识集合,配置、关联多个所述第一展会数据的概念、多个所述第一展会数据的对象属性、以及多个所述第一展会数据的概念之间的关系,从而获得所述实体数据。
    22.作为上述方案的改进,所述根据所述实体数据,通过预设的推荐规则构建知识图谱模型,具体为:
    23.将所述实体数据作为特征入参,获得预设的推荐规则,并构建所述知识图谱模型;
    24.所述预设的推荐规则包括:推荐展会规则和搜索列表规则;
    25.根据所述推荐展会规则,在展会详情页中,按照展会推荐维度进行信息推荐;其中,所述展会推荐维度包括:相关性、权威性和影响性;
    26.根据所述搜索列表规则,在搜索列表中,按照展会匹配维度进行评分排序,若用户输入的文本信息和实体数据之间的字段重合度大于等于第五预设值,则置顶显示;若用户输入的文本信息和实体数据之间的的字段重合度小于第五预设值,则按预设排序进行列表展示。
    27.作为上述方案的改进,所述识别用户输入的文本信息,在知识图谱模型中进行匹配关联,将匹配度达到第一预设值的实体数据作为第二展会数据,并将所述第二展会数据反馈给用户,具体为:
    28.识别用户输入的文本信息,提取与所述文本信息相关的第二实体;
    29.根据所述第二实体,与知识图谱模型中的实体数据进行关联匹配,获得匹配度为第六预设值的第二展会数据,并将第二展会数据反馈给用户。
    30.作为上述方案的改进,在所述将所述第二展会数据反馈给用户之后,还包括:根据第二展会数据,通过知识图谱获得所述第二展会数据的实体数据。
    31.相应的,本发明还提供了一种展会信息匹配装置,包括:第一数据模块、第二数据模块、模型构建模块和结果输出模块;
    32.所述第一数据模块用于采集展会信息并进行预处理,获得第一展会数据;
    33.所述第二数据模块用于根据所述第一展会数据,通过知识图谱获得所述第一展会数据的实体数据;其中,所述实体数据包括:所述第一展会数据的概念、所述第一展会数据的对象属性以及每个所述第一展会数据的概念之间的关系;
    34.所述模型构建模块用于根据所述实体数据,通过预设的推荐规则构建知识图谱模型;
    35.所述结果输出模块用于识别用户输入的文本信息,在知识图谱模型中进行匹配关联,将匹配度达到第一预设值的实体数据作为第二展会数据,并将所述第二展会数据反馈给用户。
    36.作为上述方案的改进,在所述将所述第二展会数据反馈给用户之后,还包括:根据第二展会数据,通过知识图谱获得所述第二展会数据的实体数据。
    37.作为上述方案的改进,所述第一数据模块,包括:第一采集单元和第二采集单元;
    38.所述第一采集单元用于从展会平台上采集展会信息,对所述展会信息进行校验和解析;
    39.所述第二采集单元用于通过数据清洗规则,对进行校验和解析后的展会信息进行梳理和整合,从而获得第一展会数据。
    40.作为上述方案的改进,所述对进行校验和解析后的展会信息进行梳理和整合,具体为:在对展会信息进行校验和解析后,对展会信息进行展会数据、展会和展商基础数据和展馆数据三个方面的梳理和整合;根据与所述展会信息的字段重合度超过第二预设值的数据源,从而获取展会数据;根据所述展会数据的数据内容的数量大于第三预设值的数据源,补充展会和展商基础数据,并根据所述展会数据的可靠性达到第四预设值的数据源,更新展会和展商基础数据,从而获取展会和展商基础数据;从展馆官网和公开的数据渠道,获取展馆数据。
    41.作为上述方案的改进,所述第二数据模块,包括:查找单元、匹配单元和配置单元;
    42.所述查找单元用于在所述知识图谱中找到所述第一展会数据相关的第一实体;
    43.所述匹配单元用于根据所述知识图谱中的数据库,获取所述第一实体的知识集合;
    44.所述配置单元用于根据所述知识集合,配置、关联多个所述第一展会数据的概念、多个所述第一展会数据的对象属性、以及多个所述第一展会数据的概念之间的关系,从而获得所述实体数据。
    45.作为上述方案的改进,所述模型构建模块,包括:建模单元、推荐规则单元、第一规则单元和第二规则单元;
    46.所述建模单元用于将所述实体数据作为特征入参,获得预设的推荐规则,并构建所述知识图谱模型;
    47.所述推荐规则单元用于所述预设的推荐规则包括:推荐展会规则和搜索列表规则;
    48.所述第一规则单元用于根据所述推荐展会规则,在展会详情页中,按照展会推荐维度进行信息推荐;其中,所述展会推荐维度包括:相关性、权威性和影响性;
    49.所述第二规则单元用于根据所述搜索列表规则,在搜索列表中,按照展会匹配维度进行评分排序,若用户输入的文本信息和实体数据之间的字段重合度大于等于第五预设值,则置顶显示;若用户输入的文本信息和实体数据之间的的字段重合度小于第五预设值,则按预设排序进行列表展示。
    50.作为上述方案的改进,所述结果输出模块,包括:识别单元和反馈单元;
    51.所述识别单元用于识别用户输入的文本信息,提取与所述文本信息相关的第二实体;
    52.所述反馈单元用于根据所述第二实体,与知识图谱模型中的实体数据进行关联匹配,获得匹配度为第六预设值的第二展会数据,并将第二展会数据反馈给用户。
    53.相应的,本发明还提供了一种计算机终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如本发明所述的一种展会信息匹配方法。
    54.相应的,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如本发明所述的一种展会信息匹配方法。
    55.由上可见,本发明具有如下有益效果:
    56.本发明提供了一种展会信息匹配方法、装置、存储介质及终端设备,本方法结合知识图谱中的知识,构建了知识图谱模型,通过将用户查找的内容输入至知识图谱模型中,以进行更多展会信息的匹配,减少了信息匹配的误差,提高了匹配的精准度。本方法相较于现有技术,能够基于知识图谱进行知识挖掘,从而达到更好的展会信息的检索效果,有利于提高用户进行展会信息搜索的效率。
    57.进一步地,本发明在知识图谱模型中增加了推荐规则,提高了推荐展会业务场景与用户搜索内容的相关性,增加了信息匹配模型的可用性。本发明还引入了展会信息在结构上的关系知识,进一步地提高了展会信息在进行匹配检索的精准度。
    58.进一步地,本发明在为用户反馈匹配度最高的展会信息数据后,再次对用户输入的文本信息进行实体数据的搜索,补充缺少的关联信息,以优化知识图谱模型。
    附图说明
    59.图1是本发明一实施例提供的展会信息匹配方法的流程示意图;
    60.图2是本发明一实施例提供的展会信息匹配装置的结构示意图;
    61.图3是本发明一实施例提供的一种终端设备结构示意图。
    具体实施方式
    62.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
    63.实施例一
    64.参见图1,图1是本发明一实施例提供的一种展会信息匹配方法的流程示意图,如图1所示,本实施例包括步骤101至步骤104,各步骤具体如下:
    65.步骤101:采集展会信息并进行预处理,获得第一展会数据。
    66.作为上述方案的改进,从展会平台上采集展会信息,对展会信息进行校验和解析;通过数据清洗规则,对进行校验和解析后的展会信息进行梳理和整合,从而获得第一展会数据;其中,数据清洗规则包括但不限于:展会地址信息不能为全数字组合或者全字母组
    合、以及展商联系方式不能出现中文字符等。
    67.作为上述方案的改进,在对展会信息进行校验和解析后,对展会信息进行展会数据、展会和展商基础数据和展馆数据三个方面的梳理和整合;根据与所述展会信息的字段重合度超过第二预设值的数据源,从而获取展会数据;根据展会数据的数据内容的数量大于第三预设值的数据源,补充展会和展商基础数据,并根据展会数据的可靠性达到第四预设值的数据源,更新展会和展商基础数据,从而获取展会和展商基础数据;从展馆官网和公开的数据渠道,获取展馆数据。
    68.作为上述方案的改进,展会信息可由爬虫技术在展会平台公开的数据信息中获取。
    69.作为上述方案的改进,对展会信息进行展会数据的梳理和整合,可以为:在剔除预设的常规重复字段后,如:“第”、“届”等,与展会信息剩余的字段重合度超过70%的展会数据为高匹配度数据,并作为展会数据。
    70.作为上述方案的改进,对展会信息进行展会和展商基础数据的梳理和整合,可以为:根据数据内容的数量,数据内容的数量最多的数据源优先补充展会和展商基础数据,并从中国展览馆协会的认证会员、国际展览联盟的认证会员、资质列表中获取可靠性,从而获取展会和展馆基础数据。
    71.步骤102:根据所述第一展会数据,通过知识图谱获得所述第一展会数据的实体数据;其中,所述实体数据包括:所述第一展会数据的概念、所述第一展会数据的对象属性以及每个所述第一展会数据的概念之间的关系。
    72.为了更好地说明本实施例,以下面的例子进行举例说明。
    73.通过知识图谱获取到实体:“广交会展馆”,关联:“既是年办展超100次的展馆”,其中,“展馆”是广交会展馆的概念,“年办展超100次”是广交会展馆的对象属性;以及“又是中展协认证展馆”,其中,“中展协认证展馆”是广交会展馆的概念,“已认证”是广交会展馆的对象属性。
    74.作为上述方案的改进,在知识图谱中找到第一展会数据相关的第一实体;根据知识图谱中的数据库,获取第一实体的知识集合;根据知识集合,配置、关联多个第一展会数据的概念、多个第一展会数据的对象属性、以及多个第一展会数据的概念之间的关系,从而获得实体数据。
    75.步骤103:根据所述实体数据,通过预设的推荐规则构建知识图谱模型;
    76.作为上述方案的改进,将实体数据作为特征入参,获得预设的推荐规则,并构建知识图谱模型;预设的推荐规则包括:推荐展会规则和搜索列表规则;根据推荐展会规则,在展会详情页中,按照展会推荐维度进行信息推荐;其中,展会推荐维度包括:相关性、权威性和影响性;根据搜索列表规则,在搜索列表中,按照展会匹配维度进行评分排序,若用户输入的文本信息和实体数据之间的字段重合度大于等于第五预设值,则置顶显示;若用户输入的文本信息和实体数据之间的的字段重合度小于第五预设值,则按预设排序进行列表展示。
    77.作为上述方案的改进,推荐展会规则按照相关性、权威性和影响性进行信息推荐,其中,相关性为:优先推荐二及行业分类的数据(如:车、汽摩、轮船、零配件等),其次推荐一级行业分类的数据(如:重工业、轻工业等);权威性为:在满足相关性的前提下,推荐已获得
    中国展览馆协会、国际展览联盟的认证名单,以及主办方资质、认证情况等;在满足权威性的前提下,展会在搜索引擎上的索引数和收录数。
    78.作为上述方案的改进,用户输入的文本信息和实体数据之间的的字段重合度小于第五预设值,则按预设排序进行列表展示,具体为:若文本信息和实体数据之间的字段重合度小于70%时,则按照:同一检索词的往届展会>检索词的同行业展会>相关检索词的同行业展会的顺序进行排序,例如:检索词为”法兰克福汽配展”,如无高匹配度搜索结果,则检索列表为:2020年法兰克福汽配展(往届)>2021第十三届中国(十堰)汽车汽配商品(同检索词)>2021深圳国际机械制造工业展览会(相关检索词)。
    79.步骤104:识别用户输入的文本信息,在知识图谱模型中进行匹配关联,将匹配度达到第一预设值的实体数据作为第二展会数据,并将所述第二展会数据反馈给用户。
    80.作为上述方案的改进,识别用户输入的文本信息,提取与所述文本信息相关的第二实体;根据所述第二实体,与知识图谱模型中的实体数据进行关联匹配,获得匹配度为第六预设值的第二展会数据。
    81.作为上述方案的改进,在将所述第二展会数据反馈给用户之后,还包括:根据第二展会数据,通过知识图谱获得第二展会数据的实体数据。
    82.在本实施例中,本方法技术方案通过爬虫技术对展会平台上的展会信息进行获取,并对展会信息进行数据清洗,减小了展会信息的获取误差,并通过知识图谱对展会信息进行知识挖掘,以达到更好的搜索效果。通过知识图谱模型对用户输入文本信息进行识别、匹配,从而获得高匹配度的相关数据,有利于提高展会信息匹配的精准度,提高用户的使用体验。
    83.实施例二
    84.参见图2,图2是本发明一实施例提供的一种展会信息匹配装置的结构示意图,包括:第一数据模块201、第二数据模块202、模型构建模块203和结果输出模块204。
    85.所述第一数据模块201用于采集展会信息并进行预处理,获得第一展会数据。
    86.所述第二数据模块202用于根据所述第一展会数据,通过知识图谱获得所述第一展会数据的实体数据;其中,所述实体数据包括:所述第一展会数据的概念、所述第一展会数据的对象属性以及每个所述第一展会数据的概念之间的关系。
    87.所述模型构建模块203用于根据所述实体数据,通过预设的推荐规则构建知识图谱模型。
    88.所述结果输出模块204用于识别用户输入的文本信息,在知识图谱模型中进行匹配关联,将匹配度达到第一预设值的实体数据作为第二展会数据,并将所述第二展会数据反馈给用户。
    89.作为上述方案的改进,在所述将所述第二展会数据反馈给用户之后,还包括:根据第二展会数据,通过知识图谱获得所述第二展会数据的实体数据。
    90.作为上述方案的改进,所述第一数据模块201,包括:第一采集单元和第二采集单元。
    91.所述第一采集单元用于从展会平台上采集展会信息,对所述展会信息进行校验和解析。
    92.所述第二采集单元用于通过数据清洗规则,对进行校验和解析后的展会信息进行
    梳理和整合,从而获得第一展会数据。
    93.作为上述方案的改进,所述对进行校验和解析后的展会信息进行梳理和整合,具体为:在对展会信息进行校验和解析后,对展会信息进行展会数据、展会和展商基础数据和展馆数据三个方面的梳理和整合;根据与所述展会信息的字段重合度超过第二预设值的数据源,从而获取展会数据;根据所述展会数据的数据内容的数量大于第三预设值的数据源,补充展会和展商基础数据,并根据所述展会数据的可靠性达到第四预设值的数据源,更新展会和展商基础数据,从而获取展会和展商基础数据;从展馆官网和公开的数据渠道,获取展馆数据。
    94.作为上述方案的改进,所述第二数据模块202,包括:查找单元、匹配单元和配置单元。
    95.所述查找单元用于在所述知识图谱中找到所述第一展会数据相关的第一实体。
    96.所述匹配单元用于根据所述知识图谱中的数据库,获取所述第一实体的知识集合。
    97.所述配置单元用于根据所述知识集合,配置、关联多个所述第一展会数据的概念、多个所述第一展会数据的对象属性、以及多个所述第一展会数据的概念之间的关系,从而获得所述实体数据。
    98.作为上述方案的改进,所述模型构建模块203,包括:建模单元、推荐规则单元、第一规则单元和第二规则单元。
    99.所述建模单元用于将所述实体数据作为特征入参,获得预设的推荐规则,并构建所述知识图谱模型。
    100.所述推荐规则单元用于所述预设的推荐规则包括:推荐展会规则和搜索列表规则。
    101.所述第一规则单元用于根据所述推荐展会规则,在展会详情页中,按照展会推荐维度进行信息推荐;其中,所述展会推荐维度包括:相关性、权威性和影响性。
    102.所述第二规则单元用于根据所述搜索列表规则,在搜索列表中,按照展会匹配维度进行评分排序,若用户输入的文本信息和实体数据之间的字段重合度大于等于第五预设值,则置顶显示;若用户输入的文本信息和实体数据之间的的字段重合度小于第五预设值,则按预设排序进行列表展示。
    103.作为上述方案的改进,所述结果输出模块204,包括:识别单元和反馈单元。
    104.所述识别单元用于识别用户输入的文本信息,提取与所述文本信息相关的第二实体。
    105.所述反馈单元用于根据所述第二实体,与知识图谱模型中的实体数据进行关联匹配,获得匹配度为第六预设值的第二展会数据,并将第二展会数据反馈给用户。
    106.在本实施例中,通过第一数据模块处理采集到的展会信息,并将处理后的展会信息输入到第二数据模块中,通过知识图谱转换为实体数据,并由模型构建模块将实体数据构建含有推荐规则的知识图谱模型,最后识别用户输入的文本信息进行匹配关联,获得与文本信息匹配度最高的展会数据,并反馈给用户。结合了知识图谱进行展会信息的检索和匹配,提高了检索的效率以及匹配的精准度。
    107.实施例三
    108.参见图3,图3是本发明一实施例提供的终端设备结构示意图。
    109.该实施例的一种终端设备包括:处理器301、存储器302以及存储在所述存储器302中并可在所述处理器301上运行的计算机程序。所述处理器301执行所述计算机程序时实现上述各个展会信息匹配方法在实施例中的步骤,例如图1所示的展会信息匹配方法的所有步骤。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块的功能,例如:图2所示的展会信息匹配装置的所有模块。
    110.另外,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任一实施例所述的展会信息匹配方法。
    111.本领域技术人员可以理解,所述示意图仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
    112.所称处理器301可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器301是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。
    113.所述存储器302可用于存储所述计算机程序和/或模块,所述处理器301通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器302内的数据,实现所述终端设备的各种功能。所述存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
    114.其中,所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
    115.需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以
    不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
    116.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
    转载请注明原文地址:https://tc.8miu.com/read-1594.html

    最新回复(0)