一种外部规章制度在企业内部执行落实的方法与流程

    专利查询2022-07-09  143



    1.本发明涉及文本自动匹配领域,具体是指一种外部规章制度在企业内部执行落实的方法。


    背景技术:

    2.通常企业需要对上级领导单位下发的规章制度进行落地化处理。处理过程为:合规部门发起,由专人对下发的规章制度进行手动拆分,将对应的外规下发给相关的部门负责人。相关部门负责人会通过人工手段将下发的外部规章制度在内部制度中进行查找,如果查找到,提交对应的内规条目及内规全文附件,交给合规部门进行审核。经合规部门审核后,如过确认无误,流程结束。如果相关部门负责人找不到对应的内规,则由合规部门发起,相应部门去按照外部规章在内部进行落实。现有技术通常存在以下缺点:
    3.(1)人工对比的对比效率过低,具体表现在人员需要手动调取内部规章制度,与外部规章制度文件进行肉眼逐一匹配,使得时间人力成本大大增加。
    4.(2)人工对比的匹配程度高低没有一套标准去衡量,受主观人为因素影响从而造成匹配效果不稳定。
    5.(3)人工对比特别依赖专家的经验以及专家的信任度,有可能出现专家离职现象,导致无法正常运行。
    6.因此,一种外部规章制度在企业内部执行落实的方法成为整个社会亟待解决的问题。


    技术实现要素:

    7.为解决上述技术问题,本发明提供的技术方案为:一种外部规章制度在企业内部执行落实的方法,包括以下步骤,
    8.(1)文件拆分模块,系统通过自定义正则进行文本拆分,将文本拆分为段落;
    9.(2)词库扩展,采用了四个模块来处理,分别是分词自定义模块,同义词补充模块,缩略词补充模块和停用词补充模块;
    10.(3)文本匹配度计算,系统将段落文本进行智能分词,加载词库扩展模块对分词进行过滤,根据textrank算法得出关键词若干个,找出与每条外规匹配度较高的多个内规,包括以下子步骤:
    11.a、首先需要将段落文本通过jieba分词工具进行智能分词,将分词结果通过我们自定义的词语过滤模块进行过滤,词语过滤模块包括了词性过滤,同义词过滤,停用词过滤和缩略词过滤四部分;
    12.b、将分词结果通过textrank算法分别计算出每段文本最有影响力的若干词语,假设外部规章制度关键词与内部规章制度关键词集合交集的数量为n,外部规章制度文本段落的关键词数量为m,即n/m作为两段文本之间的匹配度,将匹配度进行排序,即可得到与外部规章制度匹配度较高的多个内部规章制度。
    13.进一步地,所述文件拆分模块包括以下两个部分:
    14.(1)正则库是基于客户提供的文件目录结构进行总结,针对不同层级的目录标题,生成文本拆分规则;
    15.(2)将不同格式的文件转换成txt文本,程序读取txt文本,根据换行符首次切分文本内容,采用递归,用定义好的多层级正则库对文本进行拆分,取得每个层级的段落信息。
    16.发明与现有技术相比的优点在于:具备以下优点,
    17.(1)解决人工对比效率问题。过去需要人员进行肉眼逐一匹配,但是现在人员仅需向领导申请使用程序,程序就会自动对比文件,节省了时间与人力成本。
    18.(2)解决了在过去对专家经验的依赖并且没有明确的匹配度规则。在程序中用图模型来定义匹配度的计算方式,进一步提高对比工作的稳定性
    19.(3)解决依赖专家经验只对比一部分内部规章制度的问题。程序可以做到对比所有内部规章制度文本,减少了对专家的依赖,提高了对比准确率。
    20.因此,上述技术方案使外部规章制度在企业内部执行落实的精确度大大提高;减少人工合规投入的重复性工作量,缩短周期。减少对相关专家的依赖。
    附图说明
    21.图1是现有技术的结构示意图;
    22.图2是本发明一种外部规章制度在企业内部执行落实的方法结构示意图;
    23.图3是本发明一种外部规章制度在企业内部执行落实的方法具体模块连接图。
    具体实施方式
    24.下面结合附图对本发明做进一步的详细说明。
    25.结合附图,对本发明进行详细介绍。
    26.本发明在具体实施时提供了一种外部规章制度在企业内部执行落实的方法,包括以下步骤,
    27.(1)文件拆分模块,系统通过自定义正则进行文本拆分,将文本拆分为段落;
    28.(2)词库扩展,采用了四个模块来处理,分别是分词自定义模块,同义词补充模块,缩略词补充模块和停用词补充模块;
    29.(3)文本匹配度计算,系统将段落文本进行智能分词,加载词库扩展模块对分词进行过滤,根据textrank算法得出关键词若干个,找出与每条外规匹配度较高的多个内规,包括以下子步骤:
    30.a、首先需要将段落文本通过jieba分词工具进行智能分词,将分词结果通过我们自定义的词语过滤模块进行过滤,词语过滤模块包括了词性过滤,同义词过滤,停用词过滤和缩略词过滤四部分;
    31.b、将分词结果通过textrank算法分别计算出每段文本最有影响力的若干词语,假设外部规章制度关键词与内部规章制度关键词集合交集的数量为n,外部规章制度文本段落的关键词数量为m,即n/m作为两段文本之间的匹配度,将匹配度进行排序,即可得到与外部规章制度匹配度较高的多个内部规章制度。
    32.本发明的具体实施方式如下:
    33.1、文件拆分模块:
    34.系统通过自定义正则进行文本拆分,将文本拆分为段落。
    35.a)正则库是基于客户提供的文件目录结构进行总结,针对不同层级的目录标题,例如:第一章(一级标题),第一节(二级标题),第一条(三级标题)来进行正则定义,生成文本拆分规则。
    36.b)将不同格式的文件转换成txt文本,程序读取txt文本,根据换行符首次切分文本内容,采用递归,用定义好的多层级正则库对文本进行拆分,取得每个层级的段落信息。
    37.2、词库扩展:
    38.词库扩展是为了加强本发明对不同场景的拟合能力。由于各企业之间的特性与领域不同,产生的专业词汇会截然不同,此模块为了适应特定场景,主要采用了四个模块来处理,分别是分词自定义模块,同义词补充模块,缩略词补充模块,停用词补充模块。
    39.a)分词自定义模块是为了在进行分词之前,通过用户自定义配置的方式,能将不在中文分词器中但存在于实际场景的词语分出来,主要针对一些专有名词与专有动词。
    40.b)同义词补充模块与缩略词补充模块是通过用户自定义配置的方式,为了完善词语之间的映射关系。停用词补充模块是用户自定义配置的方式,完善在计算关键词之前的停用词过滤的词库。逐渐在专家操作软件的过程中,通过配置优化模型,更进一步增加准确性。
    41.3、文本匹配度计算:
    42.系统将段落文本进行智能分词,加载词库扩展模块对分词进行过滤,根据textrank算法得出关键词若干个,找出与每条外规匹配度较高的多个内规。
    43.首先需要将段落文本通过jieba分词工具进行智能分词,将分词结果通过我们自定义的词语过滤模块进行过滤,词语过滤模块包括了词性过滤,同义词过滤,停用词过滤,缩略词过滤四部分,词性过滤是为了处理中文词汇中部分属于含有信息量很少但可能出现频次很高的词性的词语,同义词过滤与缩略词过滤是为了实现实际场景中由于企业内部的自定义的专业词语的统一映射,停用词过滤是为了用户凭借专家经验或客观事实自定义不应该出现在关键词的部分词语。解决了人工对比主观性强造成的不稳定性。
    44.将分词结果通过textrank算法分别计算出每段文本最有影响力的若干词语,假设外部规章制度关键词与内部规章制度关键词集合交集的数量为n,外部规章制度文本段落的关键词数量为m,即n/m作为两段文本之间的匹配度,将匹配度进行排序,即可得到与外部规章制度匹配度较高的多个内部规章制度。相对于传统省去对比成本。
    45.作为本发明的进一步阐述,包括以下关键技术:
    46.(1)可定制,积累,扩展的多通道词语过滤系统。
    47.(2)专家规则和机器学习相结合的文本匹配度对比模型。
    48.(3)极高的提高了外部规章制度在企业内部执行落实工作的效率。
    49.(4)解决了专家的依赖且没有明确的匹配度计算规则的问题。
    50.以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
    转载请注明原文地址:https://tc.8miu.com/read-3645.html

    最新回复(0)