混合多机器翻译引擎的翻译方法及翻译系统与流程

    专利查询2022-07-08  120



    1.本发明涉及一种翻译方法,尤其涉及一种混合多种翻译引擎的翻译方法。本发明还涉及一种采用上述翻译方法的翻译系统。


    背景技术:

    2.随着人工智能、机器学习和深度学习相关技术的发展,机器翻译引擎的翻译质量越来越好,但是数据驱动的机器翻译引擎依然受制于平行语料的规模、数据质量以及机器翻译算法,各机器翻译引擎在单独使用时,输出的结果依然存在或多或少的问题,例如译文漏译、多译、错译、译文术语不一致等。


    技术实现要素:

    3.本发明的目的是提供一种混合多机器翻译引擎的翻译方法,能够结合多个机器翻译引擎的优势以减少翻译中存在的问题,提高译文质量。
    4.本发明的另一个目的是提供一种混合多机器翻译引擎的翻译系统,能够结合多个机器翻译引擎的优势以减少翻译中存在的问题,提高译文质量。
    5.本发明提供了一种混合多机器翻译引擎的翻译方法,包括下列步骤:设置数个机器翻译引擎;将句子结构的原文分别输入数个机器翻译引擎以得到译文;设置数个特征打分器,数个特征打分器能够基于不同的特征对各译文进行打分;将数个特征打分器对同一个译文的打分结果在分别乘以不同的权重后求和,得到最终打分;以及选择最终打分最高的译文作为最终译文。
    6.本发明提供的混合多机器翻译引擎的翻译方法,利用多个机器翻译引擎对原文进行翻译,再通过特征打分器在多个特征维度对译文进行打分,并且将打分结果乘以不同加权后求和得到最终打分,选取最终打分最高的译文作为最终译文。混合多机器翻译引擎的翻译方法能够结合多个翻译引擎中的优势,选取综合评价最好的译文,最大限度的减少了翻译中存在的问题。
    7.在混合多机器翻译引擎的翻译方法的一种示意性方式中,特征打分器基于的特征包括译文长度比例、译文数字一致比例、译文标签一致比例、译文术语一致比例、译文流利度和译文忠实度中的至少两个。
    8.在混合多机器翻译引擎的翻译方法的一种示意性方式中,翻译方法还包括:将段落结构的原文拆分为数个句子结构的原文。借此以句为基本翻译单元,以适应多种机器翻译引擎。
    9.在混合多机器翻译引擎的翻译方法的一种示意性方式中,翻译方法还包括:按照段落结构的原文中各句子结构的原文的顺序合并各最终译文为段落结构的译文。借此生成对应原文的段落结构译文。
    10.本发明还提供了一种混合多机器翻译引擎的翻译系统,包括一个原文输入模块、一个多引擎翻译模块、一个多特征打分模块、一个打分计算模块以及一个译文输出模块。原文输入模块用于输入原文;多引擎翻译模块包括数个机器翻译引擎,各机器翻译引擎能够从原文输入模块获取句子结构的原文并翻译为译文;多特征打分模块包括数个特征打分器,数个特征打分器能够基于不同的特征对各译文进行打分;打分计算模块能够将数个特征打分器对同一个原文的数个译文的打分结果在分别乘以不同的权重后求和,得到最终打分最高的译文作为最终译文;译文输出模块能够获取最终译文并输出。
    11.在混合多机器翻译引擎的翻译系统的一种示意性实施方式中,特征打分器基于的特征包括译文长度比例、译文数字一致比例、译文标签一致比例、译文术语一致比例、译文流利度和译文忠实度中的至少两个。
    12.在混合多机器翻译引擎的翻译系统的一种示意性实施方式中,原文输入模块还能够将的段落结构的原文中的段落拆分为数个句子结构的原文。借此以句为基本翻译单元,以适应多种机器翻译引擎。
    13.在混合多机器翻译引擎的翻译系统的一种示意性实施方式中,译文输出模块还能够按照原文中各句子的顺序合并各最终译文为段落结构的译文。借此生成对应原文的段落结构译文。
    14.下文将以明确易懂的方式,结合附图说明优选实施例,对混合多机器翻译引擎的翻译方法及翻译系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
    附图说明
    15.以下附图仅对本发明做示意性说明和解释,并不限定本发明的范围。
    16.图1为用以说明混合多机器翻译引擎的翻译方法的一种示意性实施方式的工作流程示意图。
    17.图2为用以说明混合多机器翻译引擎的翻译方法的原理示意图。
    18.图3为用以说明混合多机器翻译引擎的翻译方法的另一种示意性实施方式的工作流程示意图。
    19.图4为用以说明混合多机器翻译引擎的翻译系统的一种示意性实施方式的结构示意图。
    20.标号说明10
    ꢀꢀ
    原文输入模块20
    ꢀꢀ
    多引擎翻译模块22
    ꢀꢀ
    机器翻译引擎30
    ꢀꢀ
    多特征打分模块32
    ꢀꢀ
    特征打分器40
    ꢀꢀ
    打分计算模块50
    ꢀꢀ
    译文输出模块。
    具体实施方式
    21.为了对发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明
    的具体实施方式,在各图中相同的标号表示结构相同或结构相似但功能相同的部件。
    22.在本文中,“示意性”表示“充当实例、例子或说明”,不应将在本文中被描述为“示意性”的任何图示、实施方式解释为一种更优选的或更具优点的技术方案。
    23.为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,为使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。
    24.图1为用以说明混合多机器翻译引擎的翻译方法的一种示意性实施方式的工作流程示意图。图2为用以说明混合多机器翻译引擎的翻译方法的原理示意图。参照图1和图2,混合多机器翻译引擎的翻译方法包括下列步骤:步骤s10:设置数个机器翻译引擎。参照图2,在示意性实施方式中设置了三个机器翻译引擎,三个机器翻译引擎能够对同一原文翻译并可能得到不同程度的译文,因此可能会存在例如译文漏译、多译、错译、译文术语不一致等问题,并且同样的翻译问题可能会根据原文的不同而出现在不同的机器翻译引擎中。虽然示意性实施方式中仅使用了三个机器翻译引擎,然而并不限于此,机器翻译引擎的数量越多越容易得到更好的译文,然而也会影响翻译的效率,因此机器翻译引擎的数量需要根据实际情况而定。
    25.步骤s20:将句子结构的原文分别输入数个机器翻译引擎以得到译文。以句子为基本翻译单元可以适应更多的机器翻译引擎,并且得到更好的翻译效果。
    26.步骤s30:设置数个特征打分器,数个特征打分器能够基于不同的特征对各译文进行打分。参照图2,在示意性实施方式中包括六个特征打分器,六个特征打分器基于的特征分别为译文长度比例、译文数字一致比例、译文标签一致比例、译文术语一致比例、译文流利度和译文忠实度。通过打分器的打分结果能够表现译文在各特征维度的优劣,特征打分器的数量决定了对译文的分析评价的细致程度,因此可以根据实际需求选择需要的特征打分器。
    27.步骤s40:将数个特征打分器对同一个译文的打分结果在分别乘以不同的权重后求和,得到最终打分。引入不同的权重用于在实际使用场景中调整对特征维度的偏好,权重可以根据实际的使用场景进行人为的调节干涉。
    28.步骤s50:选择最终打分最高的译文作为最终译文。
    29.本发明提供的混合多机器翻译引擎的翻译方法,利用多个机器翻译引擎对原文进行翻译,再通过特征打分器在多个特征维度对译文进行打分,并且将打分结果乘以不同加权后求和得到最终打分,选取最终打分最高的译文作为最终译文。混合多机器翻译引擎的翻译方法能够结合多个翻译引擎中的优势,选取综合评价最好的译文,最大限度的减少了翻译中存在的问题。
    30.图3为用以说明混合多机器翻译引擎的翻译方法的另一种示意性实施方式的工作流程示意图。参照图3,其与图1中的翻译方法相同或相似之处不再赘述,其区别在于翻译方法还包括:步骤s60:将段落结构的原文拆分为数个句子结构的原文。在遇到需要翻译整段的原文时,部分机器翻译引擎并不能直接进行翻译,或翻译效果不好,需要在步骤s20之前将原文拆分为数个句子结构的原文,借此以句为基本翻译单元,以适应多种机器翻译引擎。
    31.步骤s70:按照段落结构的原文中各句子结构的原文的顺序合并各最终译文为段
    落结构的译文。在上述步骤中已经将原文拆分为句子,并分别翻译打分,得到了对应原文中各句子的综合评价最好的译文,最后需要将句子译文按照顺序合并以得到对应原文的段落结构。
    32.本发明还提供了一种混合多机器翻译引擎的翻译系统。图4为用以说明混合多机器翻译引擎的翻译系统的一种示意性实施方式的结构示意图。参照图4,翻译系统包括一个原文输入模块10、一个多引擎翻译模块20、一个多特征打分模块30、一个打分计算模块40以及一个译文输出模块50。
    33.原文输入模块10用于输入原文;多引擎翻译模块20包括数个机器翻译引擎22,各机器翻译引擎22能够从原文输入模块10获取句子结构的原文并翻译为译文;多特征打分模块30包括数个特征打分器32,数个特征打分器32能够基于不同的特征对各译文进行打分;打分计算模块40能够将数个特征打分器32对同一个原文的数个译文的打分结果在分别乘以不同的权重后求和,得到最终打分最高的译文作为最终译文;译文输出模块50能够获取最终译文并输出。
    34.虽然示意性实施方式中多引擎翻译模块20仅包括三个机器翻译引擎22,然而并不限于此,机器翻译引擎的数量越多越容易得到更好的译文,然而也会影响翻译的效率,因此机器翻译引擎22的数量需要根据实际情况而定。
    35.在示意性实施方式中,六个特征打分器32基于的特征包括译文长度比例、译文数字一致比例、译文标签一致比例、译文术语一致比例、译文流利度和译文忠实度。然而并不限于此,在其他示意性实施方式中可以根据实际需求设置需要的特征打分器。
    36.本发明提供的混合多机器翻译引擎的翻译系统,利用多引擎翻译模块20中的三个机器翻译引擎22对原文进行翻译,再通过多特征打分模块30中的六个特征打分器32在多个特征维度对译文进行打分,并且利用打分计算模块40将打分结果乘以不同加权后求和得到最终打分,选取最终打分最高的译文作为最终译文。混合多机器翻译引擎的翻译系统能够结合多个翻译引擎中的优势,选取综合评价最好的译文,最大限度的减少了翻译中存在的问题。
    37.应当理解,虽然本说明书是按照各个实施例描述的,但并非每个实施例仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
    38.上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施例的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方案或变更,如特征的组合、分割或重复,均应包含在本发明的保护范围之内。
    转载请注明原文地址:https://tc.8miu.com/read-1970.html

    最新回复(0)