一种图像特征信息提取处理方法及装置与流程

    专利查询2025-12-29  10


    本发明属于图像处理,具体涉及一种图像特征信息提取处理方法及装置。


    背景技术:

    1、近年来,随着信息技术的飞速发展,数字化转型成为各行各业追求的目标。特别是在财务管理领域,传统的手工处理发票和商票的方式已经无法满足现代企业高效运作的需求。这类纸质文档处理工作量大、效率低下,容易出错,且难以实现数据的即时分析与共享。因此,自动化处理发票和商票成为了提高财务管理效率的关键环节。光学字符识别(ocr)技术的广泛应用为这一转型提供了技术支撑,但传统ocr技术在面对复杂背景、低质量图像以及多样化的文档格式时,往往表现出识别率低、信息提取不准确的问题。

    2、现有技术在处理发票和商票图像时,面临着图像质量参差不齐、关键信息区域定位不准确、信息提取后的验证与修正机制不健全等问题。特别是在信息密集、格式多变的财务文档中,单纯依赖ocr技术难以达到高精度的信息提取和处理效果,这导致了信息处理效率低下,错误率偏高,增加了人工审核与修正的负担。


    技术实现思路

    1、本发明的目的在于提供一种图像特征信息提取处理方法及装置,显著提高了发票和商票信息处理的自动化水平,减少了人工介入的频率,大幅度提升了处理速度和准确性,降低了错误率和运营成本,以解决上述背景技术中提出现有技术中的问题。

    2、为实现上述目的,本发明一方面提出一种图像特征信息提取处理方法,包括以下步骤:

    3、步骤一:接收不同来源的发票或商票图像,根据图像的特征进行初步分类,区分不同类型的票据;

    4、步骤二:对分类后的图像实施深度去噪处理,接着进行自适应二值化处理,依据图像局部对比度动态调整阈值,优化文字与背景的区分度,然后分割图像的关键信息区域;

    5、步骤三:在分割后的关键信息区域内,执行对文字信息进行提取和识别图形标志的操作,获取文本信息;

    6、步骤四:对提取的文本信息进行语义理解和结构化处理,解析出发票或商票的关键字段,结合图像中的文字、图形与结构信息,通过多模态融合算法,交叉验证提取的信息;

    7、步骤五:对金额的合理性校验、日期的有效性检查以及发票代码与号码的合法性验证,针对验证过程中发现的错误或不确定信息,提供用户界面进行交互式修正,允许人工介入核实并更正,确定最终数据;

    8、步骤六:将处理后的最终数据以标准化格式输出,支持多种接口对接企业财务系统,同时,原始图像、处理过程记录及最终识别结果统一存储于安全数据库中。

    9、所述深度去噪处理中,采用基于深度学习的卷积神经网络对图像进行去噪,网络经过预训练以识别并去除图像中的斑点、条纹和其他非结构化噪声。

    10、所述自适应二值化处理中,结合模糊c均值聚类算法与局部阈值法,对图像不同区域分别计算最优二值化阈值,包括:将去噪后的图像分割成多个小块或像素区域,每个区域大小根据图像分辨率和内容复杂度预先设定;在每个分割的图像块内,应用模糊c均值聚类算法计算像素之间的相似度,将像素点软分类到不同的类别中,每个类别代表一个可能的色调范围;对于每个分割块,基于模糊c均值聚类的结果,计算每个类别的像素强度分布,为每个块确定一个最佳的二值化阈值,根据计算出的局部阈值,对每个分割块单独执行二值化处理;将所有经过局部二值化处理的图像块重新合并为完整的图像。

    11、所述分割图像的关键信息区域步骤中,使用基于深度学习的实例分割技术,识别并标记发票或商票中的关键区域。

    12、所述对文字信息进行提取和识别图形标志的操作中,集成深度ocr模型,用于识别文字、图形标志。

    13、所述语义理解和结构化处理步骤中,包括:信息提取与初步清洗:收集从ocr识别和图形标志解码获得的文本信息;实体识别与标注:识别文本中的关键实体;知识图谱匹配与链接:利用预构建的财务领域知识图谱,对识别出的实体进行匹配和链接,通过实体链接技术,将提取的文本信息与图谱中的概念相连;语义解析与关系构建:进行深入的语义解析,理解文本中隐含的语义关系,解析句子成分,明确主谓宾关系,构建出结构化数据框架;结构化数据生成与验证:根据解析结果,将发票或商票的信息转化为结构化的数据格式,每一项关键信息都有对应的标签和值,进行数据验证,确保结构化数据的逻辑一致性。

    14、所述多模态融合算法中,通过集成视觉和文本特征的联合学习模型,对文字、图形和结构信息进行综合分析,利用注意力机制聚焦于关键信息。

    15、在信息验证与修正的中,建立一个智能推荐系统,当发现信息有误时,根据历史数据和上下文信息,向用户提供可能的正确选项。

    16、在结果输出与存储步骤中,在输出至企业财务系统或存储至数据库的过程中采用数据加密传输协议。

    17、另一方面,本发明提出一种图像特征信息提取处理装置,包括:

    18、图像预处理模块,用于接收不同来源的发票或商票图像,根据图像的特征进行初步分类,区分不同类型的票据;

    19、图像分类模块,用于对分类后的图像实施深度去噪处理,接着进行自适应二值化处理,依据图像局部对比度动态调整阈值,优化文字与背景的区分度,然后分割图像的关键信息区域;

    20、图像特征提取模块,用于在分割后的关键信息区域内,执行对文字信息进行提取和识别图形标志的操作,获取文本信息;

    21、信息识别与解析模块,用于对提取的文本信息进行语义理解和结构化处理,解析出发票或商票的关键字段,结合图像中的文字、图形与结构信息,通过多模态融合算法,交叉验证提取的信息;

    22、信息验证与修正模块,用于对金额的合理性校验、日期的有效性检查以及发票代码与号码的合法性验证,针对验证过程中发现的错误或不确定信息,提供用户界面进行交互式修正,允许人工介入核实并更正,确定最终数据;

    23、结果输出与存储模块,用于将处理后的最终数据以标准化格式输出,支持多种接口对接企业财务系统,同时,原始图像、处理过程记录及最终识别结果统一存储于安全数据库中。

    24、本发明的技术效果和优点:本发明提出的一种图像特征信息提取处理方法及装置,与现有技术相比,具有以下优点:

    25、本发明可以实现对发票和商票图像的高效、精准处理,不仅能够自动分类和预处理图像,提高文字与背景的区分度,还能精确提取和识别关键信息,包括文字信息和图形标志,通过语义理解和结构化处理,结合多模态融合算法,提升了信息提取的准确性和完整性,同时引入了智能校验和用户交互修正机制,确保了信息的正确性。最终,标准化输出的数据可以直接对接企业财务系统,且所有的处理记录与原始图像被安全存储,为企业的财务管理和审计提供了强大的支持。显著提高了发票和商票信息处理的自动化水平,减少了人工介入的频率,大幅度提升了处理速度和准确性,降低了错误率和运营成本。



    技术特征:

    1.一种图像特征信息提取处理方法,其特征在于,包括以下步骤:

    2.根据权利要求1所述的一种图像特征信息提取处理方法,其特征在于:所述深度去噪处理中,采用基于深度学习的卷积神经网络对图像进行去噪,网络经过预训练以识别并去除图像中的斑点、条纹和其他非结构化噪声。

    3.根据权利要求2所述的一种图像特征信息提取处理方法,其特征在于:所述自适应二值化处理中,结合模糊c均值聚类算法与局部阈值法,对图像不同区域分别计算最优二值化阈值,包括:

    4.根据权利要求3所述的一种图像特征信息提取处理方法,其特征在于:所述分割图像的关键信息区域步骤中,使用基于深度学习的实例分割技术,识别并标记发票或商票中的关键区域。

    5.根据权利要求4所述的一种图像特征信息提取处理方法,其特征在于:所述对文字信息进行提取和识别图形标志的操作中,集成深度ocr模型,用于识别文字、图形标志。

    6.根据权利要求5所述的一种图像特征信息提取处理方法,其特征在于:所述语义理解和结构化处理步骤中,包括:

    7.根据权利要求6所述的一种图像特征信息提取处理方法,其特征在于:所述多模态融合算法中,通过集成视觉和文本特征的联合学习模型,对文字、图形和结构信息进行综合分析,利用注意力机制聚焦于关键信息。

    8.根据权利要求1所述的一种图像特征信息提取处理方法,其特征在于:在信息验证与修正的中,建立一个智能推荐系统,当发现信息有误时,根据历史数据和上下文信息,向用户提供可能的正确选项。

    9.根据权利要求1所述的一种图像特征信息提取处理方法,其特征在于:在结果输出与存储步骤中,在输出至企业财务系统或存储至数据库的过程中采用数据加密传输协议。

    10.一种图像特征信息提取处理装置,其特征在于,包括:


    技术总结
    本发明公开了一种图像特征信息提取处理方法及装置,本发明可以实现对发票和商票图像的高效、精准处理,不仅能够自动分类和预处理图像,提高文字与背景的区分度,还能精确提取和识别关键信息,包括文字信息和图形标志,通过语义理解和结构化处理,结合多模态融合算法,提升了信息提取的准确性和完整性,同时引入了智能校验和用户交互修正机制,确保了信息的正确性。最终,标准化输出的数据可以直接对接企业财务系统,且所有的处理记录与原始图像被安全存储,为企业的财务管理和审计提供了强大的支持。显著提高了发票和商票信息处理的自动化水平,减少了人工介入的频率,大幅度提升了处理速度和准确性,降低了错误率和运营成本。

    技术研发人员:闫志雨,刘婷婷,王兆晨
    受保护的技术使用者:乐享数科有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-33235.html

    最新回复(0)