网页的文本处理方法、装置和计算机程序产品与流程

    专利查询2025-04-16  14


    本申请涉及网络信息处理,具体而言,涉及一种网页的文本处理方法、装置和计算机程序产品。


    背景技术:

    1、在当前的互联网浏览体验中,用户经常需要对网页上的文本内容进行理解和回顾。现有的技术包括基本的文本选择和注释功能,但这些功能通常局限于简单的文本操作,缺乏灵活性和深度交互性,无法满足用户对复杂文本处理和个性化显示需求的增长。


    技术实现思路

    1、本申请的主要目的在于提供一种网页的文本处理方法、装置和计算机程序产品,以至少解决现有技术中无法满足用户对复杂文本处理和个性化显示需求的增长的问题。

    2、为了实现上述目的,根据本申请的一个方面,提供了一种网页的文本处理方法,包括:获取待标亮的关键字;在浏览器的网页中进行遍历,查找所述关键字;在查找到所述关键字的情况下,将所述浏览器的所述网页中的所述关键字标亮显示。

    3、可选地,在浏览器的网页中进行遍历,查找所述关键字之后,所述方法还包括:在查找到所述关键字的情况下,统计在所述浏览器的所述网页中查找到的所述关键字的次数;在第一显示框中显示所述关键字的所述次数,其中,所述第一显示框为所述浏览器的所述网页中的显示框。

    4、可选地,在浏览器的网页中进行遍历,查找所述关键字之后,所述方法还包括:在查找到所述关键字的情况下,获取所述关键字在所述浏览器的所述网页中的位置;在第二显示框中显示所述关键字的所述位置,其中,所述第二显示框为所述浏览器的所述网页中的显示框。

    5、可选地,获取待标亮的关键字,包括:获取声音信息,其中,所述声音信息为通过声音采集器采集得到的;构建第一模型,其中,所述第一模型是使用多组训练数据来通过第一算法训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史声音信息、所述历史声音信息对应的历史关键字,其中,所述第一算法为mfcc算法、keyworddetection算法、nlp算法中的一种或者多种;将所述声音信息输入至所述第一模型,得到所述声音信息对应的所述关键字。

    6、可选地,获取待标亮的关键字,包括:根据眼球追踪技术,获取目标对象的视线聚焦的聚焦位置;获取所述目标对象在所述聚焦位置的注视时间;在所述注视时间大于预设时长的情况下,确定所述聚焦位置处的文字为所述关键字。

    7、可选地,在所述网页中包括文字的情况下,在浏览器的网页中进行遍历,查找所述关键字,包括:构建第二模型,其中,所述第二模型是使用多组训练数据来通过第二算法训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史关键字、所述历史关键字对应的历史第一查询结果,其中,所述第二算法为brute force算法、rabin-karp算法、regular expressions算法中的一种或者多种;将所述关键字输入至所述第二模型,得到所述关键字对应的第一查询结果。

    8、可选地,在所述网页中包括图片的情况下,在浏览器的网页中进行遍历,查找所述关键字,包括:构建第三模型,其中,所述第三模型是使用多组训练数据来通过第三算法训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史关键字、所述历史关键字对应的历史第二查询结果,其中,所述第三算法为ocr算法、boyer-moore算法、kmp算法中的一种或者多种;将所述关键字输入至所述第三模型,得到所述关键字对应的第二查询结果。

    9、可选地,在查找到所述关键字的情况下,将所述浏览器的所述网页中的所述关键字标亮显示,包括:在查找到第一关键字的情况下,将所述网页中的所述第一关键字以第一颜色标亮显示,其中,所述第一关键字为第n次遍历得到的所述关键字,n≥1;在查找到第二关键字的情况下,将所述网页中的所述第二关键字以第二颜色标亮显示,其中,所述第二关键字为第n+1次遍历得到的所述关键字,所述第一颜色和所述第二颜色不同,所述第一颜色的所述第一关键字和所述第二颜色的所述第二关键字可同时显示。

    10、根据本申请的另一方面,提供了一种网页的文本处理装置,包括:第一获取单元,用于获取待标亮的关键字;查找单元,用于在浏览器的网页中进行遍历,查找所述关键字;第一显示单元,用于在查找到所述关键字的情况下,将所述浏览器的所述网页中的所述关键字标亮显示。

    11、根据本申请的再一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现任意一种所述网页的文本处理方法的步骤。

    12、应用本申请的技术方案,如果用户想要查找感兴趣的内容,可以预先输入关键字,这样在网页中快速查找到用户感兴趣的关键字后,对关键字进行标亮显示,对于用户来说更加友好,灵活性和交互性更强,可以满足用户对于在线文本处理和管理的各种需求。



    技术特征:

    1.一种网页的文本处理方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,在浏览器的网页中进行遍历,查找所述关键字之后,所述方法还包括:

    3.根据权利要求1所述的方法,其特征在于,在浏览器的网页中进行遍历,查找所述关键字之后,所述方法还包括:

    4.根据权利要求1所述的方法,其特征在于,获取待标亮的关键字,包括:

    5.根据权利要求1所述的方法,其特征在于,获取待标亮的关键字,包括:

    6.根据权利要求1所述的方法,其特征在于,在所述网页中包括文字的情况下,在浏览器的网页中进行遍历,查找所述关键字,包括:

    7.根据权利要求1所述的方法,其特征在于,在所述网页中包括图片的情况下,在浏览器的网页中进行遍历,查找所述关键字,包括:

    8.根据权利要求1所述的方法,其特征在于,在查找到所述关键字的情况下,将所述浏览器的所述网页中的所述关键字标亮显示,包括:

    9.一种网页的文本处理装置,其特征在于,包括:

    10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任意一项所述网页的文本处理方法的步骤。


    技术总结
    本申请提供了一种网页的文本处理方法、装置和计算机程序产品。该方法包括:获取待标亮的关键字;在浏览器的网页中进行遍历,查找关键字;在查找到关键字的情况下,将浏览器的网页中的关键字标亮显示。该方案解决了现有技术中无法满足用户对复杂文本处理和个性化显示需求的增长的问题。

    技术研发人员:阮志杰
    受保护的技术使用者:广东电网有限责任公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-27578.html

    最新回复(0)