一种数据抽样方法、装置、电子设备及存储介质与流程

    专利查询2025-04-15  30


    本申请涉及数据处理,尤其涉及一种数据抽样方法、装置、电子设备及存储介质。


    背景技术:

    1、随着信息时代的到来,各行各业产生的数据量急剧增加,导致需要处理的数据也越来越多。

    2、示例性的,在地图应用中,例如,当用户在地图上进行缩放、平移或其他操作时,需要加载的数据量会非常大,这导致渲染速度变慢,无法实现流畅的地图操作。

    3、鉴于此,如何加载合理的数据量这是目前亟需解决的问题。


    技术实现思路

    1、本申请提供了一种数据抽样方法、装置、电子设备及存储介质,用以实现加载合理的数据量。

    2、第一方面,提供一种数据抽样方法,包括:

    3、将目标区域划分成高密度区域与低密度区域;

    4、从所述高密度区域中的低层级范围内抽取第一数据,以及从所述低密度区域中的低层级范围内抽取第二数据;

    5、从所述高密度区域中的中层级范围内抽取第三数据,以及从所述低密度区域中的中层级范围内抽取第四数据;

    6、采用滑动窗口算法,预测所述高密度区域中位于高层级范围内的第五数据,以及预测所述低密度区域中位于高层级范围内的第六数据;

    7、输出所述第一数据、所述第二数据、所述第三数据、所述第四数据、所述第五数据、所述第六数据。

    8、可选的,所述从所述高密度区域中的低层级范围内抽取第一数据,以及从所述低密度区域中的低层级范围内抽取第二数据,包括:

    9、识别所述高密度区域中位于低层级范围内的n个第一核心区域,以及识别所述低密度区域中位于低层级范围内的m个第二核心区域;其中,所述n和m均为大于0的整数;

    10、计算所述n个第一核心区域各自的第一权重,以及计算所述m个第二核心区域各自的第二权重;

    11、按照第一比例和所述n个第一核心区域各自的第一权重,分别从所述n个第一核心区域中抽取出第一数据,以及按照第二比例和所述m个第二核心区域各自的第二权重,分别从所述m个第二区域中抽取第二数据;其中,所述第一比例小于所述第二比例。

    12、可选的,所述从所述高密度区域中的中层级范围内抽取第三数据,以及从所述低密度区域中的中层级范围内抽取第四数据,包括:

    13、对所述高密度区域中位于中层级范围内的第一层级进行权重赋值,得到所述第一层级的第三权重;其中,所述第一层级为所述高密度区域中位于中层级范围内的任一层级;

    14、对所述低密度区域中位于中层级范围内的第二层级进行权重赋值,得到所述第二层级的第四权重;其中,所述第二层级为所述低密度区域中位于中层级范围内的任一层级;

    15、按照第三比例和所述第一层级的第三权重,从所述第一层级中抽取第三数据,以及按照第四比例和所述第二层级的第四权重,从所述第二层级中抽取第四数据;其中,所述第三比例小于所述第四比例。

    16、可选的,所述采用滑动窗口算法,预测所述高密度区域中位于高层级范围内的第五数据,以及预测所述低密度区域中位于高层级范围内的第六数据,包括:

    17、将所述高密度区域中位于高层级范围内包含的数据按照第一设定窗口进行滑动,依次预测所述高密度区域中位于高层级范围内的第五数据;

    18、将所述低密度区域中位于高层级范围内包含的数据按照第二设定窗口进行滑动,依次预测所述低密度区域中位于高层级范围的第六数据。

    19、可选的,所述将目标区域划分成高密度区域与低密度区域,包括:

    20、将所述目标区域划分成g个网格;

    21、计算所述g个网格中各自的数据密度;

    22、若所述g个网格中第一网格的数据密度大于设定阈值,则将所述第一网格划分成高密度区域;否则,将所述第一网格划分成低密度区域。

    23、可选的,所述将目标区域中划分成高密度区域与低密度区域之前,还包括:

    24、对包含有数据的原始地图行分割,得到多个区域;

    25、当接收目标对象发送的携带有标识信息的数据加载请求时,从所述多个区域中获取与所述标识信息相关联的目标候选区域;

    26、基于目标对象的历史操作地图行为,以及当前的操作地图行为,从目标候选区域中确定所述目标区域。

    27、可选的,所述输出所述第一数据、所述第二数据、所述第三数据、所述第四数据、所述第五数据、所述第六数据之后,还包括:

    28、根据所述第一数据、所述第二数据、所述第三数据、所述第四数据、所述第五数据、所述第六数据,构成目标对象的加载数据集,并将所述加载数据集进行缓存。

    29、第二方面,提供一种数据抽样装置,包括:

    30、区域划分模块,用于将目标区域划分成高密度区域与低密度区域;

    31、第一抽样模块,用于采用聚类算法,从所述高密度区域中抽取第一数据,以及从所述低密度区域中抽取第二数据;

    32、第二抽样模块,用于采用分层抽样算法,从所述高密度区域中抽取第三数据,以及从所述低密度区域中抽取第四数据;

    33、第三抽样模块,用于采用滑动窗口算法,预测所述高密度区域的第五数据,以及预测所述低密度区域中的第六数据;

    34、输出模块,用于输出所述第一数据、所述第二数据、所述第三数据、所述第四数据、所述第五数据、所述第六数据。

    35、第三方面,提供一种电子设备,包括:

    36、存储器,用于存放计算机程序;处理器,用于执行所述存储器上所存放的计算机程序时,实现第一方面中任一项所述的方法。

    37、第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法。

    38、本申请实施例中,首先将目标区域划分成高密度区域与低密度区域;然后,从高密度区域中的低层级范围内抽取第一数据,以及从低密度区域中的低层级范围内抽取第二数据;再从高密度区域中的中层级范围内抽取第三数据,以及从低密度区域中的中层级范围内抽取第四数据;其次,还采用滑动窗口算法,预测高密度区域中位于高层级范围内的第五数据,以及预测低密度区域中位于高层级范围内的第六数据;最后,输出第一数据、第二数据、第三数据、第四数据、第五数据、第六数据;上述这种方式,在加载地图数据时,进行分层高效抽样,在显著减少加载数据量的同时,也确保不同层级的数据均有合理的代表性,以使后续达到高效加载渲染各类数据的目的。

    39、上述第二方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。



    技术特征:

    1.一种数据抽样方法,其特征在于,所述方法包括:

    2.如权利要求1所述的方法,其特征在于,所述从所述高密度区域中的低层级范围内抽取第一数据,以及从所述低密度区域中的低层级范围内抽取第二数据,包括:

    3.如权利要求1所述的方法,其特征在于,所述从所述高密度区域中的中层级范围内抽取第三数据,以及从所述低密度区域中的中层级范围内抽取第四数据,包括:

    4.如权利要求1所述的方法,其特征在于,所述采用滑动窗口算法,预测所述高密度区域中位于高层级范围内的第五数据,以及预测所述低密度区域中位于高层级范围内的第六数据,包括:

    5.如权利要求1所述的方法,其特征在于,所述将目标区域划分成高密度区域与低密度区域,包括:

    6.如权利要求1所述的方法,其特征在于,所述将目标区域中划分成高密度区域与低密度区域之前,还包括:

    7.如权利要求1所述的方法,其特征在于,所述输出所述第一数据、所述第二数据、所述第三数据、所述第四数据、所述第五数据、所述第六数据之后,还包括:

    8.一种数据抽样装置,其特征在于,包括:

    9.一种电子设备,其特征在于,包括:

    10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。


    技术总结
    本申请公开了一种数据抽样方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:将目标区域划分成高密度区域与低密度区域;从所述高密度区域中的低层级范围内抽取第一数据,以及从所述低密度区域中的低层级范围内抽取第二数据;从所述高密度区域中的中层级范围内抽取第三数据,以及从所述低密度区域中的中层级范围内抽取第四数据;采用滑动窗口算法,预测所述高密度区域中位于高层级范围内的第五数据,以及预测所述低密度区域中位于高层级范围内的第六数据;输出所述第一数据、所述第二数据、所述第三数据、所述第四数据、所述第五数据、所述第六数据,用以实现加载合理的数据量。

    技术研发人员:施冠臣,石岩,吴世界,姜屹然,张静普
    受保护的技术使用者:四维世景科技(北京)有限公司
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-27547.html

    最新回复(0)