一种根据单帧输入图像的手部图像生成方法、装置和存储介质

    专利查询2025-04-21  21


    本发明涉及计算机视觉,尤其是一种根据单帧输入图像的手部图像生成方法、装置和存储介质。


    背景技术:

    1、3d重建和可微渲染技术的最新进展极大地改善了3d手模型的创建和相关应用。然而,从一张图像中创建可交互的手的虚拟模型仍然具有挑战性。有限的输入视图不能为精确的重建提供足够的几何和纹理信息。此外,手内部和手之间的相互作用加剧了信息丢失并引入了复杂的几何变形。为了解决这些问题,早期的方法依赖于手部参数几何模型(例如mano)来进行几何建模,并利用uv图,顶点颜色或图像空间渲染来进行外观建模。虽然这些方法的渲染效率很高,但由于粗糙的网格分辨率和简单的手部外观和几何形状的结合,这些方法无法达到逼真的渲染效果。


    技术实现思路

    1、针对目前的汽车技术中,电池管理系统容易过早处于休眠状态从而使得动力电池失去保护等技术问题,本发明的目的在于提供一种根据单帧输入图像的手部图像生成方法、装置和存储介质。

    2、一方面,本发明实施例包括一种根据单帧输入图像的手部图像生成方法,所述根据单帧输入图像的手部图像生成方法包括以下步骤:

    3、获取输入图像和目标手部姿势;

    4、对所述输入图像进行处理,获得第一手部身份特征图;

    5、对所述目标手部姿势进行手部几何重建,获得第一手部几何模型;

    6、对所述第一手部身份特征图和所述第一手部几何模型进行处理,获得手部特征图;

    7、对所述手部特征图进行处理,获得第一手部特征向量;

    8、检测所述第一手部几何模型中的交互区域;

    9、对所述第一手部特征向量中与所述交互区域对应的部分进行优化,获得第二手部特征向量;

    10、根据所述第二手部特征向量对所述第一手部几何模型进行优化,获得第二手部几何模型;

    11、根据所述第二手部特征向量与所述第二手部几何模型进行渲染获得手部渲染结果;所述手部渲染结果作为手部图像。

    12、进一步地,所述对所述输入图像进行处理,获得第一手部身份特征图,包括:

    13、建立二维卷积映射网络;

    14、将所述输入图像输入到所述二维卷积映射网络进行处理;

    15、获取所述二维卷积映射网络的输出结果作为所述第一手部身份特征图。

    16、进一步地,所述对所述第一手部身份特征图和所述第一手部几何模型进行处理,获得手部特征图,包括:

    17、建立身份特征编码网络、几何特征编码网络和特征解码网络;

    18、使用所述身份特征编码网络对所述第一手部身份特征图进行编码,获得手部外观信息;

    19、使用所述几何特征编码网络对所述第一手部几何模型进行编码,获得手部几何信息;

    20、使用所述特征解码网络对所述手部外观信息进行解码,获得神经纹理图;

    21、使用所述特征解码网络对所述手部几何信息进行解码,获得几何特征图;

    22、对所述神经纹理图和所述几何特征图进行合并,获得所述手部特征图。

    23、进一步地,所述对所述手部特征图进行处理,获得第一手部特征向量,包括:

    24、根据所述目标手部姿势,获取手部几何表面点;

    25、对所述手部特征图和所述手部几何表面点进行双线性插值,获得所述第一手部特征向量。

    26、进一步地,所述检测所述第一手部几何模型中的交互区域,包括:

    27、获取与所述第一手部几何模型对应的无交互手部几何模型;

    28、计算所述第一手部几何模型与所述无交互手部几何模型之间的临近点差异;

    29、设定差异阈值;

    30、将所述第一手部几何模型中对应所述临近点差异大于所述差异阈值的区域,确定为所述交互区域。

    31、进一步地,所述对所述第一手部特征向量中与所述交互区域对应的部分进行优化,获得第二手部特征向量,包括:

    32、建立自注意力网络层;

    33、将所述第一手部特征向量中与所述交互区域对应的部分输入到所述自注意力网络层进行处理;

    34、获取所述自注意力网络层的输出结果作为所述第二手部特征向量。

    35、进一步地,所述根据所述第二手部特征向量对所述第一手部几何模型进行优化,获得第二手部几何模型,包括:

    36、建立线性预测层;

    37、将所述第一手部几何模型与所述第二手部特征向量输入到所述线性预测层进行处理;

    38、获取所述线性预测层的输出结果;

    39、根据所述线性预测层的输出结果,确定所述第一手部几何模型中的顶点有效性;

    40、设定有效性阈值;

    41、对所述第一手部几何模型中对应的所述顶点有效性小于所述有效性阈值的顶点进行去除,对所述第一手部几何模型中对应的所述顶点有效性大于所述有效性阈值的位置增加顶点,获得所述第二手部几何模型。

    42、进一步地,所述根据所述第二手部特征向量与所述第二手部几何模型进行渲染获得手部渲染结果,包括:

    43、对所述第二手部特征向量与所述第二手部几何模型进行解码,获得渲染属性信息;

    44、根据所述渲染属性信息进行高斯溅射渲染,获得所述手部渲染结果。

    45、另一方面,本发明实施例还包括一种计算机装置,包括存储器和处理器,存储器用于存储至少一个程序,处理器用于加载至少一个程序以执行实施例中的根据单帧输入图像的手部图像生成方法。

    46、另一方面,本发明实施例还包括一种计算机可读存储介质,其中存储有处理器可执行的程序,处理器可执行的程序在由处理器执行时用于执行实施例中的根据单帧输入图像的手部图像生成方法。

    47、本发明的有益效果是:通过实施例中的根据单帧输入图像的手部图像生成方法,更好地利用了基于数据的手部先验,并且加强了手部交互区域的重建效果,易于动画和快速预测,所生成的手部渲染结果即手部图像是高质量的手部360度视图,并能够驱动手部360度视图,对于不同的输入图像能够保持手部渲染结果的手势与目标手部姿势一致,能够加强手部交互区域的重建效果,提高手内和手间交互区域的图像渲染质量,克服了现有手部重建方法的局限性。



    技术特征:

    1.一种根据单帧输入图像的手部图像生成方法,其特征在于,所述根据单帧输入图像的手部图像生成方法包括:

    2.根据权利要求1所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述对所述输入图像进行处理,获得第一手部身份特征图,包括:

    3.根据权利要求2所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述对所述第一手部身份特征图和所述第一手部几何模型进行处理,获得手部特征图,包括:

    4.根据权利要求1所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述对所述手部特征图进行处理,获得第一手部特征向量,包括:

    5.根据权利要求1所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述检测所述第一手部几何模型中的交互区域,包括:

    6.根据权利要求1所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述对所述第一手部特征向量中与所述交互区域对应的部分进行优化,获得第二手部特征向量,包括:

    7.根据权利要求1所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述根据所述第二手部特征向量对所述第一手部几何模型进行优化,获得第二手部几何模型,包括:

    8.根据权利要求1-7任一项所述的根据单帧输入图像的手部图像生成方法,其特征在于,所述根据所述第二手部特征向量与所述第二手部几何模型进行渲染获得手部渲染结果,包括:

    9.一种计算机装置,其特征在于,包括存储器和处理器,存储器用于存储至少一个程序,处理器用于加载至少一个程序以执行权利要求1-8任一项所述的根据单帧输入图像的手部图像生成方法。

    10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,处理器可执行的程序在由处理器执行时用于执行权利要求1-8任一项所述的根据单帧输入图像的手部图像生成方法。


    技术总结
    本发明公开了一种根据单帧输入图像的手部图像生成方法、装置和存储介质,手部图像生成方法包括对输入图像进行处理获得第一手部身份特征图,对目标手部姿势进行手部几何重建获得第一手部几何模型,对第一手部身份特征图和第一手部几何模型进行处理获得手部特征图,对手部特征图进行处理和优化获得第二手部特征向量,对第一手部几何模型进行优化获得第二手部几何模型,根据第二手部特征向量与第二手部几何模型进行渲染获得手部渲染结果等步骤。本发明能够更好地利用了基于数据的手部先验,并且加强了手部交互区域的重建效果,提高手内和手间交互区域的图像渲染质量,克服了现有手部重建方法的局限性。本发明广泛应用于计算机视觉技术领域。

    技术研发人员:高陈强,黄璇
    受保护的技术使用者:中山大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-27764.html

    最新回复(0)