辅助拍摄方法、装置、电子设备和存储介质与流程

专利查询2025-06-17 45

本公开涉及计算机视觉算法，具体涉及摄像，具体涉及一种辅助拍摄方法、装置、电子设备和存储介质。

背景技术：

1、移动摄像设备作为现代科技的重要产物，广泛应用于监控、摄影、直播等多个领域。

2、然而，由于用户并不具备专业摄影知识，用户利用移动摄像设备进行风景、人物、建筑物、工艺品等拍摄主体的拍摄过程中，往往难以拍摄到让自身满意的照片或视频。

技术实现思路

1、本公开提供了一种辅助拍摄方法、装置、电子设备和存储介质，本公开在识别用户拍摄意图的基础上，精准生成用于辅助用户拍摄的拍摄建议信息。

2、根据本公开的第一方面，提供了一种辅助拍摄方法，包括：根据移动摄像设备的预拍摄图像，构建预拍摄图像所示区域的空间三维模型；确定预拍摄图像对应的拍摄意图；基于空间三维模型和拍摄意图，输出针对区域的拍摄建议信息。

3、在一些实施例中，上述根据移动摄像设备的预拍摄图像构建预拍摄图像所示区域的空间三维模型，包括：基于预拍摄图像，确定区域中的物体的局部外观信息和物体间相对位置；基于局部外观信息，构建物体的三维模型；根据三维模型和物体间相对位置，生成空间三维模型。

4、在一些实施例中，上述基于局部外观信息构建物体的三维模型，包括：将局部外观信息输入物品外貌模型中，确定物体的外貌特征；基于外貌特征构建物体的三维模型；其中，物品外貌模型用于表征物体的局部外观信息与全局外貌特征的对应关系。

5、在一些实施例中，上述确定预拍摄图像对应的拍摄意图，包括：对预拍摄图像进行特征提取，得到拍摄特征；将拍摄特征输入意图识别模型中确定拍摄意图，其中，意图识别模型为预先训练的大语言模型。

6、在一些实施例中，上述基于空间三维模型和拍摄意图输出针对区域的拍摄建议信息，包括：基于空间三维模型和多组预设的拍摄信息生成多个初始图像帧，其中，拍摄信息包括拍摄位置、拍摄角度和拍摄参数；基于拍摄意图对多个初始图像帧进行筛选，得到多个候选图像帧；基于多个候选图像帧，输出针对区域的拍摄建议信息。

7、在一些实施例中，上述基于多个候选图像帧输出针对区域的拍摄建议信息，包括：响应于用户拍摄模式为景物拍照，将多个候选图像帧分别输入照片模型确定多个候选图像帧的美学分值，其中，照片模型为多模态协同自注意力神经网络模型；基于美学分值，从多个候选图像帧中选定目标图像帧；输出针对区域的拍摄建议信息，其中，拍摄建议信息包括目标图像帧及其拍摄信息。

8、在一些实施例中，上述基于多个候选图像帧输出针对区域的拍摄建议信息，包括：响应于用户拍摄模式为人物拍照，基于预选的多个虚拟对象和多个候选图像帧确定多个备选图像帧，其中，虚拟对象为人物位姿或搭配方案；将多个备选图像帧分别输入照片模型，确定多个备选图像帧的美学分值；基于多个备选图像帧的美学分值，从多个候选图像帧中选定目标图像帧；输出针对区域的拍摄建议信息，其中，拍摄建议信息包括目标图像帧以及目标图像帧对应的虚拟对象信息和拍摄信息。

9、在一些实施例中，上述基于多个候选图像帧输出针对区域的拍摄建议信息，包括：响应于用户拍摄模式为录像，基于多个候选图像帧生成多个图像帧组合；分别将多个图像帧组合输入视频模型，确定多个图像帧组合的美学分值；基于美学分值，从多个图像帧组合中选定目标图像帧组合；基于目标图像帧组合，生成目标视频；输出针对区域的拍摄建议信息，其中，拍摄建议信息包括目标视频中各帧图像的拍摄信息以及相邻图像帧之间的镜头切换信息和拍摄参数调整信息。

10、在一些实施例中，上述视频模型的构建过程，包括：将视频样本输入基于自注意力机制的深度学习模型，确定视频样本对应的视频描述；基于视频描述，确定视频样本中的主要拍摄物；将视频样本中包含主要拍摄物的视频帧输入照片模型，确定视频帧的美学分值；基于视频帧的美学分值，确定视频样本对应的关键帧；利用视频样本对应的关键帧和美学分值，训练视频模型。

11、根据本公开的第二方面，提供了一种辅助拍摄装置，包括：构建模块，被配置为根据移动摄像设备的预拍摄图像，构建预拍摄图像所示区域的空间三维模型；确定模块，被配置为确定预拍摄图像对应的拍摄意图；输出模块，被配置为基于空间三维模型和拍摄意图，输出针对区域的拍摄建议信息。

12、根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被上述至少一个处理器执行，以使上述至少一个处理器能够执行上述第一方面提供的辅助拍摄方法。

13、根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，上述计算机指令用于使上述计算机执行上述第一方面提供的辅助拍摄方法。

14、根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，上述计算机程序在被处理器执行时实现上述第一方面提供的辅助拍摄方法。

15、本公开提供的辅助拍摄方法、装置、电子设备和存储介质，根据移动摄像设备的预拍摄图像，构建预拍摄图像所示区域的空间三维模型；确定预拍摄图像对应的拍摄意图；基于空间三维模型和拍摄意图，输出针对区域的拍摄建议信息。在理解用户拍摄意图的基础上，根据用户所要拍摄场景的区域三维模型向用户推荐恰当的拍摄建议信息，避免了没有拍摄技术的用户拍摄不出好的照片和视频，有效提升了用户的拍摄信心和拍摄体验度。

16、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种辅助拍摄方法，包括：

2.根据权利要求1所述的方法，其中，所述根据移动摄像设备的预拍摄图像，构建所述预拍摄图像所示区域的空间三维模型，包括：

3.根据权利要求2所述的方法，其中，所述基于所述局部外观信息，构建所述物体的三维模型，包括：

4.根据权利要求1所述的方法，其中，所述确定所述预拍摄图像对应的拍摄意图，包括：

5.根据权利要求1所述的方法，其中，所述基于所述空间三维模型和所述拍摄意图，输出针对所述区域的拍摄建议信息，包括：

6.根据权利要求5所述的方法，其中，所述基于所述多个候选图像帧，输出针对所述区域的拍摄建议信息，包括：

7.根据权利要求5所述的方法，其中，所述基于所述多个候选图像帧，输出针对所述区域的拍摄建议信息，包括：

8.根据权利要求5所述的方法，其中，所述基于所述多个候选图像帧，输出针对所述区域的拍摄建议信息，包括：

9.根据权利要求8所述的方法，其中，所述视频模型的构建过程，包括：

10.一种辅助拍摄装置，包括：

11.一种电子设备，包括：

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。

13.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现权利要求1-10中任一项所述的方法。

技术总结
本公开提供了一种辅助拍摄方法、装置、电子设备和存储介质，涉及计算机视觉算法技术领域，尤其涉及摄像技术领域。具体实现方案为：根据移动摄像设备的预拍摄图像，构建预拍摄图像所示区域的空间三维模型；确定预拍摄图像对应的拍摄意图；基于空间三维模型和拍摄意图，输出针对区域的拍摄建议信息。本公开在识别用户拍摄意图的基础上，精准生成用于辅助用户拍摄的拍摄建议信息。

技术研发人员：黄耀
受保护的技术使用者：三星电子（中国）研发中心
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-29514.html

专利

最新回复(0)