显示设备及基于大模型的图像定制方法与流程

专利查询2025-06-21 60

本申请涉及显示设备，尤其涉及一种显示设备及基于大模型的图像定制方法。

背景技术：

1、显示设备是一种能够显示图像信息的终端设备，通过显示设备的文本分词技术和图像生成技术，可以实现用户与显示设备的交互。例如：用户输入“请生成卡通女孩的图像”的文本信息，显示设备利用文生图模型将用户输入的文本描述转化为相应的图像信息，进而可以根据用户需求定制不同风格的图像。

2、但由于文生图模型在理解用户语义方面存在局限，导致生成的图像与用户的期望存在偏差。并且当用户通过输入描述性文字来调整图像特征时，文生图模型输出的调整图像不准确，影响用户体验。

技术实现思路

1、本申请一些实施例中提供一种显示设备及基于大模型的图像定制方法，以解决文生图模型生成的图像准确率低的问题。

2、第一方面，本申请一些实施例提供一种显示设备，包括：显示器和控制器。所述显示器被配置为显示用户界面，所述控制器被配置为执行以下步骤：

3、响应于用户输入的图像生成指令，将所述图像生成指令对应的图像描述文本输入至文生图模型，以获得第一图像，所述图像生成指令包括用于生成图像的描述文本，所述文生图模型为将描述文本转化为相应图像的深度学习模型；

4、获取所述图像生成指令关联的定制信息；

5、将所述定制信息输入至意图识别模型，以获得定制特征集合，所述意图识别模型为对所述定制信息执行意图分析的深度学习模型，所述定制特征集合包括对所述第一图像执行定制化调整的定制特征参数；

6、将所述第一图像和所述定制特征集合输入至图层处理模型，以获得定制图层集合，所述图层处理模型为基于所述定制特征集合对所述第一图像执行图层分隔的深度学习模型，所述定制图层集合用于表征所述定制特征参数在所述第一图像中对应像素所在分层的集合；

7、基于所述定制特征集合对所述定制图层集合执行像素重置，以生成重置图层集合；

8、对所述第一图像和所述重置图层集合执行图像融合，以生成定制图像。

9、第二方面，本申请一些实施例还提供一种基于大模型的图像定制方法，应用于第一方面所述的显示设备，所述显示设备包括显示器和控制器，所述方法包括：

10、响应于用户输入的图像生成指令，将所述图像生成指令对应的图像描述文本输入至文生图模型，以获得第一图像，所述图像生成指令包括用于生成图像的描述文本，所述文生图模型为将描述文本转化为相应图像的深度学习模型；

11、获取所述图像生成指令关联的定制信息；

12、将所述定制信息输入至意图识别模型，以获得定制特征集合，所述意图识别模型为对所述定制信息执行意图分析的深度学习模型，所述定制特征集合包括对所述第一图像执行定制化调整的定制特征参数；

13、将所述第一图像和所述定制特征集合输入至图层处理模型，以获得定制图层集合，所述图层处理模型为基于所述定制特征集合对所述第一图像执行图层分隔的深度学习模型，所述定制图层集合用于表征所述定制特征参数在所述第一图像中对应像素所在分层的集合；

14、基于所述定制特征集合对所述定制图层集合执行像素重置，以生成重置图层集合；

15、对所述第一图像和所述重置图层集合执行图像融合，以生成定制图像。

16、由以上技术方案可知，本申请一些实施例提供一种显示设备及基于大模型的图像定制方法，所述方法可以响应于用户输入的图像生成指令，将图像生成指令对应的图像描述文本输入至文生图模型，以获得第一图像，其中，图像生成指令包括用于生成图像的描述文本，文生图模型为将描述文本转化为相应图像的深度学习模型；并获取图像生成指令关联的定制信息，将定制信息输入至意图识别模型，以获得定制特征集合，意图识别模型为对定制信息执行意图分析的深度学习模型，定制特征集合包括对第一图像执行定制化调整的定制特征参数；以及将第一图像和定制特征集合输入至图层处理模型，以获得定制图层集合，图层处理模型为基于定制特征集合对第一图像执行图层分隔的深度学习模型，定制图层集合用于表征定制特征参数在第一图像中对应像素所在分层的集合；以及基于定制特征集合对定制图层集合执行像素重置，以生成重置图层集合；对第一图像和重置图层集合执行图像融合，以生成定制图像。所述方法可以根据用户输入的生成图像的描述文本生成第一图像，并利用大模型基于定制信息对第一图像执行图层分隔和调整，以提高定制图像的准确率。

技术特征：

1.一种显示设备，其特征在于，包括：

2.根据权利要求1所述的显示设备，其特征在于，所述控制器执行将所述图像生成指令对应的图像描述文本输入至文生图模型，以获得第一图像之后，还被配置为：

3.根据权利要求1所述的显示设备，其特征在于，所述控制器执行将所述定制信息输入至意图识别模型，以获得定制特征集合，具体被配置为：

4.根据权利要求1所述的显示设备，其特征在于，所述控制器执行将所述第一图像和所述定制特征集合输入至图层处理模型，以获得定制图层集合之前，还被配置为：

5.根据权利要求1所述的显示设备，其特征在于，所述控制器执行将所述第一图像和所述定制特征集合输入至图层处理模型，以获得定制图层集合，具体被配置为：

6.根据权利要求5所述的显示设备，其特征在于，所述控制器执行基于所述标记像素点对所述第一图像执行图层分隔，以获得定制图层，具体被配置为：

7.根据权利要求1所述的显示设备，其特征在于，所述控制器执行基于所述定制特征集合对所述定制图层集合执行像素重置，以生成重置图层集合，具体被配置为：

8.根据权利要求1所述的显示设备，其特征在于，所述控制器执行对所述第一图像和所述重置图层集合执行图像融合，以生成定制图像，具体被配置为：

9.根据权利要求8所述的显示设备，其特征在于，所述控制器执行根据所述像素融合权重对所述第一图像的像素和所述重置图层的像素执行加权融合，以生成定制图像，具体被配置为：

10.一种基于大模型的图像定制方法，其特征在于，应用于权利要求1-9任一项所述的显示设备，所述方法包括：

技术总结
本申请一些实施例提供一种显示设备及基于大模型的图像定制方法，所述方法响应于用户输入的图像生成指令，将图像生成指令对应的图像描述文本输入至文生图模型，以获得第一图像；并获取图像生成指令关联的定制信息，将定制信息输入至意图识别模型，以获得定制特征集合；再将第一图像和定制特征集合输入至图层处理模型，以获得定制图层集合；以及基于定制特征集合对定制图层集合执行像素重置，以生成重置图层集合；并对第一图像和重置图层集合执行图像融合，以生成定制图像。所述方法可以根据用户输入的生成图像描述文本生成第一图像，并利用大模型基于定制信息对第一图像执行图层分隔和调整，以提高定制图像的准确率。

技术研发人员：方依云,巨荣辉
受保护的技术使用者：海信电子科技（武汉）有限公司
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-29646.html

专利

最新回复(0)