基于结构引导扩散模型的牙齿正畸结果预测方法、装置及计算机可读存储介质

专利查询2026-05-15 6

本发明涉及计算机，尤其涉及一种基于扩散模型的牙齿正畸结果预测方法。

背景技术：

1、牙齿正畸治疗是口腔医学中一项常见的治疗方式，主要用于矫正牙齿和颌骨的不正常位置，改善咬合关系和美观。传统的牙齿正畸治疗依赖于正畸专家的经验进行牙齿移动的规划，但此过程不仅耗时长，且难以精确预测治疗结果。

2、近年来，随着计算机技术的发展，数字化正畸技术得到了广泛的应用。这些技术通常包括三维牙齿扫描、计算机辅助设计(cad)和计算机辅助制造(cam)，它们显著提高了治疗的效率和精度。然而，现有的数字化正畸技术主要依赖于复杂的物理模拟和机械模型，这些模型往往需要大量的计算资源，并且对牙齿移动的动态过程预测不够精确。扩散模型，在多个科学领域中被用来描述事物从高浓度区域向低浓度区域的自然扩散过程。在牙齿正畸的应用中，扩散模型可用于模拟牙齿在牙槽骨中的移动过程。该模型可以基于牙齿和周围组织的物理和生物力学特性来调整，从而更准确地预测牙齿在正畸治疗过程中的移动轨迹和最终位置。

技术实现思路

1、本发明的目的在于针对现有技术的不足，提供一种基于扩散模型的牙齿正畸结果预测方法。

2、本发明的目的是通过以下技术方案来实现的：

3、一种基于结构引导扩散模型的牙齿正畸结果预测方法，包括以下步骤：

4、s1，获取当前阶段患者的2d露齿人脸彩色图像以及对应灰度图像；

5、s2，基于所述2d露齿人脸彩色图像以及对应灰度图像训练结构引导去噪模型，实现对带噪图像的去噪；

6、s3，使用噪声预测网络结合带噪彩色图像、去噪后灰度图像以及中间特征提高去噪效果，生成高质量、语义一致的去噪图像；

7、s4，利用结构引导扩散模型对最终噪声进行去噪，即可得到当前输入图像正畸后的人脸彩色图像。

8、进一步的，步骤s2包括以下子步骤：

9、s2.1，构建基于2d露齿人脸灰度图像的稀疏结构分支，具体为：通过对每张2d露齿人脸灰度图像进行随机遮挡并添加噪声，生成被遮挡并添加噪声的边缘图像；带噪灰度图像xt作为当前时间步的输入，通过结构去噪网络∈φ(xt，t)得到预测噪声dxt，最后将带噪灰度图像xt减去预测噪声dxt得到的去噪结果xt-1，作为密集纹理分支的指导信息；

10、s2.2，构建基于2d露齿人脸彩色图像的密集纹理分支，具体为：通过对每张2d露齿人脸彩色图像进行随机遮挡并添加噪声，生成被遮挡并添加噪声的彩色图像；带噪彩色图像yt作为当前时间步的输入，通过纹理去噪网络∈φ(yt，xt-1，t)得到预测噪声dyt，，最后将带噪彩色图像yt减去预测噪声dyt得到去噪结果yt-1；

11、s2.3，设计损失函数来衡量去噪结果yt-1与理想去噪结果之间的差异，具体计算方式如下：

12、

13、其中，yt为当前时间步的带噪彩色图像，dyt为预测的噪声，为去噪后的彩色图像目标具体计算方式如下：

14、

15、其中，表示在当前时间步t上，通过最小化yt-dyt-yt-1的l1范数而得到的最优去噪结果从而用于计算损失函数，以指导去噪模型的训练。

16、进一步的，步骤s3包括以下子步骤：

17、s3.1，从输入图像中提取中间特征fkt，具体为：通过将当前时间步的带噪彩色图像yt和稀疏结构分支的去噪结果xt-1作为输入，联合输入到噪声预测网络中；在噪声预测网络的前几层，通过一系列的卷积层对输入图像进行处理；卷积层用于提取输入图像的底层特征，每个卷积层之后接一个非线性激活函数(relu)，最终经过多层卷积操作提取出一组中间特征fkt用于指导噪声预测过程；

18、s3.2，使用spade模块对中间特征fkt进行特征融合和增强，得到最终预测噪声，具体为：将提取的中间特征fkt输入到带有spade模块的卷积模块中，spade模块根据稀疏结构分支的去噪结果xt-1自适应地调整特征图的归一化参数，增强特征的空间一致性；再通过卷积层和relu激活函数进一步处理特征图，最终通过一系列卷积操作生成最终的预测噪声生成的预测噪声作为最终输出噪声dyt。

19、进一步的，步骤s2中所述结构引导去噪模型的输入为2d露齿人脸彩色图像以及对应灰度图像；引入指导模块在去噪过程中使用灰度图像对结构引导解决语义差异问题，从而简化纹理去噪目标，即去噪过程的最优解。

20、进一步的，所述指导模块包括两个分支：生成一致的语义xt-1分支和引导纹理生成有意义的语义yt-1分支；所述指导模块的输入中，假设xt为当前时间步t下的带噪灰度图像输入；

21、(1)生成一致的语义xt-1分支：在结构引导去噪过程中，稀疏结构分支的去噪结果xt-1可通过以下公式得到：

22、dxt＝∈φ(xt，t)

23、其中，∈φ(xt，t)是一个神经网络，它接受当前带噪灰度图像xt和时间步t作为输入，输出预测的噪声dxt；

24、xt-1＝xt-dxt

25、通过减去预测的噪声dxt来得到去噪结果xt-1；

26、(2)引导纹理生成有意义的语义yt-1分支：在结构引导的去噪过程中，密集纹理分支的去噪结果yt-1可通过以下公式得到：

27、dyt＝∈φ(yt，xt-1，t)

28、其中，∈φ(yt，xt-1，t)是一个神经网络，它接受当前带噪彩色图像yt、去噪后的灰度图像xt-1和时间步t作为输入，输出预测的噪声dyt；稀疏结构分支的去噪结果xt-1提供了语义一致性的指导信息，帮助预测噪声；

29、yt-1＝yt-dyt

30、通过减去预测的噪声dyt来得到去噪结果yt-1。

31、进一步的，所述预测噪声可通过以下公式得到：

32、

33、其中，convγ和convβ分别表示将输入xt-1转换为缩放值和偏置值的映射。；

34、

35、其中，μkt(hk，wk)和σkt(hk，wk)分别是像素在不同通道上的统计均值和方差。

36、进一步的，所述的∈φ(xt，t)神经网络以及∈φ(yt，xt-1，t)神经网络均通过多层卷积操作、spade模块以及特征融合过程，有效提取和结合输入图像的特征，生成准确的预测噪声；通过最小化以下目标函数，网络能够生成语义一致且有意义的修复结果，具体公式为：

37、

38、其中，βt为正权重；(dxt)∈φ表示通过噪声预测网络估计的反向噪声。

39、进一步的，所述的spade模块用于在图像处理过程中动态调整特征图的归一化参数，假设当前辅助信息图像为s：

40、(1)将辅助信息图像s输入到两个卷积层中，通过下列公式生成动态调整参数γ和β：

41、γ＝convγ(s)

42、β＝convβ(s)

43、其中，convγ和convβ是两个独立的卷积层，分别生成缩放参数和偏置参数。

44、(2)对主输入特征图f通过以下公式进行标准归一化处理，得到

45、

46、(3)将归一化后的特征图与动态调整参数γ和β结合，通过以下公式得到去归一化后的特征图像fspade：

47、

48、其中，fspade是经过spade模块处理后的特征图。

49、一种基于结构引导扩散模型的牙齿正畸结果预测装置，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，用于实现所述的基于结构引导扩散模型的牙齿正畸结果预测方法。

50、一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时，实现所述的基于结构引导扩散模型的牙齿正畸结果预测方法。

51、相比于现有技术，本发明具有的有益效果为：

52、1.本发明将扩散模型方法引入到牙齿正畸领域中，对生成式模型在牙齿正畸领域进行了探索。

53、2.本发明提出了基于结构引导的扩散模型方法，对牙齿正畸进行预测。

54、3.本发明引入了一个结构引导打分模块，将对生成后的图片进行打分评价，使得结果更加真实。

技术特征：

1.一种基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：

3.如权利要求2所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：

4.如权利要求1所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：

5.如权利要求4所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：

6.如权利要求3所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：所述预测噪声可通过以下公式得到：

7.如权利要求5所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：所述的εφ(xt，t)神经网络以及εφ(yt，xt-1，t)神经网络均通过多层卷积操作、spade模块以及特征融合过程，有效提取和结合输入图像的特征，生成准确的预测噪声；通过最小化以下目标函数，网络能够生成语义一致且有意义的修复结果，具体公式为：

8.如权利要求3所述的基于结构引导扩散模型的牙齿正畸结果预测方法，其特征在于：所述的spade模块用于在图像处理过程中动态调整特征图的归一化参数，假设当前辅助信息图像为s：

9.一种基于结构引导扩散模型的牙齿正畸结果预测装置，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，其特征在于，所述处理器执行所述可执行代码时，用于实现如权利要求1-8中任一项所述的基于结构引导扩散模型的牙齿正畸结果预测方法。

10.一种计算机可读存储介质，其上存储有程序，其特征在于，该程序被处理器执行时，实现如权利要求1-8中任一项所述的基于结构引导扩散模型的牙齿正畸结果预测方法。

技术总结
本发明公开了一种基于结构引导扩散模型的牙齿正畸结果预测方法及装置。给定正畸前2D露齿人脸彩色图像以及其对应灰度图像，首先训练结构引导去噪模型，其中设计了密集纹理分支以及稀疏结构分支，其次训练噪声预测网络模型，其中设计了引导模块以及网络结构模块，通过结合去噪后的灰度边缘图像、带噪的彩色图像以及中间特征，从而确保语义上的一致性；设计了判别器损失用于在去噪过程中，确保当前结构与当前时间步的纹理之间的紧密相关性，同时设计了三元组损失来强调在去噪过程中非掩码区域的相关性评估；最后通过结构指导的方式优化纹理去噪过程从而有效预测正畸结果。本发明根据正畸前的2D露齿人脸彩色图像准确预测正畸后的人脸彩色图像。

技术研发人员：薛鹏程,蔡文杰,田彦,沈晨辉,赵欣欣,魏博,徐国龙
受保护的技术使用者：浙江工商大学
技术研发日：
技术公布日：2024/11/26

转载请注明原文地址:https://tc.8miu.com/read-35694.html

专利

最新回复(0)