1.本发明涉及神经网络的技术领域,尤其涉及一种用于训练卷积神经网络的方法。
背景技术:
2.图像去噪用于处理被加性噪声污染的图像,以在保留图像特征的同时实现去噪。发明人已经认识到,当用户试图通过最小化能量输入来最小化光漂白和光毒性时,这可以通过以增加噪声量为代价减小曝光时间或增益来实现,可能会引入加性噪声。在典型的工作流程中,图像是在低曝光时间或增益下获取的,导致图像质量低下,其中可能包含来自电子源的噪声(例如高斯噪声、椒盐噪声和散粒噪声)或由于量化、灵敏度或来自相机传感器的热量导致的样本相依高频噪声。
技术实现要素:
3.本发明所要解决的问题是如何对图像进行去噪并获得良好的信噪比(snr)。
4.在本发明的实施例中,提供了一种用于训练卷积神经网络的计算机实现的方法,方法包括:接收捕获图像;基于捕获图像生成统计模型;以及根据捕获图像和统计模型训练卷积神经网络。因此,当使用一个或多个获取图像训练卷积神经网络时,可以增大snr。
5.在实施例的可能实施方式中,生成统计模型包括:根据地面实况或模拟地面实况确定捕获图像中的像素的方差或标准偏差值;以及基于方差或标准偏差值生成统计模型。因此,可以更有效地并基于真实获取图像,并且可以不使用所谓的训练图像,训练卷积神经网络。
6.在实施例的可能实施方式中,训练卷积神经网络包括:将捕获图像分成随机块;将每个随机块中的像素值与相邻像素值交换;以及基于捕获图像的随机块和包括交换的像素值的捕获图像的随机块来训练卷积神经网络。
7.在实施例的可能实施方式中,训练卷积神经网络包括:基于统计模型确定随机块的像素值包括交换的像素值的概率;以及通过最大化随机块的每个像素值包括交换的像素值的概率来训练卷积神经网络。因此,卷积神经网络可以使用第一个和随后获取图像来训练和使用,而不必依赖于训练数据。
8.在实施例的可能实施方式中,最大化每个像素值的概率包括最小化所有像素概率的平均值的负对数。
9.在实施例的可能实施方式中,每个像素值的概率是基于具有平均值和方差或标准偏差值的高斯分布来确定的,其中平均值是捕获图像的随机块的每个像素的平均值,以及方差或标准偏差值是从统计模型中获得的。用于确定方差值的替代技术可以包括,基于图像中的相机的计数(即增益)确定噪声的方差,或对荧光进行建模以确定在曝光时间为t的特定帧中预期对象和获得的对象之间的任何噪声的方差。通常,可以使用创建模型的技术,其基于相机增益或对成像的对象的荧光进行建模来得到每个像素的方差值。
10.在实施例的可能实施方式中,方法包括将经训练的卷积神经网络应用于捕获图
像。
11.在实施例的可能实施方式中,方法包括使用统计模型校正由经训练的卷积神经网络生成的图像的每个像素概率,以及将每个生成的像素概率与每个校正的像素概率进行平均。
12.在实施例的可能实施方式中,方法包括:接收另外的捕获图像;基于捕获图像和另外的捕获图像更新统计模型;确定与统计模型相比更新的统计模型的方差或标准偏差值是否减小;以及如果确定与统计模型相比更新的统计模型的方差或标准偏差值减小,基于另外的捕获图像和更新的统计模型重新训练卷积神经网络。因此,每次获取新图像都可以提高卷积神经网络的性能。
13.在实施例的可能实施方式中,卷积神经网络是编码器-解码器神经网络。
14.在本发明的实施例中,提供了一种包括一个或多个处理器以及一个或多个存储设备的系统,其中系统被配置为执行上述方法。
15.在实施例的可能实施方式中,系统包括耦接到处理器的成像设备,成像设备用于获取显微图像。
16.在本发明的实施例中,提供了一种经训练的卷积神经网络,通过以下被训练:接收捕获图像;基于捕获图像生成统计模型;以及基于捕获图像和统计模型调整卷积神经网络。
17.在本发明的实施例中,提供了一种具有用于执行上述方法的程序代码的计算机程序。
附图说明
18.本公开可以参考以下所阐述的实施例的描述并结合附图来理解,其中:
19.图1示出了根据本发明实施例的用于训练卷积神经网络的方法;
20.图2示出了针对一张图像的灰阶中的每个值的方差图;
21.图3示出了针对1000张图像的灰阶中的每个值的方差图;
22.图4示出了根据本发明的进一步实施例的用于训练卷积神经网络的方法;
23.图5是处理前的获取图像,例如显微图像;
24.图6是使用根据本发明实施例训练的经训练的卷积神经网络处理后的图像;
25.图7是获取图像的地面实况;以及
26.图8示出了根据本发明的进一步实施例的用于执行用于训练卷积神经网络的方法的系统。
具体实施方式
27.发明人已经认识到,理解去噪问题的一种方式是将理想图像(高信噪比,snr)与将随机值添加到获得的图像的每个像素的数学分布一起考虑。例如,在荧光的情况下,可以使用泊松-高斯分布对此函数进行建模,其中泊松噪声(也称为散粒噪声)是主要源。
28.如果信息的主要部分保留在图像中,则可以从每个像素的邻域统计估计噪声像素的值。如果考虑每个像素的高斯分布,就会有平均值和方差(或标准偏差)。方差(或标准差)越大,噪声越大,并且snr越低(即图像质量差)。
29.图1示出了根据本发明实施例的用于训练卷积神经网络的方法。卷积神经网络构
成即时训练系统的部分,该系统可以由制造商预训练,并在客户应用期间进行训练。制造商执行的预训练可以包括应用本发明实施例的方法。卷积神经网络是机器学习算法或模型的一种形式。
30.在图1中,共有三个处理步骤。这些步骤是训练100、处理102和重复训练104。
31.在步骤100中,例如从显微镜获取图像106(即显微图像)。例如,通过将高斯平滑108应用于获取图像106来获得模拟地面实况图像112。高斯平滑的替代方案包括均值滤波(例如通过平均像素的加权)、双边滤波、非局部均值(nlm)平滑、以及块匹配和3d滤波(bm3d)。如果存在地面实况图像(即具有非常高的峰值信噪比psnr的相同图像),可以不必获得模拟地面实况。将获取图像106与模拟地面实况图像110进行比较,并且提取每个像素值的方差以产生0-255的灰阶或0-65536的色标中的每个值的平均方差值。可以基于获取图像106和模拟地面实况图像,使用2d直方图中的每个值来确定方差值。随后将模型112拟合到平均方差值。模型可以是多项式、指数或其他合适的统计模型,它是通过绘制方差值得出的。用于确定方差值的替代技术可以包括,基于图像中的相机的计数(即增益)确定噪声的方差,或对荧光进行建模以确定在曝光时间为t的特定帧中预期对象和获得的对象之间的任何噪声的方差。通常,可以使用基于相机增益或对成像的对象的荧光进行建模来输出每个像素的方差值的创建模型的技术。
32.图2示出了一张图像的灰阶中的每个值的平均方差的图。在图中,“1000张图像方差(噪声对地面实况)”粗实线表示理想统计模型,“1张图像方面方差噪声对假地面实况”粗实线表示通过将获取图像106与模拟地面实况图像110进行比较而获取的值,“1张图像的拟合”虚线表示拟合到“一张图像假gt(地面实况)”的统计模型。
33.返回到图1,捕获图像106被裁剪,或分成随机块114。这些块114通常是方形的并且表示获取图像106的部分并且每个块可以与相邻块重叠。每个块的大小基于图像的大小和所使用的图像处理设备的处理能力确定,例如可能高达256x256像素。一个典型的块可能是64x64像素,使得512x512像素的图像将被分成64个块。使用均匀随机分布从每个随机块114中选择一些像素,并且所选像素的像素值被来自相邻像素的值交换或替换以产生包括交换的像素值的捕获图像的随机块118。通常,可以在块内交换或替换像素的1%到10%。图像116示出了随机块114之一的放大部分并且图像120示出了包括交换的像素值的捕获图像的随机块118之一的放大部分。
34.包括交换的像素值的捕获图像的随机块118随后被用于训练卷积神经网络(cnn)122。在此示例中,训练u-net,然而将理解的是可以使用其他收缩-扩展或编码器-解码器cnn,例如resnet(例如resnet-18)。特别地,可以使用在合并层中具有子像素卷积(像素重组)的动态u-net(编码器resnet-18)。基于包括交换的像素值的捕获图像的随机块118和使用模型112获得的方差值训练cnn 122。cnn 122最大化获取图像中的每个像素属于该获取图像的概率(即cnn 122最大化该获取图像中每个像素不是噪声结果的概率)。这通过基于以下表达式128最小化所有像素概率的平均值的负对数来实现:
[0035][0036]
其中n是随机块的数量,m是被掩蔽的像素(即交换或替换的像素)的数量,xm是具
有替换值的图像118中的第m个像素值,由图1中的124表示,而sm是在获取图像106的随机块114中的第m个像素值,由图1中的126表示。z分数和概率是从具有使用捕获图像的随机块的像素值获得的平均值和从统计模型中获得的方差值的高斯分布得出的。
[0037]
在步骤102中,经训练的cnn 132被用于对获取图像130(获取图像130可以对应于获取图像106或与其类似的图像)去噪,以获得去噪图像134。
[0038]
在步骤104中,获取新的另外的图像136,并且基于获取图像130和获取的另外的图像136的方差值生成新统计模型138。将新统计模型138与在步骤100中生成的先前统计模型112进行比较,并且作出关于是否存在统计模型中的任何方差值的减小的决定140。如果存在新统计模型138中的方差值的减小,使用另外的获取图像136和新统计模型138以及任何先前获取图像,诸如获取图像106,重新训练142cnn 132。重新训练的cnn随后被应用于获取的另外的图像136。
[0039]
如果不存在新统计模型138中的方差值的减小,基于cnn 132对另外的获取图像136去噪144而无需进一步训练以获得去噪图像146。
[0040]
此外,任何去噪图像134、146的每个像素概率可以使用当前统计模型进行估计和校正并与其自身进行平均。
[0041]
还可能需要基于最新的cnn和统计模型更新148任何先前去噪图像,并基于先前获取图像和任何新统计模型重新训练cnn 132。
[0042]
重复步骤104,直到与先前统计模型相比不存在新统计模型的可检测的减小为止。对此,重复步骤104,直到先前模型和新模型之间的差为0 /-容差(例如 /-0.1到1%、 /-0.1到2%、 /-0.1到3%、 /-0.1到4%或 /-0.1到5%的容差)。
[0043]
图3示出了针对1000张图像的灰阶中的每个值的方差图。在图中,“1000张图像方差(噪声对地面实况)”实线表示从1000张图像中获得的方差数据,以及“1000张图像曲线拟合”虚线表示拟合到“1000张图像方差(噪声对地面实况)”线的统计模型。很明显,在例如1000张图像之后,方差不再减小,以及模型也不再需要更新。然而,将理解的是,可以使用更少的图像,诸如50张图像。
[0044]
如果执行上述方法的系统获取新连续图像或其参数(激光功率、获取速度、曝光时间变化等)被更新,可以评估新“噪声”图像。如果方差相对于先前的统计模型已经减小,则可以使用本文描述的方法更新模型。因此,例如,可以在实验过程中迭代地提高图像的质量。
[0045]
在本文中参考了方差值,但是将理解的是,也可以使用标准偏差值。
[0046]
图4示出了根据本发明的进一步实施例的用于训练卷积神经网络的方法400。方法包括:接收402捕获图像;基于捕获图像生成404统计模型;以及基于捕获图像和统计模型训练406卷积神经网络。
[0047]
图5是处理前的获取图像,例如显微图像。
[0048]
图6是使用根据本发明实施例训练的经训练的卷积神经网络处理后的图像。从图6中的图像可以明显看出,相对于获取图像,snr得到了改善。
[0049]
图7是获取图像的地面实况。
[0050]
图8示出了被配置为执行本文描述的方法的系统800的示意图。系统800包括显微镜802和计算机系统804。显微镜802被配置为拍摄图像并且被连接到计算机系统804。计算
机系统804被配置为执行本文描述的方法的至少部分。计算机系统804可以被配置为执行机器学习算法。计算机系统804和显微镜802可以是分离的实体,但也可以一起集成在一个通用壳体中。计算机系统804可以是显微镜802的中央处理系统的部分和/或计算机系统804可以是显微镜802的子组件的部分,诸如显微镜802的传感器、作用物、相机或照明单元等。
[0051]
计算机系统804可以是具有一个或多个处理器以及一个或多个存储设备的本地计算机设备(例如个人计算机、笔记本电脑、平板计算机或移动电话)或者可以是分布式计算机系统(例如云计算系统816,具有一个或多个处理器以及一个或多个分布在不同位置的存储设备,例如,在本地客户端和/或一个或多个远程服务器群和/或数据中心)。计算机系统804可以包括任何电路或电路组合。在一个实施例中,计算机系统804可以包括一个或多个处理器806,其可以是任何类型。如本文所用,处理器可指任何类型的计算电路,诸如但不限于例如显微镜或显微镜组件(例如相机)的微处理器、微控制器、复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器、图形处理器808、数字信号处理器(dsp)、多核处理器、现场可编程门阵列(fpga),或任何其他类型的处理器或处理电路。可以包括在计算机系统804中的其他类型的电路可以是定制电路、专用集成电路(aslc)等,诸如用于无线设备的一个或多个电路(诸如通信电路),无线设备如移动电话、平板电脑、笔记本电脑、双向无线电和类似的电子系统。计算机系统804可以包括一个或多个存储设备810,其可以包括一个或多个适合特定应用的存储元件,诸如随机存取存储器(ram)形式的主存储器、一个或多个硬盘驱动器,和/或一个或多个处理可移动媒介(诸如光盘(cd)、闪存卡、数字视频磁盘(dvd)等)的驱动器。计算机系统602还可以包括显示设备812、一个或多个扬声器以及键盘和/或控制器814,其可以包括鼠标、轨迹球、触摸屏、语音识别设备或允许系统用户向计算机系统804输入信息和从计算机系统804接收信息的任何其他设备。
[0052]
如本文所用,术语“和/或”包括一个或多个相关所列项目的任何和所有组合并且可以缩写为“/”。
[0053]
尽管已经在装置的上下文中描述了一些方面,但很明显,这些方面也表示相应方法的描述,其中块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示相应装置的相应块或项目或特征的描述。
[0054]
一些或所有方法步骤可以由(或使用)硬件装置来执行,例如处理器、微处理器、可编程计算机或电子电路。在一些实施例中,一些一个或多个最重要的方法步骤可以由这样的装置执行。
[0055]
根据某些实施要求,本发明的实施例可以以硬件或软件来实施。可以使用诸如软盘、dvd、蓝光、cd、rom、prom和eprom、eeprom或flash存储器之类的数字存储介质之类的非暂时性存储介质来执行该实施,非暂时性存储介质具有存储在其上的电子可读控制信号,电子可读控制信号与可编程计算机系统协作(或能够协作)从而执行相应的方法。因此,数字存储介质可以是计算机可读的。
[0056]
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,电子可读控制信号能够与可编程计算机系统协作,从而执行本文所述的方法之一。
[0057]
通常,本发明的实施例可被实现为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,该程序代码可操作用于执行方法之一。例如,程序代码可以存储
在机器可读载体上。
[0058]
其他实施例包括存储在机器可读载体上的用于执行本文描述的方法之一的计算机程序。
[0059]
换言之,本发明的实施例因此是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,该程序代码用于执行本文描述的方法之一。
[0060]
因此,本发明的进一步实施例是一种存储介质(或数据载体,或计算机可读介质),其上存储有用于在由处理器执行时执行本文所述方法之一的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非暂时性的。本发明的进一步实施例是如本文所描述的装置,包括处理器和存储介质。
[0061]
因此,本发明的进一步实施例是数据流或信号序列,其表示用于执行本文描述的方法之一的计算机程序。数据流或信号序列可以例如被配置为经由数据通信连接、例如经由互联网来传送。
[0062]
进一步实施例包括处理装置,例如,计算机或可编程逻辑器件,其被配置为或适于执行本文所描述的方法之一。
[0063]
进一步实施例包括其上安装有用于执行本文所述方法之一的计算机程序的计算机。
[0064]
根据本发明的进一步实施例包括被配置为向接收器传送(例如,电子地或光学地)用于执行本文描述的方法之一的计算机程序的装置或系统。例如,接收器可以是计算机、移动设备、存储设备等。例如,装置或系统可以包括用于将计算机程序传送到接收器的文件服务器。
[0065]
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可用于执行本文所描述方法的一些或全部功能。在一些实施例中,现场可编程门阵列可与微处理器协作以执行本文所描述的方法之一。通常,这些方法优选地由任何硬件装置执行。
[0066]
实施例可以基于使用机器学习模型或机器学习算法。机器学习是指计算机系统可以用来在不使用显式指令而是依赖模型和推理的情况下执行特定任务的算法和统计模型。例如,在机器学习中,不使用基于规则的数据变换,可以使用从对历史和/或训练数据的分析推断得出的数据变换。例如,可以使用机器学习模型或使用机器学习算法来分析图像的内容。为了让机器学习模型分析图像的内容,可以使用训练图像作为输入并使用训练内容信息作为输出来训练机器学习模型。通过使用大量训练图像和/或训练序列(例如单词或句子)以及相关的训练内容信息(例如标签或注释)训练机器学习模型,机器学习模型“学习”以识别图像的内容,因此可以使用机器学习模型识别未包括在训练数据中的图像的内容。相同的原理也可用于其他类型的传感器数据:通过使用训练传感器数据和期望输出训练机器学习模型,机器学习模型“学习”传感器数据和输出之间的变换,从而可用于基于提供给机器学习模型的非训练传感器数据提供输出。提供的数据(例如传感器数据、元数据和/或图像数据)可以被预处理以获得特征向量,特征向量用作机器学习模型的输入。
[0067]
机器学习模型可以使用训练输入数据进行训练。上面指定的示例使用称为“监督学习”的训练方法。在监督学习中,机器学习模型使用多个训练样本进行训练,其中每个样本可以包括多个输入数据值和多个期望输出值,即每个训练样本与期望输出值相关联。通过指定训练样本和期望输出值,机器学习模型“学习”基于与训练期间提供的样本类似的输
入样本提供哪个输出值。除了监督学习之外,还可以使用半监督学习。在半监督学习中,一些训练样本缺乏相应的期望输出值。监督学习可以基于监督学习算法(例如分类算法、回归算法或相似性学习算法。当输出限于一组有限的值(分类变量)时,可以使用分类算法,即输入被分类为一组有限的值中的一个。当输出可能具有任何数值(在一个范围内)时,可以使用回归算法。相似性学习算法可以类似于分类和回归算法,但基于从使用测量两个对象的相似或相关程度的相似度函数的示例学习。除了监督或半监督学习,无监督学习可用于训练机器学习模型。在无监督学习中,可以提供(仅)输入数据并且无监督学习算法可用于在输入数据中找到结构(例如,通过对输入数据进行分组或聚类,找到数据中的共同点)。聚类是将包括多个输入值的输入数据分配到子集(群集)中,以便根据一个或多个(预定义的)相似性标准,同一群集内的输入值是相似的,而与在其他群集中包括的输入值不同。
[0068]
强化学习是第三组机器学习算法。换句话说,强化学习可用于训练机器学习模型。在强化学习中,训练一个或多个软件参与者(称为“软件代理”)以在环境中采取行动。根据采取的行动,计算奖励。强化学习基于训练一个或多个软件代理来选择行动,从而增加累积奖励,导致在执行给定的任务时变得更好的软件代理(通过增加奖励来证明)。
[0069]
此外,一些技术可以应用于一些机器学习算法。例如,可以使用特征学习。换言之,机器学习模型可以至少部分地使用特征学习来训练,和/或机器学习算法可以包括特征学习组件。特征学习算法,也称为表示学习算法,可以保留输入中的信息,但也可以以使其有用的方式对其进行变换,通常作为执行分类或预测之前的预处理步骤。例如,特征学习可以基于主成分分析或聚类分析。
[0070]
在一些示例中,可以使用异常检测(即异常值检测),其目的是提供输入值的识别,这些输入值与大多数输入或训练数据显著不同而引起怀疑。换句话说,机器学习模型可以至少部分地使用异常检测进行训练,和/或机器学习算法可以包括异常检测组件。
[0071]
在一些示例中,机器学习算法可以使用决策树作为预测模型。换言之,机器学习模型可以基于决策树。在决策树中,关于一个项目(例如一组输入值)的观察可以由决策树的分支表示,而与该项目对应的输出值可以由决策树的叶子表示。决策树可以支持离散值和连续值作为输出值。如果使用离散值,决策树可以表示为分类树,如果使用连续值,则决策树可以表示为回归树。
[0072]
关联规则是另一种可用于机器学习算法的技术。换言之,机器学习模型可以基于一个或多个关联规则。关联规则是通过识别大量数据中的变量之间的关系来创建的。机器学习算法可以识别和/或利用一个或多个表示从数据得出的知识的关系规则。规则可以例如用于存储、操作或应用知识。
[0073]
机器学习算法通常基于机器学习模型。换言之,术语“机器学习算法”可表示可用于创建、训练或使用机器学习模型的一组指令。术语“机器学习模型”可以表示表示所学知识(例如,基于由机器学习算法执行的训练)的数据结构和/或规则集。在实施例中,机器学习算法的使用可以意味着底层机器学习模型(或多个底层机器学习模型)的使用。机器学习模型的使用可能意味着机器学习模型和/或作为机器学习模型的数据结构/规则集是由机器学习算法训练的。
[0074]
例如,机器学习模型可以是人工神经网络(ann)。ann是受诸如可以在视网膜或大脑中找到的生物神经网络启发的系统。ann包括多个互连的节点和节点之间的多个连接,即
所谓的边。通常存在三种类型的节点,接收输入值的输入节点、(仅)连接到其他节点的隐藏节点、以及提供输出值的输出节点。每个节点可以表示人工神经元。每条边都可以从一个节点到另一个节点传输信息。节点的输出可被限定为其输入的(非线性)函数(例如其输入总和)。节点的输入可用于基于边或提供输入的节点的“权重”的函数中。在学习过程中可以调整节点和/或边的权重。换句话说,人工神经网络的训练可以包括调整人工神经网络的节点和/或边的权重,即以针对给定输入实现期望输出。
[0075]
可替代地,机器学习模型可以是支持向量机、随机森林模型或梯度推进模型。支持向量机(即支持向量网络)是具有相关学习算法的监督学习模型,可用于分析数据(例如在分类或回归分析中)。可以通过提供具有属于两个类别之一的多个训练输入值的输入来训练支持向量机。可以训练支持向量机以将新输入值分配给两个类别之一。可替代地,机器学习模型可以是贝叶斯网络,它是概率有向无环图模型。贝叶斯网络可以使用有向无环图表示一组随机变量及其条件依赖性。可替代地,机器学习模型可以基于遗传算法,遗传算法是一种模仿自然选择过程的搜索算法和启发式技术。
[0076]
附图标记
[0077]
100 训练步骤
[0078]
102 处理步骤
[0079]
104 重复训练步骤
[0080]
106 获取图像
[0081]
108 高斯平滑
[0082]
110 模拟地面实况图像
[0083]
112 统计模型
[0084]
114 随机块
[0085]
116 随机块的放大部分
[0086]
118 包括交换的像素值的捕获图像
[0087]
120 包括交换的像素值的随机块的放大部分
[0088]
122 卷积神经网络(cnn)
[0089]
124 xm[0090]
126 sm[0091]
128 表示表达
[0092]
130 获取图像
[0093]
132 经训练的cnn
[0094]
134 去噪图像
[0095]
136 获取的另外的图像
[0096]
138 新统计模型
[0097]
140 关于是否重新训练cnn的决定
[0098]
142 重新训练cnn
[0099]
144 对另外的获取图像进行降噪
[0100]
146 去噪图像
[0101]
148 更新任何先前去噪图像并重新训练cnn
[0102]
800 系统
[0103]
802 显微镜
[0104]
804 计算机系统
[0105]
806 一个或多个处理器
[0106]
808 图形处理器
[0107]
810 一个或多个存储设备
[0108]
812 显示设备
[0109]
814 键盘和/或控制器
[0110]
816 云计算系统
技术特征:
1.一种用于训练卷积神经网络的计算机实现的方法(400),所述方法包括:接收(402)捕获图像(106);基于所述捕获图像生成(404)统计模型(112);以及基于所述捕获图像和所述统计模型训练(406)卷积神经网络(122)。2.根据权利要求1所述的方法,其中生成统计模型包括:根据地面实况或模拟地面实况(110)确定所述捕获图像中的像素的方差或标准偏差值;以及基于所述方差或标准偏差值生成所述统计模型。3.根据权利要求1所述的方法,其中训练卷积神经网络包括:将所述捕获图像分成随机块(114);将每个所述随机块中的像素值与相邻像素值交换;以及基于所述捕获图像的随机块和包括交换的像素值的捕获图像(118)的随机块,训练所述卷积神经网络。4.根据权利要求3所述的方法,其中训练卷积神经网络包括:基于所述统计模型确定包括交换的像素值的随机块的像素值的概率;以及通过最大化所述包括交换的像素值的随机块的每个像素值的概率,训练所述卷积神经网络。5.根据权利要求4所述的方法,其中对于所述包括交换的像素值的随机块的每个像素值,所述像素值的概率指示所述像素值是用相邻像素值交换过的概率。6.根据权利要求4所述的方法,其中最大化每个像素值的概率包括最小化所有像素概率的平均值的负对数。7.根据权利要求4所述的方法,其中所述每个像素值的概率是基于具有平均值和方差或标准偏差值的高斯分布确定的,其中所述平均值是所述捕获图像的随机块的每个像素的平均值以及所述方差或标准偏差值是从所述统计模型中获得的。8.根据权利要求1-7中任一项所述的方法,包括:将经训练的卷积神经网络应用于所述捕获图像。9.根据权利要求8所述的方法,包括:使用所述统计模型校正由所述经训练的卷积神经网络生成的图像的每个像素概率,并且将每个生成的像素概率与每个校正的像素概率进行平均。10.根据权利要求1-7中任一项所述的方法,包括:接收另外的捕获图像;基于所述捕获图像和所述另外的捕获图像更新所述统计模型;确定与所述统计模型相比更新的统计模型的方差或标准偏差值是否减小;以及如果确定与所述统计模型相比所述更新的统计模型的方差或标准偏差值减小,基于所述另外的捕获图像和所述更新的统计模型重新训练所述卷积神经网络。11.根据权利要求1-7中任一项所述的方法,其中所述卷积神经网络是编码器-解码器神经网络。12.一种系统,包括一个或多个处理器以及一个或多个存储设备(610),其中所述系统被配置为执行根据权利要求1至11中任一项所述的方法。
13.根据权利要求12所述的系统,包括:耦接到所述处理器的成像设备,用于获取显微图像。14.一种经训练的卷积神经网络,通过以下被训练:接收所述捕获图像;基于所述捕获图像生成统计模型;以及基于所述捕获图像和所述统计模型调整卷积神经网络。15.一种计算机程序,具有程序代码,所述程序代码用于执行根据权利要求1至11中任一项所述的方法。
技术总结
描述了一种用于训练卷积神经网络的计算机实现的方法。方法包括接收捕获图像;基于捕获图像生成统计模型;以及基于捕获图像和统计模型训练卷积神经网络。模型训练卷积神经网络。模型训练卷积神经网络。
技术研发人员:何塞
受保护的技术使用者:莱卡微系统CMS有限责任公司
技术研发日:2021.11.05
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-8286.html