本申请要求2019年10月16日提交的名称为Die Level Semiconductor Product Modeling without Die Level Input Data的美国临时申请号62/916163的优先权,所述申请全文以引用方式并入本文。
技术领域
本申请涉及半导体晶圆的建模,并且更具体地,涉及对晶粒级参数进行建模。
背景技术
出于多种原因,难以预测半导体产品的晶粒级良率。在前几代产品中,产品良率通常受缺陷限制,并且对晶粒级良率进行建模需要大量的光学缺陷数据。利用过程控制监视器(PCM)测量对良率或晶圆分类参数测量的空间模式进行建模的大多数努力集中在对PCM测量进行内插或外推以尝试预测每个晶圆处的PCM测量。为此,将数个晶圆上的测试结构的电气测量视为更大晶圆分组的代表,然后用其创建固定参数图。这些努力通常不成功,因为它们不能将常导致坏晶圆的不断改变的空间模式考虑在内。
此外,主要由于成本限制,可在每层处测量仅小百分比的晶圆,从而使得对于大多数晶圆而言几乎不可能进行晶粒级预测。最近几代产品的良率受参数变化的影响通常大于受缺陷的影响,从而提供了根据可在每个晶粒上执行的参数测量直接对良率进行建模的机会。
然而,成本再次造成障碍。划线结构的初始参数测量,常称为PCM或WAT(晶圆验收测试)数据,通常在每个晶圆上的有限数量的站点(通常仅5-10个位点)处执行。使用PCM数据来预测每个晶粒上的晶圆分类良率或晶圆分类参数是有价值的,尤其是在可指定每个变量对每个晶圆的重要性的情形下。由于众所周知PCM测量通常与参数良率损失和晶圆分类参数相关,因此已经使用PCM测量成功创建许多晶圆级模型以预测每个晶圆的晶圆良率和参数平均值两者。然而,如所述的,预测晶粒级良率特别困难,因为通常仅可获得晶圆上的几个位点的PCM测量。为了预测晶粒级良率,最常见的方法是利用内插或通过将假设模型形式拟合到可获得的PCM数据来估算每个晶粒处的PCM参数的值。由于可用位点有限以及每个PCM参数的模型形式的不确定性,这仅获得少许成功。
因此,期望根据PCM参数直接预测晶粒良率或晶粒级晶圆分类参数,而不具有与针对每个晶粒显式地估算PCM参数相关联的误差。
技术实现要素:
针对半导体晶圆的每个晶粒创建机器学习模型。从跨晶圆分布的多个测试位点获得测试数据。获得晶圆的晶粒级图。基于测试数据和晶粒级图,每个模型被配置来预测其相应晶粒的良率并且估算晶粒的过程控制参数。
附图说明
图1是示出多个晶圆样品的预测良率与实际良率之间的晶圆级相关性的图形绘图。
图2是示出图1的多个晶圆样品的预测良率与实际良率之间的批次级相关性的图形绘图。
图3是示出多个晶圆批次的预测良率与实际良率之间的晶粒级相关性的一系列图形绘图。
图4是示出图3中所示的晶圆批次的预测空间模式的一系列热图。
图5是示出图3中所示和图4中预测的晶圆批次的实际空间模式的一系列热图。
图6是用于确定过程控制参数的晶粒级值的一般过程的流程图。
具体实施方式
晶圆是用于制造集成电路的半导体材料薄片。通常在晶圆上的单独晶粒上形成许多相同的电路,并且当制造完成时,在划线处将晶粒切分开以分离单独电路以用于封装。靠近划线的任何结构在此过程期间会被破坏,从而使所述区域无法用于产生产品电路。然而,这些划线空间非常适合用于产生将在切分晶粒之前进行测量的测试结构。
在切分晶粒之前,对在晶圆上的各个测试位点处形成的划线测试结构执行测试方案,诸如晶圆接受测试(WAT)或过程控制监视(PCM)。在一个实例中,在晶圆上测量九个测试位点。为了理解跨晶圆的变化,将测试位点中的一些定位在晶圆边缘附近将是理想的。然而,通常优选将测试位点定位成远离晶圆边缘,以提高测量的质量。
为了改进晶粒级良率预测,可针对晶圆上的每个晶粒构建单独的基于处理器的模型,其方式为使用从每个测试位点获得的测试数据作为模型的单独输入变量。此外,可基于每个位点、基于每个晶粒、基于每个晶圆和/或基于每个批次构建模型。现代机器学习技术可用于配置基于算法的软件模型,所述基于算法的软件模型初始地根据训练数据集学习复杂的非线性关系,并且根据新获取的数据更新复杂的非线性关系,以连续不断地学习参数与良率性能之间的关系。例如,神经网络是机器学习模型的实现方式的实例,并且XGBoost是基于极其复杂的树模型的另一种机器学习模型。
过程参数和变量之间的复杂数据关系可以是单变量的或多变量的或两者兼有。通过提供分析框架以更好地评估各种参数和变量作为晶粒级性能的代表,可产生始终更好的总体良率性能。根据复杂数据关系,每个晶粒的相关输入参数可由特定于所述晶粒的模型隐式地估算。
基于处理器的模型可以是基于桌面的(即,独立的)或者可以是联网系统的一部分;但鉴于要在具有一定交互性的情况下处理和显示的沉重信息负载,处理器能力(CPU、RAM等)应是当前最先进的,以使效率最大化。在半导体代工厂环境中,分析平台是用于构建GUI模板的有用选择。在一个实施方案中,处理例程的编码可使用分析软件版本7.11或更高版本进行,所述分析软件版本7.11或更高版本与Python面向对象的编程语言兼容,主要用于编码机器语言模型。
关键是学习和理解针对每个晶粒隐式地估算每个PCM参数所需的复杂非线性关系。这种估算受晶粒的良率影响,使得可隐式地预测所估算的PCM值,因为不存在足够的PCM数据来显式地预测每个PCM值。不管针对模型选取隐式的还是显式的估算形式,批次、晶圆和晶粒级处的预测良率与实际良率之间的相关性都清楚地显示准确度,如图所示。
图1是跨多个批次的大量晶圆的预测良率与实际良率的晶圆级散点绘图100,其中预测良率与实际良率之间的线性相关性示出为线120。预测良率和实际良率的线性相关性具有0.561的交叉验证r平方值,其指示对于所有晶圆平均来说为约56%的预测良率与实际良率的相关性。
出于例示性目的,在此和在图中特别提到了标记为101-109的多个单独晶圆。例如,根据图1所示的晶圆级相关性,晶圆103的预测良率与实际良率之间的相关性相对较低,而晶圆102和109的预测良率与实际良率之间的相关性相对较高。
参考图2,相同晶圆的批次级散点绘图200有助于深入挖掘晶粒级模型并且向其提供另外的输入,其示出批次级处的另外的方差。
由于良率是对于失败的晶粒值为0并且对于合格的晶粒值为1的二元变量,并且预测是指示晶粒将产生良率的概率的介于0与1之间的数字,因此将每个晶粒及与其紧邻的晶粒的预测良率与平均实际良率进行比较更加有用。这称为平滑化,并且所有图中的实际良率和预测良率都已经使用这种方法进行平滑化。
图3中的一系列绘图中示出预测平滑良率与实际平滑良率的晶粒级相关性,所述一系列绘图对应于9个样品晶圆101-109。例如,晶圆109的晶粒相关性具有0.757的平均r平方值,其指示此晶圆上的晶粒的大约76%的预测良率与实际良率之间的相关性;晶圆108的晶粒相关性具有0.580的平均r平方值,其指示此晶圆上晶粒的预测良率与实际良率之间的相关性为大约58%;晶圆107的晶粒相关性具有0.057的平均r平方值,其指示此晶圆上的晶粒的大约6%的预测良率与实际良率之间的相关性;晶圆106的晶粒相关性具有0.714的平均r平方值,其指示此晶圆上的晶粒的大约71%的预测良率与实际良率之间的相关性;晶圆105的晶粒相关性具有0.293的平均r平方值,其指示此晶圆上的晶粒的大约29%的预测良率与实际良率之间的相关性;晶圆104的晶粒相关性具有0.755的平均r平方值,其指示此晶圆上的晶粒的大约76%的预测良率与实际良率之间的相关性;晶圆103的晶粒相关性具有0.430的平均r平方值,其指示此晶圆上的晶粒的大约43%的预测良率与实际良率之间的相关性;晶圆102的晶粒相关性具有0.495的平均r平方值,其指示此晶圆上的晶粒的大约50%的预测良率与实际良率之间的相关性;并且最后,晶圆101的晶粒相关性具有0.331的平均r平方值,其指示此晶圆上的晶粒的大约33%的预测良率与实际良率之间的相关性。
这些结论可通过查看晶粒模型的空间相关性进行进一步证实,所述空间相关性如在图4的预测热图和图5的实际热图中针对晶圆101-109所示。即使在良率结果较低的情况下,模型也能相当好地预测最终图。晶圆103、104、105、106、108和109的晶圆图的视觉相似性是明显的。晶圆101和107在视觉上非常不同,并且图3中的相关性绘图示出这些晶圆具有低的空间r平方值。
所述概念实际上是输入到输出的映射,但是基于对输入与期望输出(在主要情况下为良率)的复杂关系的分析。图6是示出用于对良率进行晶粒级预测的简单方法的流程图。在步骤202中,从跨晶圆形成的测试位点中的每一个获取输入数据。在步骤204中,获得晶圆的晶粒级图,其提供特征和位置的图形细节。在步骤206中,针对晶圆上的每个晶粒,针对单独晶粒配置的机器学习模型基于来自所有测试位点的测试输入数据预测所述晶粒的良率。对特征的隐式估算主要受良率性能影响,并且由机器学习模型学习并连续不断地更新的来自单个晶圆上的全部测试位点与来自单独晶粒的输入数据之间的相互关系的发现建立单独晶粒特征与PCM值的对应关系。在任选步骤208中,模型可帮助标识特定PCM变量对良率的相对重要性。最后,在步骤210中,部署模型以用于评估良率的空间模式。使用产品良率和晶圆分类参数测量作为模型的预期响应允许隐式地估算单独晶粒的PCM参数以特别地用于对异常空间模式进行建模。
除估算多个位点处的PCM值之外,此相同技术还可用于并入其他位点级数据,诸如计量和晶圆级数据,诸如工具、腔室、保持时间、故障指示器等。
因此,机器学习模型可被配置来针对每个晶粒,基于跨整个晶圆的多个测试位点处的晶圆分类参数测量以及所述晶圆的良率结果来估算预期过程控制参数。这允许更好地分析异常空间模式,从而产生改进的良率结果。