本技术涉及人工智能和炼焦工业,尤其涉及一种训练数据生成方法、炼焦预测模型训练方法及装置。
背景技术:
1、配煤炼焦工艺直接决定了焦炭质量,如果能够在炼焦之前根据单煤信息和炼焦炉工艺等参数准确预测出焦炭质量,则可以通过调整单煤配比,尽可能将更合适的单煤用于炼焦而达到更优的焦炭指标,进而降低原材料成本,提升炼焦质量。
2、随着人工智能技术和机器学习技术的发展,出现了用于预测炼焦质量的炼焦预测模型,可以在启动实际炼焦作业之前,通过炼焦预测模型预测某种配煤方式的炼焦质量。
3、然而,在实际应用中,由于炼焦工业自身的属性,工艺复杂,时间长,成本高等特点,使得难以积累足够的历史炼焦数据作为用于模型训练的样本数据,例如,按照一周炼焦一次,一年也只能积累大约40多条数据,无法满足常规的模型训练需求。
4、因此,现有技术中存在缺少用于训练炼焦预测模型的训练数据的问题。
技术实现思路
1、本技术实施例提供一种训练数据生成方法、炼焦预测模型训练方法及装置,用以解决现有技术中存在的缺少用于训练炼焦预测模型的训练数据的问题。
2、本技术实施例提供一种一种训练数据生成方法,包括:
3、获取一种配煤方式的原始样本特征数据和对应的炼焦质量数据,所述原始样本特征数据包括多种单煤的多组特征数据,每种单煤的多个特征数据作为一组特征数据,每种单煤的该多个特征数据包括该种单煤的多个化验指标数据和该种单煤在该配煤方式中的占比;
4、将所述多组特征数据按照不同的顺序进行排列,分别组合成多个一阶特征向量,每个一阶特征向量包含所述多组特征数据,在一个一阶特征向量中同一组特征数据包含的多个特征数据是连续排列的,且顺序不变;
5、将每个一阶特征向量与对应的所述炼焦质量数据进行组合,作为一次模型训练需要使用的一组训练数据,得到多组训练数据。
6、进一步的,所述将所述多组特征数据按照不同的顺序进行排列,分别组合成多个一阶特征向量,包括:
7、将所述多种单煤按照不同的顺序进行排列,得到多种排列方式;
8、针对每种排列方式,按照该种排列方式中每种单煤所位于的位置,将所述多种单煤的所述多组特征数据进行排列,得到多个一阶特征向量。
9、进一步的,所述多个一阶特征向量的数量为所述多种单煤的数量的阶乘。
10、进一步的,所述多个化验指标数据至少包括如下化验指标数据之二:
11、干燥基灰分ad;
12、干燥基挥发分vd;
13、可燃基挥发分vdaf;
14、干燥无灰基硫分std;
15、粘结指数g;
16、煤炭的最终收缩度x;
17、胶质层最大厚度y。
18、本技术实施例还提供一种炼焦预测模型训练方法,包括:
19、获取多组训练数据,所述多组训练数据为基于一种配煤方式的原始样本特征数据和对应的炼焦质量数据确定的,所述原始样本特征数据包括多种单煤的多组特征数据,每种单煤的多个特征数据作为一组特征数据,每种单煤的该多个特征数据包括该种单煤的多个化验指标数据和该种单煤在该配煤方式中的占比,所述多组训练数据中的每组训练数据包含一个一阶特征向量和所述炼焦质量数据,不同组训练数据中的一阶特征向量均包含所述多组特征数据,且所述多组特征数据排列的顺序不同;
20、基于所述多组训练数据,对炼焦预测模型进行训练。
21、进一步的,所述多组训练数据的数量为所述多种单煤的数量的阶乘。
22、本技术实施例还提供一种训练数据生成装置,包括:
23、第一数据获取模块,用于获取一种配煤方式的原始样本特征数据和对应的炼焦质量数据,所述原始样本特征数据包括多种单煤的多组特征数据,每种单煤的多个特征数据作为一组特征数据,每种单煤的该多个特征数据包括该种单煤的多个化验指标数据和该种单煤在该配煤方式中的占比;
24、数据排列模块,用于将所述多组特征数据按照不同的顺序进行排列,分别组合成多个一阶特征向量,每个一阶特征向量包含所述多组特征数据,在一个一阶特征向量中同一组特征数据包含的多个特征数据是连续排列的,且顺序不变;
25、训练数据生成模块,用于将每个一阶特征向量与对应的所述炼焦质量数据进行组合,作为一次模型训练需要使用的一组训练数据,得到多组训练数据。
26、进一步的,所述数据排列模块,具体用于将所述多种单煤按照不同的顺序进行排列,得到多种排列方式;针对每种排列方式,按照该种排列方式中每种单煤所位于的位置,将所述多种单煤的所述多组特征数据进行排列,得到多个一阶特征向量。
27、进一步的,所述多个一阶特征向量的数量为所述多种单煤的数量的阶乘。
28、进一步的,所述多个化验指标数据至少包括如下化验指标数据之二:
29、干燥基灰分ad;
30、干燥基挥发分vd;
31、可燃基挥发分vdaf;
32、干燥无灰基硫分std;
33、粘结指数g;
34、煤炭的最终收缩度x;
35、胶质层最大厚度y。
36、本技术实施例还提供一种炼焦预测模型训练装置,包括:
37、第二数据获取模块,用于获取多组训练数据,所述多组训练数据为基于一种配煤方式的原始样本特征数据和对应的炼焦质量数据确定的,所述原始样本特征数据包括多种单煤的多组特征数据,每种单煤的多个特征数据作为一组特征数据,每种单煤的该多个特征数据包括该种单煤的多个化验指标数据和该种单煤在该配煤方式中的占比,所述多组训练数据中的每组训练数据包含一个一阶特征向量和所述炼焦质量数据,不同组训练数据中的一阶特征向量均包含所述多组特征数据,且所述多组特征数据排列的顺序不同;
38、模型训练模块,用于基于所述多组训练数据,对炼焦预测模型进行训练。
39、进一步的,所述多组训练数据的数量为所述多种单煤的数量的阶乘。
40、本技术实施例还提供一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述任一训练数据生成方法,或者,实现上述任一炼焦预测模型训练方法。
41、本技术实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一训练数据生成方法,或者,实现上述任一炼焦预测模型训练方法。
42、本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一训练数据生成方法,或者,执行上述任一炼焦预测模型训练方法。
43、本技术有益效果包括:
44、本技术实施例提供的方法中,获取一种配煤方式的原始样本特征数据和对应的炼焦质量数据,原始样本特征数据包括多种单煤的多组特征数据,每种单煤的多个特征数据作为一组特征数据,每种单煤的该多个特征数据包括该种单煤的多个化验指标数据和该种单煤在该配煤方式中的占比;将多组特征数据按照不同的顺序进行排列,分别组合成多个一阶特征向量,每个一阶特征向量包含多组特征数据,在一个一阶特征向量中同一组特征数据包含的多个特征数据是连续排列的,且顺序不变;将每个一阶特征向量与对应的炼焦质量数据进行组合,作为一次模型训练需要使用的一组训练数据,得到多组训练数据。由于不同组训练数据中的一阶特征向量是不同的,所以可以认定为是不同的训练数据,并且,虽然一阶特征向量不同,但所包含的多组特征数据是相同的,均可以对应该种配煤方式的炼焦质量数据,所以,所生成的多组训练数据均可以有效的用于炼焦预测模型的训练,增加了用于训练炼焦预测模型的训练数据,使用该多组训练数据对炼焦预测模型进行多次训练,相比使用原始样本特征数据进行一次训练,可以对炼焦预测模型进行更多次且更充分的训练,得到对炼焦质量预测的准确性更高的炼焦预测模型。
45、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
1.一种训练数据生成方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述将所述多组特征数据按照不同的顺序进行排列,分别组合成多个一阶特征向量,包括:
3.如权利要求1所述的方法,其特征在于,所述多个一阶特征向量的数量为所述多种单煤的数量的阶乘。
4.如权利要求1所述的方法,其特征在于,所述多个化验指标数据至少包括如下化验指标数据之二:
5.一种炼焦预测模型训练方法,其特征在于,包括:
6.如权利要求5所述的方法,其特征在于,所述多组训练数据的数量为所述多种单煤的数量的阶乘。
7.一种训练数据生成装置,其特征在于,包括:
8.一种炼焦预测模型训练装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现权利要求1-4任一所述的方法,或者,实现权利要求5-6任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法,或者,实现权利要求5-6任一所述的方法。
