1.本发明涉及电量预测领域,特别涉及一种台区用电量预测方法。
背景技术:
2.随着社会的发展和人民生活水平的不断提高,对电能的需求越来越大。由于电能生产和消费的同时性,需要合理规划电能的生产,才能使其满足消费;
3.用电量预测是一段时间内电力系统的负荷消耗电能总量的预报,用电量预测是电网公司制定生产综合计划制定经营计划的关键基础,合理准确的预测结论会给公司的经营决策带来正向效应,反之就会导致公司经营策略的背离,因此对未来季度或者年度的用电量预测显得至关重要;
4.现有的用电量预测方法预测未来用电量数据时,需要先对温度数据进行预测,而温度数据与季节变化相关,容易出现误差;而且节假日数据需要区分阳历和阴历,每年阴历节假日存在区别,在进行历史数据对比时也容易出现误差,为此,我们提出一种台区用电量预测方法。
技术实现要素:
5.本发明的主要目的在于提供一种台区用电量预测方法,可以有效解决背景技术中的问题。
6.为实现上述目的,本发明采取的技术方案为:
7.一种台区用电量预测方法,包括以下步骤:
8.①
、样本构造:获取数据样本,按照样本数据建立训练集和测试集;
9.②
、构建特征:对数据样本进行分析,构建多维特征;
10.③
、模型训练:利用lightgbm模型对训练集的样本数据进行训练;
11.④
、模型评估:利用训练后的lightgbm模型对测试集进行电量预测,校准lightgbm模型。
12.优选的,步骤
①
中获取数据样本包括以下步骤:
[0013]ⅰ、确定时间窗口,抽取以往时间窗口内台区电量相关数据;
[0014]ⅱ、对获取的数据进行数据修正,得到数据样本。
[0015]
优选的,步骤ⅱ中对获取的数据进行数据修正的步骤如下:
[0016]
对获取的台区电量相关数据按照不同的项目进行整理;
[0017]
构建各个项目的线性回归方程;
[0018]
将获取的偏离线性回归方程8%的数据剔除;
[0019]
采用线性回归方程中的数据替代剔除的数据。
[0020]
优选的,步骤ⅰ中获取的台区电量相关数据包括台区用户的用电量数据以及相关影响因子。
[0021]
优选的,所述相关影响因子包括温度、行业、节假日以及经济增长速度。
[0022]
优选的,步骤
①
中按照样本数据建立训练集和测试集时随机抽取时间窗口,对获取的样本数据进行抽取,抽取后形成的数据集为训练集和测试集,训练集和测试集的比例为2:8。
[0023]
优选的,步骤
②
中对数据样本进行分析时确定需要观察的时间长度,通过环比、同比、均值、方差统计量构建多维特征。
[0024]
优选的,步骤
③
中模型训练时将样本数据输入到lightgbm模型中进行模型训练,对lightgbm模型的参数进行优化。
[0025]
优选的,步骤
④
中利用训练后的lightgbm模型对测试集进行电量预测时输入测试集中记载的相关影响因子数据,预测该时间窗口内的用电量,并且将预测的用电量与测试集中记载的实际用电量进行比较。
[0026]
优选的,步骤
④
中对不同时间窗口的用电量进行预测,三次预测的用电量与测试集中记载的实际用电量比较结果差值超过10%时重新按照样本数据建立训练集和测试集,重新进行模型训练和模型评估。
[0027]
与现有技术相比,本发明一种台区用电量预测方法,具有如下有益效果:
[0028]
其一、本发明一种台区用电量预测方法中lightgbm模型无需考虑数据不同时间段的趋势变化,lightgbm融合多个特征,排除了不同类别数据建模对模型预测精度带来的影响;
[0029]
其二、本发明一种台区用电量预测方法对于绝大部分用户用电量预测,对于普通用电量用户的电量预测更为精准,对于大电量用户用电量的预测有进一步优化的空间,具有良好的使用价值;
[0030]
其三、本发明一种台区用电量预测方法获取的数据样本精准,而且反复校准,反复验证,预测的准确性高,使用效果好,能够大规模推广应用。
附图说明
[0031]
图1为本发明一种台区用电量预测方法的流程图。
具体实施方式
[0032]
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
[0033]
实施例
[0034]
一种台区用电量预测方法,包括以下步骤:
[0035]
①
、样本构造:获取数据样本,按照样本数据建立训练集和测试集;
[0036]
获取数据样本包括以下步骤:
[0037]ⅰ、确定时间窗口,抽取以往时间窗口内台区电量相关数据;
[0038]ⅱ、对获取的数据进行数据修正,得到数据样本。
[0039]
步骤ⅱ中对获取的数据进行数据修正的步骤如下:
[0040]
对获取的台区电量相关数据按照不同的项目进行整理;
[0041]
构建各个项目的线性回归方程;
[0042]
将获取的偏离线性回归方程8%的数据剔除;
[0043]
采用线性回归方程中的数据替代剔除的数据。
[0044]
在具体应用场景中,对获取的台区电量相关数据按照不同的项目进行整理即按照用电量和相关影响因子对台区不同年份时间窗口的数据进行分类;
[0045]
例如项目为用电量,将所有台区不同年份该时间窗口内的用电量数据归纳在一起。
[0046]
获取的台区电量相关数据包括台区用户的用电量数据以及相关影响因子。
[0047]
相关影响因子包括温度、行业、节假日以及经济增长速度。
[0048]
在具体应用场景中,相关影响因子还包括人流量数据等数据。
[0049]
在具体应用场景中,时间窗口认为设定,为一个台区在每年的一个时间段,获取数据时获取台区以往每年该时间窗口内的台区电量相关数据。
[0050]
按照样本数据建立训练集和测试集时随机抽取时间窗口,对获取的样本数据进行抽取,抽取后形成的数据集为训练集和测试集,训练集和测试集的比例为2:8。
[0051]
在具体应用场景中,训练集和测试集的比例可以根据调整,获取的数据多时,能够增加训练集的比例。
[0052]
②
、构建特征:对数据样本进行分析,构建多维特征;
[0053]
对数据样本进行分析时确定需要观察的时间长度,通过环比、同比、均值、方差统计量构建多维特征。
[0054]
在具体应用场景中,还可以用现有常用的统计量构建多维特征。
[0055]
③
、模型训练:利用lightgbm模型对训练集的样本数据进行训练;
[0056]
模型训练时将样本数据输入到lightgbm模型中进行模型训练,对lightgbm模型的参数进行优化。
[0057]
④
、模型评估:利用训练后的lightgbm模型对测试集进行电量预测,校准lightgbm模型;
[0058]
利用训练后的lightgbm模型对测试集进行电量预测时输入测试集中记载的相关影响因子数据,预测该时间窗口内的用电量,并且将预测的用电量与测试集中记载的实际用电量进行比较;
[0059]
对不同时间窗口的用电量进行预测,三次预测的用电量与测试集中记载的实际用电量比较结果差值超过10%时重新按照样本数据建立训练集和测试集,重新进行模型训练和模型评估,采用用电量与测试集中记载的实际用电量比较结果差值低于10%的模型预测用电量。
[0060]
需要说明的是,模型训练时确定需要观察的时间长度,然后抽取数据,构建样本特征,把实际电量作为预测目标与特征一起输入模型,设置模型参数,进行训练模型;
[0061]
本台区用电量预测方法预测时以当前时刻和最近连续两个时刻的数据预测下一时刻的用电量;
[0062]
本发明一种台区用电量预测方法中lightgbm模型无需考虑数据不同时间段的趋势变化,lightgbm融合多个特征,排除了不同类别数据建模对模型预测精度带来的影响;
[0063]
本发明一种台区用电量预测方法对于绝大部分用户用电量预测,对于普通用电量用户的电量预测更为精准,对于大电量用户用电量的预测有进一步优化的空间,具有良好的使用价值;
[0064]
本发明一种台区用电量预测方法获取的数据样本精准,而且反复校准,反复验证,预测的准确性高,使用效果好,能够大规模推广应用。
[0065]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其效物界定。
技术特征:
1.一种台区用电量预测方法,其特征在于:包括以下步骤:
①
、样本构造:获取数据样本,按照样本数据建立训练集和测试集;
②
、构建特征:对数据样本进行分析,构建多维特征;
③
、模型训练:利用lightgbm模型对训练集的样本数据进行训练;
④
、模型评估:利用训练后的lightgbm模型对测试集进行电量预测,校准lightgbm模型。2.根据权利要求1所述的一种台区用电量预测方法,其特征在于:步骤
①
中获取数据样本包括以下步骤:ⅰ、确定时间窗口,抽取以往时间窗口内台区电量相关数据;ⅱ、对获取的数据进行数据修正,得到数据样本。3.根据权利要求2所述的一种台区用电量预测方法,其特征在于:步骤ⅱ中对获取的数据进行数据修正的步骤如下:对获取的台区电量相关数据按照不同的项目进行整理;构建各个项目的线性回归方程;将获取的偏离线性回归方程8%的数据剔除;采用线性回归方程中的数据替代剔除的数据。4.根据权利要求3所述的一种台区用电量预测方法,其特征在于:步骤ⅰ中获取的台区电量相关数据包括台区用户的用电量数据以及相关影响因子。5.根据权利要求4所述的一种台区用电量预测方法,其特征在于:所述相关影响因子包括温度、行业、节假日以及经济增长速度。6.根据权利要求5所述的一种台区用电量预测方法,其特征在于:步骤
①
中按照样本数据建立训练集和测试集时随机抽取时间窗口,对获取的样本数据进行抽取,抽取后形成的数据集为训练集和测试集,训练集和测试集的比例为2:8。7.根据权利要求6所述的一种台区用电量预测方法,其特征在于:步骤
②
中对数据样本进行分析时确定需要观察的时间长度,通过环比、同比、均值、方差统计量构建多维特征。8.根据权利要求7任一所述的一种台区用电量预测方法,其特征在于:步骤
③
中模型训练时将样本数据输入到lightgbm模型中进行模型训练,对lightgbm模型的参数进行优化。9.根据权利要求8所述的一种台区用电量预测方法,其特征在于:步骤
④
中利用训练后的lightgbm模型对测试集进行电量预测时输入测试集中记载的相关影响因子数据,预测该时间窗口内的用电量,并且将预测的用电量与测试集中记载的实际用电量进行比较。10.根据权利要求9所述的一种台区用电量预测方法,其特征在于:步骤
④
中对不同时间窗口的用电量进行预测,三次预测的用电量与测试集中记载的实际用电量比较结果差值超过10%时重新按照样本数据建立训练集和测试集,重新进行模型训练和模型评估。
技术总结
本发明公开了一种台区用电量预测方法,包括以下步骤:样本构造:获取数据样本,按照样本数据建立训练集和测试集;构建特征:对数据样本进行分析,构建多维特征;模型训练:利用lightGBM模型对训练集的样本数据进行训练;模型评估:利用训练后的lightGBM模型对测试集进行电量预测。本发明所述的一种台区用电量预测方法,无需考虑数据不同时间段的趋势变化,lightGBM融合多个特征,排除了不同类别数据建模对模型预测精度带来的影响,而且对于普通用电量用户的电量预测更为精准,对于大电量用户用电量的预测有进一步优化的空间,具有良好的使用价值,获取的数据样本精准,而且反复校准,反复验证,预测的准确性高,具有良好的前景。具有良好的前景。具有良好的前景。
技术研发人员:彭娟 胡晓毅 宋迪 林静艳 彭锦
受保护的技术使用者:杭州致成电子科技有限公司
技术研发日:2022.02.11
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-18002.html