本发明涉及电力负荷预测领域,具体涉及一种多模型融合的电力日负荷在线预测方法。
背景技术:
1、随着社会经济的发展和生活水平的提高,电力需求呈现出日益增长的趋势;尤其是在高峰时段,电力负荷的波动对电网的稳定性提出了更高的要求;日负荷预测是电力系统管理中的一项关键任务,它涉及对未来一天内电力负荷的预测,以确保电力供应的可靠性和稳定性;准确的日负荷预测不仅能帮助电力公司有效调度电力资源,还能优化电网运行,提高能源使用效率,降低运营成本。
技术实现思路
1、本发明的技术问题是:
2、随着机器学习和深度学习技术的迅速发展,越来越多的预测模型被引入到负荷预测领域,这些模型的实际应用效果因为数据质量、模型参数选择以及计算复杂度等因素,对电力负荷预测可靠性和稳定性造成了影响。
3、本发明的目的是解决上述问题,提出了一种多模型融合的电力日负荷在线预测方法;具体包括:采用自编码器和移动平均完善数据集,采用统一信息系数提取高相关性特征,采用徒步优化算法实现kelm模型参数选择,利用kelm模型确定单日负荷预测,基于滚动策略获取次日预测结果,最后运用多指标评估模型预测结果。
4、本发明的技术方案为:
5、一种多模型融合的电力日负荷在线预测方法,包括以下步骤:s1: 采用自编码器对采集的历史日负荷数据进行异常值检测,并利用移动平均对异常值填补,得到初始数据集d1;
6、s2: 采用统一信息系数提取数据集d1中电力负荷的特征信息,得到输入数据集d2;
7、s3: 将输入数据集d2按固定比例划分为训练集、测试集和验证集,利用训练集和徒步优化算法实现kelm模型参数选择,并利用kelm模型确定单日负荷预测;
8、s4: 保持样本规模不变,采用滚动策略更新输入数据集d2,重复步骤s1~s3,直至获取次日预测结果;
9、s5: 采用多指标评估预测结果,并基于预测结果同步调整初始参数。
10、进一步的,在步骤s1中,由于采集系统故障和传输延迟等问题,数据库中的数据存在异常值,采用自编码器进行检测,具体包括编码器训练、重构误差计算和异常值检测;
11、优选的,自编码器对异常值检验原理如下:
12、1)编码器用于将输入数据映射到低维表示,解码器用于将低维表示还原到原始数据空间;
13、2)以输入数据和重构数据之间的差异最小化为目标,使用均方误差作为损失函数,完成训练过程;
14、3)采用自编码器对新的数据进行编码和解码,计算每个数据点的重构误差;
15、4)比较重构误差与阈值,判断异常值。
16、优选的,在步骤s1中,采用移动平均对检测的异常值填补,公式如下所示:
17、
18、式中, ot为待插补数据, r为时间窗口数据规模, oi为窗口内已知数据。
19、进一步的,在步骤s2中,采用统一信息系数提取电力负荷的特征信息,包括以下子步骤:
20、s21: 互信息计算:
21、
22、式中,为互信息, p( x, y)为联合概率分布函数; p( x)和 p( y)分别为 x和 y的边缘概率分布函数, x和 y分别为两组特征向量, x和 y为特征向量 x和 y对应的元素。
23、s22:变量划分:
24、
25、
26、式中, lx和 ly分别为 x与 y的分区单元长度; xmax与 xmin分别为变量 x的最大值与最小值; ymax与 ymin分别为变量 y的最大值与最小值; m与 n分别为 x与 y的分段数;为分区网格大小; k表示样本大小。
27、s23:统一信息系数计算:
28、
29、式中,表示统一信息, m与 n分别为 x与 y的分段数,min表示取最小值。
30、进一步的,在步骤s3中,训练集用于模型学习数据的模式和特征,调整模型内部参数;验证集测试模型防止过拟合;测试集用于最终评估模型的性能,检验模型在全新、未见数据上的泛化能力。
31、优选的,徒步优化方法以tobler徒步函数为前提,通过考虑地形的高程和行走距离来确定徒步旅行者的步行速度,包括:
32、1)对徒步旅行者位置初始化,并评估最佳徒步旅行者位置,并定义为领队;
33、2)根据地形坡度计算徒步旅行者初始速度,包括如下计算公式:
34、
35、
36、式中, dh和 dx分别表示徒步旅行者所走的海拔和水平距离,为地形的倾斜角度,是徒步旅行者 i在第 t次迭代的速度;为地形的坡度, e为自然对数函数的底数。
37、3)通过旅行者群体的社会思维和个体旅行者的个人认知更新徒步旅行者速度,具体如下:
38、
39、式中,为[0,1]中的随机数;为旅行者i在第t次迭代的速度;是领队的位置;为旅行者i在第t次迭代的位置;是旅行者i的扫描因子,并且扫描因子处于[1,2]中,扫描因子确保旅行者不会偏离领队太远,这样他们就可以看到领队的方向,并接收到领队的信号。
40、4)对徒步旅行者位置更新,具体如下:
41、
42、式中,为旅行者 i在第 t+1次迭代的位置;
43、5)更新徒步旅行者群体适应度值,并进行迭代收敛判断,一旦当前迭代次数达到最大迭代次数,迭代过程结束。
44、优选的,kelm模型包括elm模型和核函数,包括:
45、1)elm预测输出 f( x)表示如下:
46、
47、式中, q为输入向量, h( q)为隐藏节点输出矩阵,表示输出权重;
48、2)引入正则化系数和单位矩阵,转化求解过程,则输出权值的最小二乘解为:
49、
50、式中, g为目标向量,为的最小二乘解, i为单位矩阵, c表示正则化系数。
51、3)将随机映射更改为核映射,核矩阵表达式如下:
52、
53、式中,为核元素,为核函数, qi和 qj表示实验输入向量。
54、4)核函数选择高斯核函数,公式如下:
55、
56、式中,为核参数, qi和 qj表示实验输入向量, exp为自然指数函数。
57、5)最终输出为:
58、
59、式中, n为样本数量, i为单位矩阵, c为正则化系数, k为核函数,为核元素, t为转置符, g为目标向量,为 kelm输出。
60、进一步的,在步骤s4中,输入数据集时间范围为第 d日至第 d+ n日负荷数据,预测目标为第 d+ n+1日负荷数据。随着数据集的不断增大,采用滚动策略更新输入数据集的时间范围为第 d+1第 d+ n+1日负荷数据,预测目标相应为第 d+ n+2日负荷数据,以兼顾模型训练时间和保持模型的泛化性,包括如下表示:
61、
62、式中, d为一日,包含多个采样时刻, n为样本数量, yd、 yd+1、 yd+2、 yd+n、 yd+n+1分别表示为第 d、第 d+1、第 d+2、第 d+ n和第 d+ n+1日的负荷。
63、进一步的,在步骤s5中,采用多指标评估模型预测结果,包括均方根误差、可解释方差得分和平均绝对百分比误差,包括:
64、1)均方根误差:
65、
66、式中,为均方根误差, n表示样本容量;为真实值;为预测值;
67、2)可解释方差得分
68、
69、式中,为可解释方差得分,var(·)为方差;
70、3)平均绝对百分比误差
71、
72、式中:为平均绝对百分比误差, n表示样本容量;为真实值;为预测值。
73、优选的,均方根误差用于衡量预测值与真实值之间的偏移程度,取值范围为,数值越小表示模型的预测误差越小,模型的预测能力越强;可解释方差得分的取值为0~1,当evs为1时,表示模型完美预测了数据;反之,表示模型对数据的解释程度越小。平均绝对百分误差取值范围为,mape大于100%为劣质模型,反之,表明模型具有较高的预测精度。
74、相比现有技术,本发明的有益效果包括:
75、1)本发明公开了基于多模型融合的电力日负荷在线预测方法,采用自编码器和移动平均完善初始数据集,利用统一信息系数提取高相关性输入特征,并采用徒步优化算法实现kelm模型参数选择,利用kelm模型确定单日负荷预测,基于滚动策略获取次日预测结果,最后运用多指标评估模型预测结果;
76、2)考虑到数据采集与传输过程中不可避免存在误差,导致采集数据与真实数据存在少量偏移,本发明的基于自编码器的数据识别策略可有效捕获数据中的异常值,有效规避了数据漏检和误检;
77、3)不同日负荷序列间具有相似的变化规律,即存在日周期性,本发明的采用移动平均的插补技术可实现插补后序列同样具有相似的周期性;
78、4)不同于常见的相关系数,本发明的统一信息系数可衡量变量之间的线性相关性和非线性相关性,且对噪声数据具有一定的鲁棒性,有利于实现特征变量提取;
79、5)本发明以徒步优化算法对预测模型进行参数选择,提高了kelm模型的预测精度和处理非线性问题的能力,具有较高的适应性和稳定性;
80、6)现有预测模型往往通过一次训练实现对未来负荷需求的预测,忽视了负荷序列随社会发展而动态变化的特性,本发明在保持样本规模的基础上实时更新输入数据集可降低计算负担,避免模型过拟合问题。
1.一种多模型融合的电力日负荷在线预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种多模型融合的电力日负荷在线预测方法,在步骤s1中,所述的自编码器对采集的历史日负荷数据进行异常值检测,包括编码器训练、重构误差计算和异常值检测。
3.根据权利要求1所述的一种多模型融合的电力日负荷在线预测方法,在步骤s2中,所述的采用统一信息系数提取电力负荷的特征信息,包括以下子步骤:
4.根据权利要求1所述的一种多模型融合的电力日负荷在线预测方法,在步骤s3中,其特征在于,所述的徒步优化算法包括:
5.根据权利要求1所述的一种多模型融合的电力日负荷在线预测方法,在步骤s3中,其特征在于,所述的kelm模型包括elm模型和核函数,包括:
6.根据权利要求1所述的一种多模型融合的电力日负荷在线预测方法,在步骤s4中,其特征在于,获取次日预测结果的方法为:原始样本规模为n,时间范围d~d+n,采用滚动策略更新特征数据集d2,具体过程为去掉d2中时间为第d日的负荷数据,在d2末端增加时间为第d+n+1日的负荷数据,更新的计算式为:
7.根据权利要求1所述的一种多模型融合的电力日负荷在线预测方法,在步骤s5中,其特征在于,采用步骤s4的负荷预测结果评估模型的预测精度,具体包括:
8.一种多模型融合的电力日负荷在线预测系统,其特征在于,包括: