1.本发明属于新能源发电技术领域,特别是涉及了一种基于相似日理论和改进极限学习机的光伏功率预测方法。
背景技术:
2.随着经济的快速发展,全国各地用电量也随之增长,但配电网的建设投入仍远远滞后于当前网络负荷的增长,导致部分地区电力供应紧张,甚至影响系统的运行安全。光伏发电具有清洁和可再生的特点,其并网大大减轻了配电网负荷高速增长带来的困难,并在一定程度上提高了配电网的供电能力;但各种外在因素都会不同程度地影响光伏发电,使其具有随机、间歇和波动的特点。若光伏大规模并入电网,则可能会对电网系统造成冲击,进而影响电网系统的稳定性,因此对光伏发电功率进行精确预测对于保障电网系统稳定性重要意义。
技术实现要素:
3.针对目前光伏发电的不稳定性的特点,对电网安全稳定运行产生了挑战,本发明提供了一种基于相似日理论和改进极限学习机的光伏功率预测方法。
4.本发明采用的技术方案如下:
5.一种基于相似日理论和改进极限学习机的光伏功率预测方法,其特征在于:包括以下步骤:
6.步骤1:将数据集采用adaboost分类方法对数据进行预处理,去除错误数据;
7.步骤2:对步骤1预处理后的数据集采用皮尔森系数法计算出天气类型影响光伏发电的相关系数,并选取出影响光伏发电的主要天气类型;
8.步骤3:采用k-nn结合核fisher的方法对数据集按照天气类型进行分类,首先采用k-nn对数据进行首次分类,对不能进行分类的数据采用核fisher的方法进行再次分类;
9.步骤4:采用改进的极限学习机按照不同天的天气类型进行光伏功率预测。
10.进一步地,所述步骤1中采用的采用adaboost分类方法包括:
11.从数据集中选择两种数据类型,分别为正数xi和负数xj,并组成样本序列s:
12.s={xi,xj}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
13.初始化两类样本的初始权重,设两类负荷样本总数为m,初始化权重:
[0014][0015]
对于第t个弱分类器,根据分类错误样本的权重计算该分类器的分类误差,即
[0016]et
=∑
l∈ldt
(l)
ꢀꢀ
l={l|g
t
(l)≠s(l)}
ꢀꢀꢀꢀꢀꢀ
(3)
[0017]
式(3)中:l为分类错误样本;l为分类错误样本集合;g
t
(l)为第t个弱分类器的分类结果;s(l)为期望结果;
[0018]
求解第t个弱分类器的权重:
[0019][0020]
调整样本权重:
[0021][0022][0023]
式(6)中:b
t
为归一化因子;
[0024]
重复以上步骤,直至归档数目的弱分类器训练完,得到样本i和样本j的最终权重d
ij
。
[0025]
改变样本类别,重复以上步骤,完成数据之间的权重计算,从而将异常数据进行剔除。
[0026]
进一步地,所述步骤2中通过公式(7)的皮尔森相关系数数学模型计算相关系数:
[0027][0028]
式(7)中,r为相关系数;n为某个天气因素计算数据的个数;x为天气因素,天气因素包括光照辐射度、温度、相对湿度以及风速;y为光伏发电功率;和分别表示2个变量的均值。
[0029]
进一步地,所述步骤3中采用的k-nn结合核fisher分类算法包括:
[0030]
对待测数据样本x`={x`1,x`2,
…
,x`n},计算其到含有m个样本的训练集中所有样本之间的特征距离:
[0031][0032]
根据di大小从m个训练集样本中选出与待测样本距离最近的k个训练样本;
[0033]
根据误判风险险设定风险控制阈值k0,取k0=βk,其中β为风险系数,β∈[0.8,0.9],设选出的k个近邻中数量最多的负荷类别的样本个数为k1,当k1≥k0时,判定待测样本为该类别;否则当k1<k0时,说明k个近邻中存在较多其他类别天气类型,此时待测样本最有可能属于数量最多的两类天气中的一种;记k个近邻中数量最多的两类样本分别为s1={x
11
,x
12
,
…
,x
1p
}和s2={x
21
,x
22
,
…
,x
2p
};
[0034]
将s1和s2作为训练样本,由核fisher判别算法对待测样本进行进一步识别:
[0035]
设是将负荷样本x映射到高维投影空间的非线性函数,则有是将负荷样本x映射到高维投影空间的非线性函数,则有是将负荷样本x映射到高维投影空间的非线性函数,则有在高维投影空间中对s1和s2两类负荷样本再进行fisher投影:
[0036][0037]
式(9)将s1和s2投影到直线上的集合分别为y1和y2,且根据y1和y2计算出分类阈值
y0;
[0038]
将待测样本x`映射到高维投影空间并对其进行fisher投影,得到将待测样本的投影值y与分类阈值y0进行比较,得出待测样本的类别。
[0039]
进一步地,所述步骤4中采用的改进极限学习机包括:
[0040]
(1)初始化一个有l0个隐节点的单隐层前向神经网络,l0为一个人为设定小的正整数;
[0041]
(2)计算隐藏层输出矩阵h1;
[0042]
(3)计算相应残差e(h1);
[0043]
(4)设置k=0,ε=0.01,当且e(hk)>ε,进行以下迭代:k=k+1;随机增加δl
k-1
个隐节点,总隐节点数目为:lk=l
k-1
+δl
k-1
,相应隐藏层输出矩阵h
k+1
=[hk,δhk];计算残差e(h
k+1
);
[0044]
迭代结束后,确定极限学习机隐藏层神经元的数目。
[0045]
本发明的优点和有益效果:
[0046]
针对目前光伏发电的不稳定性的特点,对电网安全稳定运行产生了挑战,本发明提供了一种基于相似日理论和改进极限学习机的光伏功率预测方法。首先运用皮尔森系数法计算出与光伏功率相关的天气情况,然后根据计算出的天气情况运用聚类算法进行天气情况的聚类分析。采用三种聚类方法组合的方式对天气类型数据进行聚类,提升了算法聚类的能力和精准度,为光伏预测的准确性提供了保障。首先采用adaboost的算法对数据进行第一次分类,可以基本剔除冗余数据,在采用k-nn的方法对数据进行第二次分类,可以将数据大致分类,对于k-nn不能分类的数据,采用核fisher的方法将数据进行最后一次分类,这样可以彻底将数据分类。对于分类过后的数据,可以根据预测日的天气状况选取相应的数据集通过改进的极限学习机进行预测,由于极限学习机的隐含层个数为人为根据经验选取,所以其结构会对拟合性能造成一定的影响,所以采用误差最小极限学习机首先确定好隐含层的个数再进行预测,从而提高了预测的精度。本发明同时兼顾配电网安全性、经济性和合理性要求,具有显著的理论意义与实践价值。
附图说明
[0047]
图1为本发明的方法的流程图;
[0048]
图2为本发明步骤1adaboost算法示意图。
具体实施方式
[0049]
下面结合附图对本发明进行详细描述:
[0050]
如图1所示,一种具于相似日理论和改进极限学习机的光伏功率预测方法,包括以下步骤:
[0051]
步骤1:将数据集采用adaboost分类方法对数据进行预处理,去除错误数据。
[0052]
步骤2:采用皮尔森系数法计算出天气类型影响光伏发电的相关系数,并选取出影响光伏发电的主要天气类型。
[0053]
步骤3:采用k-nn结合核fisher的方法对数据集按照天气类型进行分类,首先采用
k-nn对数据进行首次分类,对不能进行分类的数据采用核fisher的方法进行再次分类。
[0054]
步骤4:采用改进的极限学习机按照不同天的天气类型进行光伏功率预测。
[0055]
如图2所示,adaboost算法是一种通过训练多个弱分类器,合成形成强分类器的算法,各个弱分类器由于分类性能不强,只能对类域内样本正确识别,类域边界样本则会识别错误。在弱分类器的逐一训练过程中,会不断增加识别错误样本的权重,减小识别正确样本的权重。当各弱分类器训练完成后,根据样本的权重即可筛选出类域边界样本。即权重越大表示样本越容易发生误判,该样本即属于类域边界样本,权重小的样本则为类域内样本。其过程如下:
[0056]
从数据集中选择两种数据类型,分别为正数xi和负数xj,并组成样本序列s。
[0057]
s={xi,xj}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0058]
初始化两类样本的初始权重,设两类负荷样本总数为m,那么初始化权重:
[0059][0060]
对于第t个弱分类器,根据分类错误样本的权重计算该分类器的分类误差,即
[0061]et
=∑
l∈ldt
(l)
ꢀꢀ
l={l|g
t
(l)≠s(l)}
ꢀꢀꢀꢀꢀ
(3)
[0062]
式(3)中:l为分类错误样本;l为分类错误样本集合;g
t
(l)为第t个弱分类器的分类结果;s(l)为期望结果。
[0063]
求解第t个弱分类器的权重:
[0064][0065]
调整样本权重:
[0066][0067][0068]
式(6)中:b
t
为归一化因子。
[0069]
重复以上步骤,直至归档数目的弱分类器训练完,得到样本i和j的最终权重d
ij
。
[0070]
改变样本类别,重复以上步骤,完成数据之间的权重计算,从而将异常数据进行剔除。
[0071]
所述步骤2中采用皮尔森计算相关系数的主要内容如下:
[0072]
为了更好的结合天气因素对数据更好的进行聚类,本发明首先采用皮尔森相关系数法计算出各种天气类型影响光伏出力的相关系数的大小,选取对光伏发电出力影响较大的天气因素构建天气特征向量。
[0073]
皮尔森相关系数数学模型如下:
[0074][0075]
式(7)中,r为相关系数;n为某个天气因素计算数据的个数;x为天气因素,如光照辐射度、温度、相对湿度、风速等;y为光伏发电功率;和分别表示2个变量的均值。
[0076]
进一步地,所述步骤3中采用的k-nn结合核fisher分类算法主要内容如下:
[0077]
首先采用k-nn分类方法对数据进行第一次分类,但该方法容易发生误判,因此采用k-nn结合核fisher的方法增强对不同天气类型的数据的识别能里以及对k值的鲁棒性。
[0078]
对待测数据样本x`={x`1,x`2,
…
,x`n},计算其到含有m个样本的训练集中所有样本之间的特征距离,即
[0079][0080]
根据di大小从m个训练集样本中选出与待测样本距离最近的k个训练样本。
[0081]
根据误判风险险设定风险控制阈值k0(可取k0=βk,其中β为风险系数,可取β∈[0.8,0.9]),设选出的k个近邻中数量最多的负荷类别的样本个数为k1,当k1≥k0时,判定待测样本为该类别;否则当k1<k0时,说明k个近邻中存在较多其他类别天气类型,此时待测样本最有可能属于数量最多的两类天气中的一种。记k个近邻中数量最多的两类样本分别为s1={x
11
,x
12
,
…
,x
1p
}和s2={x
21
,x
22
,
…
,x
2p
}。
[0082]
将s1和s2作为训练样本,由核fisher判别算法对待测样本进行进一步识别。
[0083]
设是将负荷样本x映射到高维投影空间的非线性函数,则有是将负荷样本x映射到高维投影空间的非线性函数,则有是将负荷样本x映射到高维投影空间的非线性函数,则有这样在高维投影空间中对s1和s2两类负荷样本再进行fisher投影:
[0084][0085]
式(9)将s1和s2投影到直线上的集合分别为y1和y2,且根据y1和y2可计算出分类阈值y0。
[0086]
将待测样本x`映射到高维投影空间并对其进行fisher投影,得到将待测样本的投影值y与阈值y0进行比较,即可得出待测样本的类别。
[0087]
如图2所示,极限学习机是一种新型的单隐层前向神经网络,用来训练单隐藏层前馈神经网络(slfn),与传统的slfn训练算法不同,极限学习机随机选取输入层权重和隐藏层偏置,输出层权重通过最小化由训练误差项和输出层权重范数的正则项构成的损失函数并依据moore-penrose(mp)广义逆矩阵理论计算解析求出。elm的理论和应用被广泛研究,从学习效率的角度来看,极限学习机具有训练参数少、学习速度快、泛化能力强的优点。
[0088]
但是极限学习机的隐藏层个数通常根据经验随机确定,这使得其拟合性能在一定程度上受到网络结构的影响,因此本发明运用误差最小极限学习机来确定极限学习机的结构,其过程如下:
[0089]
(1)初始化一个有l0个隐节点的单隐层前向神经网络,l0为一个人为设定小的正整数;
[0090]
(2)计算隐藏层输出矩阵h1;
[0091]
(3)计算相应残差e(h1);
[0092]
(4)设置k=0,ε=0.01,当且e(hk)>ε,进行以下迭代:
①k=k+1;
②
随机增加δl
k-1
个隐节点,总隐节点数目为:lk=l
k-1
+δl
k-1
,相应隐藏层输出矩阵h
k+1
=[hk,δhk];
③
计算残差e(h
k+1
);
[0093]
迭代结束后,确定了极限学习机隐藏层神经元的数目。
技术特征:
1.一种基于相似日理论和改进极限学习机的光伏功率预测方法,其特征在于:包括以下步骤:步骤1:将数据集采用adaboost分类方法对数据进行预处理,去除错误数据;步骤2:对步骤1预处理后的数据集采用皮尔森系数法计算出天气类型影响光伏发电的相关系数,并选取出影响光伏发电的主要天气类型;步骤3:采用k-nn结合核fisher的方法对数据集按照天气类型进行分类,首先采用k-nn对数据进行首次分类,对不能进行分类的数据采用核fisher的方法进行再次分类;步骤4:采用改进的极限学习机按照不同天的天气类型进行光伏功率预测。2.按照权利要求1所述的方法,其特征在于,所述步骤1中采用的采用adaboost分类方法包括:从数据集中选择两种数据类型,分别为正数x
i
和负数x
j
,并组成样本序列s:s={x
i
,x
j
}
ꢀꢀꢀ
(1)初始化两类样本的初始权重,设两类负荷样本总数为m,初始化权重:对于第t个弱分类器,根据分类错误样本的权重计算该分类器的分类误差,即e
t
=∑
l∈l
d
t
(l) l={l|g
t
(l)≠s(l)}
ꢀꢀꢀ
(3)式(3)中:l为分类错误样本;l为分类错误样本集合;g
t
(l)为第t个弱分类器的分类结果;s(l)为期望结果;求解第t个弱分类器的权重:调整样本权重:调整样本权重:式(6)中:b
t
为归一化因子;重复以上步骤,直至归档数目的弱分类器训练完,得到样本i和样本j的最终权重d
ij
。改变样本类别,重复以上步骤,完成数据之间的权重计算,从而将异常数据进行剔除。3.按照权利要求1所述的方法,其特征在于,所述步骤2中通过公式(7)的皮尔森相关系数数学模型计算相关系数:式(7)中,r为相关系数;n为某个天气因素计算数据的个数;x为天气因素,天气因素包括光照辐射度、温度、相对湿度以及风速;y为光伏发电功率;和分别表示2个变量的均值。
4.按照权利要求1所述的方法,其特征在于,所述步骤3中采用的k-nn结合核fisher分类算法包括:对待测数据样本x`={x`1,x`2,
…
,x`
n
},计算其到含有m个样本的训练集中所有样本之间的特征距离:根据d
i
大小从m个训练集样本中选出与待测样本距离最近的k个训练样本;根据误判风险险设定风险控制阈值k0,取k0=βk,其中β为风险系数,β∈[0.8,0.9],设选出的k个近邻中数量最多的负荷类别的样本个数为k1,当k1≥k0时,判定待测样本为该类别;否则当k1<k0时,说明k个近邻中存在较多其他类别天气类型,此时待测样本最有可能属于数量最多的两类天气中的一种;记k个近邻中数量最多的两类样本分别为s1={x
11
,x
12
,
…
,x
1p
}和s2={x
21
,x
22
,
…
,x
2p
};将s1和s2作为训练样本,由核fisher判别算法对待测样本进行进一步识别:设是将负荷样本x映射到高维投影空间的非线性函数,则有是将负荷样本x映射到高维投影空间的非线性函数,则有是将负荷样本x映射到高维投影空间的非线性函数,则有在高维投影空间中对s1和s2两类负荷样本再进行fisher投影:式(9)将s1和s2投影到直线上的集合分别为y1和y2,且根据y1和y2计算出分类阈值y0;将待测样本x`映射到高维投影空间并对其进行fisher投影,得到将待测样本的投影值y与分类阈值y0进行比较,得出待测样本的类别。5.按照权利要求1所述的方法,其特征在于,所述步骤4中采用的改进极限学习机包括:(1)初始化一个有l0个隐节点的单隐层前向神经网络,l0为一个人为设定小的正整数;(2)计算隐藏层输出矩阵h1;(3)计算相应残差e(h1);(4)设置k=0,ε=0.01,当且e(h
k
)>ε,进行以下迭代:k=k+1;随机增加δl
k-1
个隐节点,总隐节点数目为:l
k
=l
k-1
+δl
k-1
,相应隐藏层输出矩阵h
k+1
=[h
k
,δh
k
];计算残差e(h
k+1
);迭代结束后,确定极限学习机隐藏层神经元的数目。
技术总结
本发明涉及了一种基于相似日理论和改进极限学习机的光伏功率预测方法,包括:将数据集采用AdaBoost分类方法对数据进行预处理,去除错误数据;采用皮尔森系数法计算出天气类型影响光伏发电的相关系数,并选取出影响光伏发电的主要天气类型;采用k-NN结合核Fisher的方法对数据集按照天气类型进行分类,首先采用k-NN对数据进行首次分类,对不能进行分类的数据采用核Fisher的方法进行再次分类;采用改进的极限学习机按照不同天的天气类型进行光伏功率预测。本发明同时兼顾安全性和合理性的要求,有助于电力调度部门准确合理地安排电网运行方式以减少调度偏差,提高电网安全稳定运行。行。行。
技术研发人员:马艳娟 白佳庆 张东 崔馨元 宁兆秋 李旭东 崔铭 宋世巍 王健 姜河 齐畅
受保护的技术使用者:沈阳工程学院
技术研发日:2022.02.08
技术公布日:2022/5/25
转载请注明原文地址:https://tc.8miu.com/read-22534.html