一种基于萤火虫优化和随机森林(FA-RF)的风光短期功率预测方法

    专利查询2025-05-28  46


    本发明提出一种基于萤火虫优化和随机森林(fa-rf)的风光短期功率预测方法。


    背景技术:

    1、在全球追求可持续发展的进程中,能源转型已成为当务之急。面对传统化石能源带来的环境污染、资源枯竭以及气候变化等严峻挑战,风能和太阳能作为清洁、可再生的能源形式,正迅速崛起并在能源领域占据日益重要的地位。

    2、随着风电场和光伏电站的大规模建设与并网,其输出功率的波动性和不确定性给电力系统的稳定运行和规划带来了巨大挑战。准确的风光短期功率预测对于电力系统的优化调度、经济运行以及保障供电可靠性至关重要。

    3、近年来,全球气候变化的影响愈发显著,极端天气事件频繁发生,这进一步加剧了风光资源的不稳定性。同时,电力市场的竞争日益激烈,对电力供应的质量和成本提出了更高要求。在这种情况下,提高风光短期功率预测的精度和可靠性,不仅能够有效减少电力系统的备用容量,降低运行成本,还能促进可再生能源的大规模消纳,推动能源结构的优化升级。

    4、传统的预测方法,如物理模型、经验模型和统计模型,主要基于历史数据和气象参数,通过数学公式或统计规律来预测风光功率。然而,这些方法在处理复杂多变的气象条件和非线性关系时存在局限。随着大数据、人工智能、云计算等新兴技术的快速发展,为风光短期功率预测提供了更强大的工具和手段。如决策树、支持向量机、神经网络、随机森林等,它们能够从大量历史数据中学习并捕捉复杂的非线性模式,挖掘出有价值的信息和规律,从而提高预测的准确性。然而,这些技术在实际应用中仍面临着数据质量、模型泛化能力、计算效率等方面的问题,需要进一步的研究和优化。

    5、此外,随着智能电网和能源互联网技术的不断发展,对风光功率的实时监测和精准预测成为实现能源高效管理和智能控制的关键环节。通过准确的短期功率预测,可以更好地协调各类能源的互补利用,提高能源利用效率,实现能源的智能化分配和供应。

    6、综上,开展风光短期功率预测方法的研究具有重要的理论意义和实际应用价值,对于保障能源安全、促进经济社会可持续发展以及推动能源领域的技术创新都具有不可忽视的作用。


    技术实现思路

    1、本发明要克服-现有技术的上述缺点,提出基于萤火虫优化的随机森林(fa-rf)算法的短期风光出力预测方法。

    2、本发明首先应用非参数核密度估计法对大量样本数据进行拟合,得到风、光的核密度估计表达式,在此基础上建立基于frank-copula函数的风、光电场出力联合分布模型,生成具有相关性的风、光出力场景,用于后续风、光出力预测。然后构建fa-rf预测模型,利用萤火虫算法优化随机森林模型的参数,提高预测的准确。最后将rf算法、lstm神经网络算法下的预测结果和误差与fa-rf算法下的预测结果和误差进行对比分析,验证fa-rf预测模型在短期风、光出力预测方面的预测精度更高。

    3、为了实现上述目的,本发明的技术方案为:

    4、一种基于萤火虫优化和随机森林(fa-rf)的风光短期功率预测方法,包括以下步骤:

    5、s1:采用非参数核密度估计方法对风、光的实测数据进行概率分布建模,得到风、光出力的核密度表达式;

    6、s2:研究copula理论,基于步骤s1中得的风、光出力的概率分布函数,利用frank-copula函数构建风光联合出力分布函数;

    7、s3:对通过步骤s2得到的风光出力的联合概率分布函数进行采样,并根据采样结果和风光的联合概率分布函数反变换得采样风机和光伏出力,从而生成考虑风光相关性和随机性的出力场景,并用于后续的风、光出力预测;

    8、s4:分别构建萤火虫算法(fa)参数优化模型和随机森林(rf)预测模型,通过萤火虫算法优化随机森林预测模型的参数,提高风、光出力的预测精度。

    9、s5:通过步骤s3中生成的考虑风光相关性和随机性的出力场景和步骤s4中建立的预测模型对风、光出力的短期变化趋势进行预测,并对结果进行对比分析,证明fa-rf预测模型具有更高的预测精度和更好的泛化能力。

    10、进一步,所述步骤s1中,采用非参数核密度估计方法对风、光的实测数据进行概率分布建模,得到风、光出力的核密度表达式包括以下步骤:

    11、s1-1:核密度估计法(kernel density estimation,kde)是一种在统计学中常见的非参数方法,用于估计随机变量的概率密度函数。该方法以核平滑应用于概率密度估计,通过将核函数放置在每个数据点上并求和来估计概率密度函数,即根据有限的数据样本对总体进行推断。常用的核函数有高斯核函数和矩形核函数。核函数通常选择高斯核函,高斯核函数的公式如式(1):

    12、

    13、式中,x是输入值,k(x)表示高斯核函数的值。

    14、使用核密度估计法计算时,可通过计算x邻域内各点对x的距离,分析各点对x的远近程度,进而确定这些点对估计值的贡献程度。设从x中抽取出的独立同分布样本为x1,x2,…,xn,f(x)为x符合的密度函数,x∈r,需计算点x处的概率密度函数估计值即:

    15、

    16、式中:n为样本数量,h为带宽,k(·)为核函数。

    17、通过核密度估计法直接对风电功率与光伏功率的数据展开非参数估计,进而获取它们各自的概率密度函数。

    18、根据式(1)、(2)可得到风、光出力的核密度表达式。

    19、再进一步,在所述步骤s2中,基于步骤s1,利用frank-copula函数构建风光联合出力分布函数具体步骤如下:

    20、s2-1:对于n个随机变量的联合分布,可以将其分解为这n个变量各自的边缘分布和-个copula函数,从而将变量的随机性和耦合性分离开来。其中,随机变量各自的随机性由边缘分布进行描述,随机变量之间的耦合特性由copula函数进行描述。

    21、假设x1,x2,…,xn是n个随机变量,它们各自的边缘分布分别为f1(x1),f2(x2),…,fn(xn),它们的联合分布为h(x1,x2,…,xn),则存在一个将边缘分布和联合分布“连接”起来的函数c(·),,使得:

    22、h(x1,x2,…,xn)=c(f1(x1),f2(x2),…,fn(xn))              (3)

    23、式中:n为变量个数;fi(xi)(i=1,2,…,n)为单个变量的边缘分布函数;c(·)为copula函数;h(x1,x2,…,xn)为n个变量的联合分布函数。

    24、s2-2:copula函数种类有很多,通常可分为椭圆copula函数和阿基米德(archimedean)copula函数。archimedean copula函数应用比较广泛,其中最常见的三种分别为gumbel copula函数、clayton copula函数和frank copula函数。clayton copula函数和gumbel copula函数通常只能描述变量之间的非负相关关系,二维frank copula函数要求最低,对相关性正负和程度均无限制,其分布函数如式(4):

    25、

    26、由式(4)可得到风光出力联合密度函数为概率密度函数如下:

    27、

    28、式中,u、v均为风光出力的边缘分布函数;θ为copula函数参数。

    29、在所述步骤s3中,通过步骤s2得到的风光联合出力分布函数,生成考虑风光相关性和随机性的出力场景,包括以下步骤:

    30、s3-1:基于frank copula函数场景生成的核心思路为:首先构建随机变量的边缘分布函数,由此搭建多元copula函数;再对frank copula函数离散化,将所得离散场景借边缘分布函数逆运算获取原联合分布函数场景。具体流程如下:

    31、(1)在[0,1]区间内随机产生数字a1,a2,…,an。

    32、(2)令第一个随机变量边缘分布函数值u1=a1,根据frank copula函数求得第二个随机变量边缘分布函数值u2,即求式(6)的解。

    33、

    34、(3)对于第n个随机变量的边缘分布函数值un,即求式(7)的解。

    35、

    36、(4)重复上述步骤(1)、(2)、(3)k次,则可以得到k组n个随机变量的边缘分布函数值。

    37、(5)利用反函数运算通过经验累积分布函数和样条插值等方法,将采样得到的数据(u1j,u2j,…,unj)转换为联合分布函数场景,其中j=1,2,…,t,t为总天数。

    38、通过以上计算,生成了充分考虑了风光出力的相关性的场景。

    39、在所述步骤s4中,通过萤火虫算法优化随机森林预测模型的参数,具体步骤如下:

    40、s4-1:随机森林(rf,random forest)是一种集成学习方法,它通过构建多个决策树并将它们的结果进行投票或平均,以得到最终的预测。这种方法的主要优点是通过集成多个模型,可以有效地处理过拟合问题,提高模型的泛化能力。

    41、随机森林(rf)通过创建数百个决策树(rt)来实现最终决策。随机森林模型采用“bagging”方法,将rt的结果组合在一起,并通过投票或平均获得峰值结果,提高了预测性能并降低了预测方差。式(8)给出了训练样本rn,包括输出变量和和具有m个特征的输入变量(x={x1,x2,…,xm})。

    42、在训练每个决策rt的过程中,从训练集中随机抽取n个样本,不进行替换。采样过程称为“bootstrap”,bootstrap样本集表示为此后,该算法对输入数据集进行划分,rt训练结束后,获得预测能力随机森林算法由k个不相关的rt组成,从而形成k个预测函数k的范围从1到k,是用于区分决策树的独立随机向量。

    43、由此,rf生成k个输出分别对应于每个rt,然后根据式(9)取这些输出的平均值,得到预测值y。

    44、rn={(x1,y1),(x2,y2),…,(xn,yn)}                    (8)

    45、

    46、随机森林的建模过程主要包括以下步骤:

    47、步骤一:从原始数据集中使用自助采样法(bootstrap sampling)抽取样本,形成多个子数据集。

    48、步骤二:对每个子数据集,构建一个决策树。在每个节点,随机选择一部分特征进行分裂。

    49、步骤三:重复以上步骤,直到生成指定数量的决策树。

    50、其中决策树的数量和随机选择的特征数量为关键参数,决策树的数量越多,模型的性能通常越好,但计算成本也会相应增加。特征数量的选择会影响模型的偏差和方差。

    51、s4-2:萤火虫算法(fa,firefly algorithm)是一种基于群搜索的仿生随机优化算法,其思想源于萤火虫向更亮的萤火虫移动的生物学特性。在搜索空间中,萤火虫的位置代表优化问题的解,亮度对应优化问题的适配值。萤火虫继续向更亮的萤火虫移动,直到它达到算法的预设终止条件并完成优化任务。fa在解决复杂优化问题方面是高效的,并且优于其他元启发式算法。因此,本发明中fa被用来调整rf超参数。

    52、在萤火虫算法里,评估萤火虫的吸引程度时,不区分雌雄的差别,种群中的各个萤火虫都能够彼此吸引。萤火虫个体的吸引力和光亮度存在关联,光亮度越高,吸引力就越强,吸引力较弱的萤火虫会朝着吸引力较高的萤火虫移动。萤火虫群体依靠发光来交流信息,群体中最亮的萤火虫会围绕着搜索范围内的最优解进行移动,当算法收敛时,种群最终会集中在能够表征目标函数的最优解所在位置。在萤火虫算法中,亮度和吸引力属于两个关键的参数,亮度决定了萤火虫的位置以及移动的方向,吸引力起到控制作用。萤火虫的光亮度函数能够表示为:

    53、

    54、式中:i0为萤火虫初始亮度,也即萤火虫最大亮度;r为两萤火虫个体之间的距离;y为光强吸收系数,用于表征光在介质中传播的损耗。

    55、萤火虫算法中,萤火虫吸引力随着距离增加而单调减小,吸引力函数β(r)可定义为:

    56、

    57、式中:β0为r=0处的吸引力,即光源处萤火虫的吸引力。萤火虫种群中,若两萤火虫个体i与j别位于和位置,它们之间的距离可用欧式距离rij表示为:

    58、

    59、式中:d为目标问题的空间维度,xik为第i个萤火虫在k维上的坐标。发光亮度较弱的萤火虫将移向发光亮度较强的萤火虫j,其位置逐步更新,更新公式为:

    60、

    61、式中:α为步长因子,rand为[0,1]上均匀分布的随机实数。萤火虫种群中,亮度最高的萤火虫位置更新方程为:

    62、

    63、s4-3:考虑到决策树的数量和随机选择的特征数量直接影响预测精度,本发明使用fa算法对rf的关键参数进行优化,以提高模型的准确性和稳定性。fa优化rf的主要步骤可以总结如下:

    64、(1)初始化fa的个体和参数。

    65、(2)计算萤火虫的目标函数(适应度)值作为其最大亮度。

    66、(3)通过式(13)更新萤火虫空间位置,同时更新最优值。

    67、(4)迭代计算。当满足搜索精度或达到最大搜索次数时,转到步骤5。否则,转到步骤2进行下一次搜索。

    68、(5)生成fa-rf模型,fa优化了决策树的数量和随机选择的特征数量。

    69、s4-4:预测精度常采用残差大小检验。本文选用均方误差mse、均方根误差rmse、平均绝对误差mae、决定系数r2这4个指标进行评定,当mse、rmse和mae越小,r2越大时,说明预测结果较好。各指标可由式(15)表示:

    70、

    71、式中,yi是实测值,是预测值,n是数据个数。

    72、在所述步骤s5中,通过步骤s3生成的考虑风光相关性和随机性的出力场景和步骤s4建立的预测模型对电力负荷的短期变化趋势进行预测,包括以下步骤:

    73、s4-1:实验数据选取某园区所在区域全年并网风电和光伏出力数据为样本,每隔15min采集一次得到,每天共有96个数据。利用核密度估计和frank-copula函数构建风光联合出力分布模型,生成考虑风光相关性和随机性的出力场景。

    74、s4-2:采用fa-rf模型对风、光出力进行短期预测。为进一步说明fa-rf模型的优越性,将该算法与单一lstm神经网络、rf算法的预测结果进行对比分析。

    75、本发明的有益效果是:

    76、1)结合核密度估计和copula函数,能够较好地描述风、光历史出力数据的随机性和相关性,生成更加真实可靠的风光出力场景;

    77、2)通过萤火虫优化算法优化随机森林模型参数,提高了模型对风光出力功率预测的准确性和泛化能力;

    78、3)本发明的风光短期功率预测方法可以广泛应用于风电场和光伏电站的功率预测,有助于提高能源利用效率和管理水平,促进可再生能源的可持续发展。

    79、4)本发明所提预测算法可应用于其他领域的预测研究中,具有一定的普适性。


    技术特征:

    1.一种基于萤火虫优化和随机森林的风光短期功率预测方法,其特征在于,包括以下步骤:

    2.如权利要求1所述的基于萤火虫优化和随机森林的风光短期功率预测方法,其特征在于,所述步骤s1中,采用非参数核密度估计方法对风、光的实测数据进行概率分布建模,得到风、光出力的核密度表达式,包括以下步骤:

    3.如权利要求2所述的基于萤火虫优化和随机森林的风光短期功率预测方法,其特征在于,步骤s2所述的基于步骤s1,利用frank-copula函数构建风光联合出力分布函数,具体步骤如下:

    4.如权利要求3所述的基于萤火虫优化和随机森林的风光短期功率预测方法,其特征在于,步骤s3所述的通过步骤s2得到的风光联合出力分布函数,生成考虑风光相关性和随机性的出力场景,包括以下步骤:

    5.如权利要求4所述的基于萤火虫优化和随机森林的风光短期功率预测方法,其特征在于,步骤s4所述的通过萤火虫算法优化随机森林预测模型的参数,具体步骤如下:

    6.如权利要求5所述的基于萤火虫优化和随机森林的风光短期功率预测方法,其特征在于,在所述步骤s5中,通过步骤s3生成的考虑风光相关性和随机性的出力场景和步骤s4建立的预测模型对电力负荷的短期变化趋势进行预测,包括以下步骤:


    技术总结
    一种基于萤火虫优化和随机森林算法的风光短期功率预测方法,首先应用非参数核密度估计法对风、光的实测数据进行概率分布建模,得到风、光出力的核密度表达式,在此基础上建立基于Frank‑Copula函数的风、光电场出力联合分布模型,生成具有相关性的风、光出力场景,用于后续风、光出力预测。然后分别构建萤火虫算法(FA)参数优化模型和随机森林(RF)预测模型,通过萤火虫算法优化随机森林预测模型的参数。最后将RF算法、LSTM神经网络算法下的预测结果和误差与FA‑RF算法下的预测结果和误差进行对比分析,验证FA‑RF预测模型在短期风、光出力预测方面的预测精度更高。

    技术研发人员:张伟杰,张有兵,顾吉鹏,吴怡轩
    受保护的技术使用者:浙江工业大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-28818.html

    最新回复(0)