本发明属于电力系统运行方式样本数据分析应用领域,特别是涉及到一种高比例新能源电力系统运行数据分层聚类方法。
背景技术:
1、当前电力系统典型方式提取及样本生成的研究主要可分为基于专家经验的知识驱动方法与基于数据驱动的方法两类:知识驱动的提取方法多见于工程应用,例如根据年度负荷最大值规划火电装机容量,因此场景提取包括因季节变化出现的水电大发、火电大发运行方式、最大或最小负荷运行方式等可能出现的电网安全运行边界运行方式。但随着新能源占比提高及电网结构的复杂化,基于人工经验提取的场景主观性强,能够考虑的因素较少,难以同时关联多个因素造成的运行场景。而通过数据驱动的方法提取电网典型运行场景包含样本驱动的随机分析方法及机器学习等人工智能方法,其中基于k-means及其改进算法虽然在运行方式提取中具有较高的计算效率和易于实现的优点,但其存在对初始中心点的敏感性、对簇形状和异常值的敏感性、高维数据处理能力的不足在面对电力系统的高维度、非线性、不确定性及组合爆炸等数据特征时使其应用效果受到限制,从而导致在使用基于k-means及其改进算法在进行运行方式样本分类存在分类物理含义不明确、针对性不强、生成样本典型性较差等不足。
技术实现思路
1、针对上述背景技术中提到的新能源电力系统中运行方式呈现去典型化趋势使基于人工经验选取的典型方式难以全面反映新能源复杂运行工况下对电网的影响,而常规数据驱动方法研究中基于均值聚类算法的运行方式样本提取及分类方法又存在聚类中心及样本类别物理含义不明确等问题,本发明提出一种高比例新能源电力系统运行数据分层聚类方法,包括以下步骤:
2、步骤1.拓扑分区:对电力系统拓扑网络分区形成潮流断面;
3、步骤2.特征量选取:从电网公司方式处收集的原始数据中选定能够表征电网运行的关键特性来构造运行方式下的特征量;
4、步骤3.数据等值降维:根据电力系统拓扑分区结果,对关联性较强的特征进行合并实现对特征的降维;
5、步骤4.利用分层均值聚类算法对电力系统运行数据分层聚类;
6、步骤5.选取典型运行方式:在系统静态安全分析框架下对运行方式待校验样本集中各样本开展n-1校核,评估运行点时刻下系统运行的风险等级,提取广义典型运行方式并借助可视化手段识别分析风险区域的运行特征。
7、进一步地,步骤1中,规则设定为:设定常规运行模式下的联络线有功潮流初始方向为正方向记为1,与之相反记为-1,线上无潮流则为0。
8、进一步地,步骤2中选定的关键特性包括:荷侧有功、网侧潮流、源侧同步机出力和源侧新能有机组出力。
9、进一步地,步骤2中从电网公司方式处收集的原始数据需进行数据清洗和预处理,在新的特征空间下实现对运行方式的初步降维;
10、进一步地,步骤3中将各个分区内的厂站负荷数据进行线性加算,以区域负荷整体特征替代独立厂站负荷特征,改善聚类算法对关键特征的提取效果,完成进一步降维运行方式数据;
11、进一步地,分层均值聚类算法包含如下流程:
12、(1)对于n种标签数据形成的数据集,选取一种标签数据,将其数据权重置1,其余标签数据权重置0,进行第一层均值聚类;
13、(2)基于(1)的聚类结果,将数据集分割成k个第一层子数据集,对于每一个子数据集,将一层聚类权重为1的标签置零,选取第二种数据标签进行第二层均值聚类;
14、(3)基于(2)的聚类结果,继续分割数据集,对于每一个第二层子数据集,将二层聚类权重为1的标签置零,选取第三种数据标签进行第三层均值聚类,重复此流程直至穷尽所有n种标签;
15、(4)提取第n层聚类的结果,作为数据集分层聚类的最终结果。
16、通过上述设计方案,本发明可以带来如下有益效果:
17、本发明将专家知识纳入数据驱动方法对运行方式的识别框架中,通过建立系统主导运行特征序列,利用分层聚类方法对运行方式数据集进行划分,形成基于聚类中心为代表的运行方式分类集,然后基于新能源渗透率、负荷水平等差异筛选各类别内具有边界运行特性的运行点,经校验后可为方式部门制定电网运行规则,保障电网运行安全提供有力支持。
1.一种高比例新能源电力系统运行数据分层聚类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种高比例新能源电力系统运行数据分层聚类方法,其特征在于,步骤1中,规则设定为:设定常规运行模式下的联络线有功潮流初始方向为正方向记为1,与之相反记为-1,线上无潮流则为0。
3.根据权利要求1所述的一种高比例新能源电力系统运行数据分层聚类方法,其特征在于,步骤2中选定的关键特性包括:荷侧有功、网侧潮流、源侧同步机出力和源侧新能有机组出力。
4.根据权利要求3所述的一种高比例新能源电力系统运行数据分层聚类方法,其特征在于,步骤2中从电网公司方式处收集的原始数据需进行数据清洗和预处理,在新的特征空间下实现对运行方式的初步降维。
5.根据权利要求1所述的一种高比例新能源电力系统运行数据分层聚类方法,其特征在于,步骤3中将各个分区内的厂站负荷数据进行线性加算,以区域负荷整体特征替代独立厂站负荷特征,改善聚类算法对关键特征的提取效果,完成进一步降维运行方式数据。
6.根据权利要求1所述的一种高比例新能源电力系统运行数据分层聚类方法,其特征在于,分层均值聚类算法包含如下流程:
