一种电网检修资源消耗预测方法及系统与流程

    专利查询2025-12-23  10


    本技术涉及数据预处理与识别,尤其涉及一种电网检修资源消耗预测方法及系统。


    背景技术:

    1、随着工业生产和基础设施维护活动的日益复杂化,高效管理和优化检修作业资源成为企业与组织面临的重要挑战。传统的资源调度和成本预估往往基于粗略估计或历史平均水平,缺乏对作业个体差异和外部环境因素的细致考量,导致资源分配不合理,成本控制不精确。因此,采用先进的数据驱动方法,对检修作业资源消耗进行精细化管理,成为提升运营效率和成本效益的关键途径。

    2、近年来,数据科学与机器学习技术的发展为这一领域带来了革新。通过集成地理信息系统(gis)、设备管理系统(dms)等多源数据,可以收集到丰富的作业现场信息,包括作业资源消耗量、地理位置、作业环境特征、地区经济与电网状况等。这些数据为深入分析作业资源消耗模式提供了坚实基础。

    3、现有技术存在以下问题:(1)数据质量参差不齐:实际作业数据中常存在缺失值、异常值等问题,影响分析的准确性和可靠性。尽管有如dbscan聚类算法用于异常值检测,但如何高效且准确地处理这些数据问题,仍是一项挑战。(2)模型适应性与精度:不同类型的作业资源消耗模式差异大,单一模型难以兼顾所有情况。如何根据不同作业特性选择或设计合适的预测模型,以及如何在模型构建中充分考虑地域、环境等多维度因素,以提高预测精度,仍是亟待解决的问题。(3)资源消耗预测的实时性和动态性:作业环境和条件随时间变化,现有的预测模型往往缺乏足够的动态适应能力,难以实时反映这些变化对资源消耗的影响。(4)成本控制与决策支持的集成度不高:尽管有历史数据作为参考,但如何将预测结果有效融入项目评审和成本预算流程,实现资源调度的智能化和成本控制的精细化,仍有待进一步探索和实践。

    4、综上所述,尽管现有的技术和方法在一定程度上改善作业资源消耗管理,但仍面临数据处理复杂、模型精度与适应性不足、动态预测能力欠缺以及与决策体系集成度不够等问题,需要创新的技术手段和策略来克服。


    技术实现思路

    1、鉴于上述的分析,本技术实施例旨在提供一种电网检修资源消耗预测方法及系统,用以解决现有技术面临数据处理复杂、模型精度与适应性不足、动态预测能力欠缺以及与决策体系集成度不够等问题。

    2、一方面,本技术实施例提供了一种电网检修资源消耗预测方法,包括:获取多次检修作业资源消耗量及其影响因素的数据,其中,所述数据包括历史数据和实时数据;采用基于密度的噪声应用空间聚类对所述历史数据进行异常值识别其中,对所述历史数据进行缺失值插补处理;结合异常值处理后的历史数据,对相同检修作业的不同类型对象的检修作业资源消耗量进行聚类处理;对相同地区、相同检修作业的资源消耗量随机抽取样本数据,通过正态模型参数估计、卡方拟合检验和预测区间估计对所述样本数据进行数据分析以获得资源消耗历史参考量的预测区间;构建神经网络预测模型并利用所述历史数据进行训练,并结合待预测检修作业的实时数据,通过训练完成的神经网络预测模型预测资源消耗量预测目标;以及基于资源消耗历史参考量与所述资源消耗量预测目标,确定最终资源消耗量,其中,基于所述资源消耗历史参考量的预测区间获取资源消耗历史参考量。

    3、上述技术方案的有益效果如下:1、增强异常值识别与数据完整性:采用dbscan聚类算法进行异常值检测,有效剔除可能扭曲分析结果的离群数据,保证分析基础的可靠性。同时利用改进的分层均值插补模型处理缺失值,确保数据的完整性,提高模型训练和预测的准确性。精细化作业类型划分与资源消耗统计:结合模糊c均值聚类算法,实现对作业对象的精细分类,确保统计分析和预测更加贴近实际作业特征。通过对不同类型的作业资源消耗进行深入统计分析,获得更为精准的历史参考量,为后续预测提供高质量的基础数据。2、提升预测模型的精确度与适应性:运用正态模型参数估计、卡方拟合检验等统计方法,确保模型建立在合理的假设基础上,通过预测区间估计,为资源消耗量的波动性提供量化评估。结合改进的神经网络方法,模型不仅能够捕捉到复杂数据关系,还能根据待测作业的具体信息动态调整,提高预测的灵活性和精确度。3、动态权重调整与成本控制优化:在预测过程中,通过动态调整历史数据和预测结果的权重,考虑成本波动性,实现对资源消耗量合理性更为精准的测度。这种机制确保预测模型能够反映最新的市场动态和作业条件变化,为项目评审和成本控制提供更为实际、可靠的参考依据。

    4、基于上述方法的进一步改进,获取多次检修作业资源消耗量及其影响因素的数据进一步包括:利用数据库获取多次检修作业资源消耗量及其影响因素的历史数据,其中,所述历史数据中的影响因素包括被检修设备所处地理位置、环境、地区和电网相关数据;以及采用多种传感器获取多次检修作业资源消耗量及其影响因素的实时数据,其中,所述实时数据中的影响因素包括待检修设备所处地理位置、环境、地区和电网相关数据。

    5、基于上述方法的进一步改进,采用基于密度的噪声应用空间聚类对所述历史数据进行异常值检测以对所述历史数据进行缺失值插补处理进一步包括:在分层识别步骤中,根据设备类型、作业类型、地理位置或环境类型对所述历史数据进行分层以识别出异常值,其中,所述异常值包括缺失值;在层次内均值计算步骤中,在每一层内部,计算含有完整观测值记录的均值;在分层插补步骤中,当所述历史数据中存在缺失值记录时,根据所述缺失值所属的层次,使用层次内的均值来填充缺失值;在考虑权重或复杂插补步骤中,考虑层次内部的变异性、样本量大小,将不同权重分配给不同层次或者采用加权平均或多重插补以反映所述历史数据的内在结构;以及在迭代和验证步骤中,基于插补后的历史数据重新评估分层和统计量,再次进行迭代直到满足预定收敛标准或迭代次数上限为止。

    6、基于上述方法的进一步改进,根据设备类型、作业类型、地理位置或环境类型对所述历史数据进行分层以识别出异常值包括:设置领域半径ε和最小点数minpts,其中,所述领域半径ε表示点与点之间的邻近关系,以及所述最小点数minpts表示在某点邻域内需要达到的最少点数;对于历史数据中的每个点,计算每个点与其他所有点之间的距离;根据计算的每个点与其他所有点之间的距离,将历史数据中的每个数据点划分为核心点、边界点和噪声点,其中,在当前点的ε邻域内存在至少最小点数minpts个点时,将所述当前点标记为核心点;在所述当前点直接或间接与所述核心点相连,但是当前点的ε邻域内不足minpts个点的点时,将所述当前点标记为边界点;以及在所述当前点既不是核心点也不是边界点的数据点时,将所述当前点标记为噪声点作为异常值。

    7、基于上述方法的进一步改进,结合异常值处理后的历史数据,对相同检修作业的不同类型对象的检修作业资源消耗量进行聚类处理进一步包括:基于所述异常值处理后的历史数据对不同作业类型进行特征归纳以获得待聚类的多个特征向量样本集合,其中,所述特征向量样本集合包括设备故障次数、设备运行年限、设备类型、人工消耗量、施工机械消耗量、材料消耗量、设备消耗量、温度、风速、地形、地区gdp、地区用电量;利用所述多个特征向量样本集合通过模糊c均值聚类构建作业类型画像,使得将所述多个特征向量集合重新划分为多个聚类样本簇,其中,通过以下公式计算隶属度和聚类中心:

    8、

    9、其中,uij为第i个样本xi属于第j个簇的隶属度;cj为第j个簇的聚类中心,维度为n;||*||表示样本与聚类中心间的距离;m为待聚类的特征向量样本集合x={x1,x2,...,xm}的数量,每个样本xi={xi1,xi2,...,xin}具有n个特征向量;当将x划分分为c类时,每个子集表示为c={c1,c2,...,ck};通过隶属度和聚类中心公式对隶属度系数和聚类中心进行迭代,直至达到模糊c均值聚类的以下收敛条件:

    10、

    11、其中,t为迭代次数;ε为误差阈值。

    12、基于上述方法的进一步改进,对相同地区、相同检修作业的资源消耗量随机抽取样本数据,通过正态模型参数估计、拟合检验和预测区间估计对所述样本数据进行数据分析以获得相同类型对象的检修作业资源消耗历史参考量进一步包括:基于重新划分的多个聚类样本簇,从相同地区、相同检修作业的资源消耗量中随机抽取部分样本数据以获取检修作业的资源消耗量数据;采用极大似然估计基于检修作业的资源消耗量数据计算资源消耗量总体期望μ和方差σ的估计值:

    13、

    14、其中,x1,x2,...,xn为处理后的资源消耗量,为处理后的资源消耗量的均值;使用资源消耗量总体均值和方差估计值对检修作业的资源消耗量数据的分布类型进行拟合检验以确定是否服从正态分布,其中,当所述分布类型服从正态分布时,检验统计量满足以下公式:

    15、

    16、其中,将x取值的全体ω划分为k个互不相交的子集a1,a2,...,an,将样本观察值x1,x2,...,xn出现在子集ai中的个数记作fi(i=1,2,...,k),则事件

    17、=ai{x值在ai内}的频率为fi/n,计算事件的概率pi=p(ai),i=1,2,...,k;每个类别中的观察频数fi和期望频数npi,参数数量r,表示模型中估计的参数个数,n为总样本数,k-r-1为自由度个数;利用正态分布估计资源消耗历史参考量的预测区间,其中,所述资源消耗历史参考量的预测区间为:

    18、

    19、其中,在点右侧,自由度为n-1的student分布概率密度曲线与x轴所围成的面积概率为某检修作业资源消耗量超过预测区间的概率为1-α,样本均值为一组样本数据的平均值,n为样本数量。

    20、另一方面,本技术实施例提供一种电网检修资源消耗预测系统,包括:数据获取模块,用于获取多次检修作业资源消耗量及其影响因素的数据,其中,所述数据包括历史数据和实时数据;预处理模块,用于采用基于密度的噪声应用空间聚类对所述历史数据进行异常值识别,其中,对所述历史数据进行缺失值插补处理;聚类模块,用于结合异常值处理后的历史数据,对相同检修作业的不同类型对象的检修作业资源消耗量进行聚类处理;历史参考量获取模块,对相同地区、相同检修作业的资源消耗量随机抽取样本数据,通过正态模型参数估计、卡方拟合检验和预测区间估计对所述样本数据进行数据分析以获得资源消耗历史参考量的预测区间;预测模块,用于构建神经网络预测模型并利用所述历史数据进行训练,并结合待预测检修作业的实时数据,通过训练完成的神经网络预测模型预测资源消耗量预测目标;以及加权模块,基于所述检修作业资源消耗历史参考量与所述资源消耗量预测目标,确定最终资源消耗量,其中,基于所述资源消耗历史参考量的预测区间获取资源消耗历史参考量。

    21、与现有技术相比,本技术至少可实现如下有益效果之一:

    22、1、精确诊断数据异常,提升分析可靠性:本技术采用dbscan聚类算法,高效识别并剔除数据集中的异常值,减少噪声干扰,确保后续分析基于准确无误的数据基础。这一进步对比传统手动筛查,极大提高了异常检测的效率与准确性,为资源消耗模型的构建奠定坚实基石。

    23、2、创新数据填补策略,保障数据完整性:针对数据缺失问题,本技术创新性地采用改进的分层均值插补模型,该模型考虑数据的层次结构和相关性,更准确地恢复丢失信息,相比简单平均或中位数填补,更能保持数据的真实性和完整性,提升预测模型的稳健性。

    24、(1)考虑数据层次结构:传统方法往往忽略数据内部的结构特征,简单地对所有缺失值应用统一的填补策略。而改进的分层均值插补模型首先根据数据的内在特性(如时间序列特征、地域差异、设备类型等)将数据划分为不同的层次或类别。这一做法基于这样的认识:同类数据间的相似性更高,其缺失值的填补应更多地参考同类数据的统计特性,从而提高了填补的针对性和准确性。

    25、(2)利用相关性信息:在分层的基础上,模型进一步考虑数据之间的相关性。对于某一层内的数据,除计算均值外,还可能根据其他变量的相关关系进行加权调整。例如,如果两个变量历史上呈现高度正相关,一个变量的缺失值就可以根据另一个变量的当前值,通过相关系数进行调整后的均值插补。这种考虑相关性的填补策略,能够更好地反映数据之间的动态联系,减少因孤立看待每个缺失值而导致的信息损失。

    26、(3)动态调整填补策略:改进的模型不是静态不变的,而是可以根据数据的具体情况和填补效果动态调整分层标准和权重分配。例如,随着数据集的扩大或新特征的发现,模型可重新划分层次或调整相关性权重,以持续优化填补效果。

    27、(4)提升预测模型的稳健性:由于该模型能更准确地恢复数据的真实状态,避免因简单填充导致的数据偏移,从而显著提升后续预测模型的稳健性和预测精度。特别是在机器学习和统计分析中,高质量的输入数据是模型性能的关键,改进的数据填补策略为模型训练提供更为可靠的基础。

    28、3、作业类型智能分类,增强分析针对性:通过模糊c均值聚类,本技术能根据作业的多维度特征,将其智能分类至不同类别,这一策略超越了传统的一刀切处理,实现了作业资源消耗的精准确定。分类结果为每类作业量身定制资源消耗模型,提高了分析的针对性和预测的精准度。

    29、4、融合统计与机器学习,提升预测精度:结合正态模型参数估计、卡方拟合检验等统计方法与改进的神经网络预测模型,本技术不仅确保模型建立的科学性,还通过深度学习技术捕捉复杂数据间非线性关系,显著提升了资源消耗量预测的精度和鲁棒性,为决策提供更为可靠的数据支持。

    30、5、动态权重策略,适应成本波动环境:本技术独创性地引入动态权重调整机制,根据市场波动和个人作业特征,自动调节历史数据与预测结果的权重,确保在变化莫测的环境下,预测模型能灵活适应,有效应对成本波动,为项目成本控制提供了动态且精准的指导,大大优于固定模型的静态预测。

    31、本技术中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本技术的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。


    技术特征:

    1.一种电网检修资源消耗预测方法,其特征在于,包括:

    2.根据权利要求1所述的电网检修资源消耗预测方法,其特征在于,获取多次检修作业资源消耗量及其影响因素的数据进一步包括:

    3.根据权利要求2所述的电网检修资源消耗预测方法,其特征在于,采用基于密度的噪声应用空间聚类对所述历史数据进行异常值检测以对所述历史数据进行缺失值插补处理进一步包括:

    4.根据权利要求3所述的电网检修资源消耗预测方法,其特征在于,根据设备类型、作业类型、地理位置或环境类型对所述历史数据进行分层以识别出异常值包括:

    5.根据权利要求3所述的电网检修资源消耗预测方法,其特征在于,结合异常值处理后的历史数据,对相同检修作业的不同类型对象的检修作业资源消耗量进行聚类处理进一步包括:

    6.根据权利要求5所述的电网检修资源消耗预测方法,其特征在于,对相同地区、相同检修作业的资源消耗量随机抽取样本数据,通过正态模型参数估计、拟合检验和预测区间估计对所述样本数据进行数据分析以获得相同类型对象的检修作业资源消耗历史参考量的预测区间进一步包括:

    7.根据权利要求6所述的电网检修资源消耗预测方法,其特征在于,构建神经网络预测模型并利用所述历史数据进行训练,并结合待预测检修作业的实时数据,通过训练完成的神经网络预测模型预测资源消耗量预测目标进一步包括:

    8.根据权利要求7所述的电网检修资源消耗预测方法,其特征在于,通过所述检修作业资源消耗历史参考量与所述资源消耗量预测目标,确定最终资源消耗量进一步包括:

    9.一种电网检修资源消耗预测系统,其特征在于,

    10.根据权利要求9所述的电网检修资源消耗预测系统,其特征在于,所述预处理模块包括:


    技术总结
    本申请涉及一种电网检修资源消耗预测方法及系统,属于数据预处理与识别技术领域,解决现有技术中数据处理复杂、模型精度与适应性不足、动态预测能力欠缺等问题。方法包括获取多次检修作业资源消耗量及其影响因素的数据;对历史数据进行异常值识别和缺失值插补处理;结合历史数据对资源消耗量进行聚类处理;对相同地区检修作业的资源消耗量随机抽取样本数据,通过模型参数估计、拟合检验和预测区间估计对样本数据进行数据分析以获得资源消耗历史参考量的预测区间;构建并训练神经网络预测模型,结合实时数据预测资源消耗量预测目标;基于资源消耗历史参考量与资源消耗量预测目标,确定最终资源消耗量。简化数据处理,提供模型精度和适应度等。

    技术研发人员:李勇杰,席小娟,郭雷,刘金朋,齐道坤,李大鹏,牛鑫,王晶,康艳芳
    受保护的技术使用者:国网河南省电力公司经济技术研究院
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-33060.html

    最新回复(0)