本发明涉及电池容量数据处理,尤其涉及一种基于电池预充数据计算容量的方法。
背景技术:
1、利用数据驱动方法,基于非满电预充数据预测分容容量,能极大降低分容设备投入、厂房占用及充放电费用时间等。
2、而容量预测落地要求预测误差<1%,且预测结果稳定性强,其中涉及工艺异常数据清洗、极化补偿、数据均衡、容量特征因子提取。其中异常数据包括托盘等待时间过长、接触不良、化成负压异常,异常数据会引入计算噪声;极化补偿主要涉及因分容温度差异造成实际容量的偏移,补偿前的容量分布方差较大,能提升预测;数据均衡主要进而影响模型预测,体现在高容区域,低容区域数据相对中间容量区域,数据偏少,预测值偏向中间容量,导致高低容区域数据预测准确度偏低;容量特征因子提取,除了常规的电压因子,sei成膜峰电位、注液后总重量、静置压差对容量预测影响较大。
3、其中现有专利cn113848480、cn202310750617、cn202211123668,从工艺角度分析了影响容量制程因子,并利用树模型预测,但并没有解决极化补偿和数据均衡问题;同时,对于容量影响的首要因子总重量、峰特征因子和静置特征并未考虑,也缺乏对特征重要度的详细论证数据;
4、其中现有专利cn202211063915,虽然截取了预充和部分分容数据,分析了异常数据处理、并基于图数据关联分析,挖掘了容量影响因子,同样没有考虑极化对容量补偿影响、预测宽表生成也没有详细说明,也缺乏对特征重要度的详细论证数据;
5、其中现有专利cn202310816738、cn202311048823,提取预充数据峰特征,并基于补偿后的容量,利用树模型实现预测容量分档,对其他容量因子提取没有详述;对峰特征对模型影响机理和主要程度、模型特征筛选缺乏详细论证数据。
技术实现思路
1、本发明的目的在于提供一种基于电池预充数据计算容量的方法,通过综合考虑工艺异常数据清洗、极化补偿,特征因子提取,数据均衡处理,模型预测的因素,从而达到单体电芯容量预测误差<1%。
2、本发明公开的一种基于电池预充数据计算容量的方法所采用的技术方案是:
3、一种基于电池预充数据计算容量的方法,包括以下步骤:
4、s1,数据清洗,将异常数据进行删除,从而提高后续处理的效率及准确性;
5、s2,数据处理,将清洗好的数据进行容量补充和样本均衡处理;
6、s3,特征提取,影响容量特征因子包含dqdv峰特征、预充工步特征及工艺制程数据,对此进行特征初提取、特征过滤及特征筛选;
7、s4,模型构建及调参,通过构建特征和分容补偿容量间关系,获得容量预测模型,针对影响模型关键参数,利用网格调参,基于mse指标,得到调参参数。
8、作为优选方案,所述异常数据包括因采集接触问题、设备工步等待异常、起始电压一致性差、制程温度一致性差异问题。
9、作为优选方案,所述因采集接触异常现象为:充电过程信号出现抖动,上升过程不平滑,单独曲线异常不太容易量化,可通过聚合后的特征删除异常,聚合后主要体现在信号离群;
10、所述设备工步等待现象为:因电芯差异,部分电芯提前完成工步充电状态,因其他电芯还处于充电状态,充电设备为保证数据完整性,对等待状态数据,会自动填充0;
11、所述起始电压一致性差现象:电芯1c微充后有极化问题,不同的静置时间会导致测量的ocv电压差异较大,需考虑静置时间对起始电压的影响;
12、所述制程温度异常现象:充电平均电压出现离群。根因:通道布局导致散热不一致、部分通道散热设备工作异常等。
13、作为优选方案,在步骤s2中,因分容温度制程差异,实际分容温度会偏离标准室温温度t0和对应标准y0,导致容量统计不统一;
14、基于产线实际分容均值温度t和分容容量y,分到容量-分容均值温度拟合公式y=f(t),其中y=-0.2317t*2+22.55t+4045.8,针对实际电芯温度t1(对应实际分容容量y1)得到预测分容容量y^,温差t1-t0(26°)对应的容量差为y^-y0(26°),修正补偿后的容量为y1-(y^-y0)。
15、作为优选方案,对应容量样本均衡处理包括产线数据搜集和统计采样,中早期量产阶段,边缘高低容区域数据仍相对较少,故采用smote抽样成为数据增强的一种手段;
16、smote抽样可以有效地提高模型对少数类别的性能,避免模型在不平衡数据集中对多数类别的过度拟合,计算过程为:选取每个少数类的knn近邻,基于近邻间随机加生成新训练样本:
17、xnew=xi+rand(0,1)*(xi-x),其中为knn近邻样本。
18、作为优选方案,所述dqdv峰特征包括:嵌锂峰、相变峰,每个峰特征对应峰宽电压、峰高度特征;
19、所述预充工步特征包括:结束容量、电压特征、压差、结束温度及衍生特征;
20、所述工艺制程数据包括:称重和注液量。
21、作为优选方案,对应峰特征dqdv反应充电时锂嵌引起的容量变化,sei成膜电位间接体现出容量损失,其中dqdv计算中,先计算dq、dv再对dq、dv按照滑动窗口n=10指数滤波处理得到dq_ewm、dv_ewm,最后计算dq_ewm/dv_ewm即为得到的dqdv值。
22、作为优选方案,所述特征过滤为基于特征初提取数据,删除和容量相关性较低特征和共线性较高特征,得到特征预处理宽表,特征相关性计算为spearman秩相关。
23、作为优选方案,所述特征筛选基于特征过滤所得到特征预处理宽表中的特征因子,通过树模型重要度,筛选重要度高特征,当前任务为回归预测,回归树特征筛选原理为:采用mse(均方误差)作为结点分裂的依据。当前节点mse的计算方法如下:
24、
25、其中n为当前节点样本数,yi为当前节点数值,节点预测值mse=(yi-mean)2/n。
26、作为优选方案,所述模型训练及调参采用light-gbm,light-gbm是基于梯度提升算法与boosting集成学习策略的模型,基于每一个训练的梯度提升基模型的输出的残差,串联地迭代训练大量的树模型以减少损失函数,直至设定的停止条件。
27、本发明公开的一种基于电池预充数据计算容量的方法的有益效果是:通过综合考虑工艺异常数据清洗、极化补偿,特征因子提取,数据均衡处理,模型预测的因素,从而达到单体电芯容量预测误差<1%。
1.一种基于电池预充数据计算容量的方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于电池预充数据计算容量的方法,其特征在于,所述异常数据包括因采集接触问题、设备工步等待异常、起始电压一致性差、制程温度一致性差异问题。
3.如权利要求2所述的一种基于电池预充数据计算容量的方法,其特征在于,所述因采集接触异常现象为:充电过程信号出现抖动,上升过程不平滑,单独曲线异常不太容易量化,可通过聚合后的特征删除异常,聚合后主要体现在信号离群;
4.如权利要求1所述的一种基于电池预充数据计算容量的方法,其特征在于,在步骤s2中,因分容温度制程差异,实际分容温度会偏离标准室温温度t0和对应标准y0,导致容量统计不统一;
5.如权利要求1所述的一种基于电池预充数据计算容量的方法,其特征在于,对应容量样本均衡处理包括产线数据搜集和统计采样,中早期量产阶段,边缘高低容区域数据仍相对较少,故采用smote抽样成为数据增强的一种手段;
6.如权利要求1所述的一种基于电池预充数据计算容量的方法,其特征在于,所述dqdv峰特征包括:嵌锂峰、相变峰,每个峰特征对应峰宽电压、峰高度特征;
7.如权利要求6所述的一种基于电池预充数据计算容量的方法,其特征在于,对应峰特征dqdv反应充电时锂嵌引起的容量变化,sei成膜电位间接体现出容量损失,其中dqdv计算中,先计算dq、dv再对dq、dv按照滑动窗口n=10指数滤波处理得到dq_ewm、dv_ewm,最后计算dq_ewm/dv_ewm即为得到的dqdv值。
8.如权利要求6所述的一种基于电池预充数据计算容量的方法,其特征在于,所述特征过滤为基于特征初提取数据,删除和容量相关性较低特征和共线性较高特征,得到特征预处理宽表,特征相关性计算为spearman秩相关。
9.如权利要求8所述的一种基于电池预充数据计算容量的方法,其特征在于,所述特征筛选基于特征过滤所得到特征预处理宽表中的特征因子,通过树模型重要度,筛选重要度高特征,当前任务为回归预测,回归树特征筛选原理为:采用mse(均方误差)作为结点分裂的依据。当前节点mse的计算方法如下:
10.如权利要求1所述的一种基于电池预充数据计算容量的方法,其特征在于,所述模型训练及调参采用light-gbm,light-gbm是基于梯度提升算法与boosting集成学习策略的模型,基于每一个训练的梯度提升基模型的输出的残差,串联地迭代训练大量的树模型以减少损失函数,直至设定的停止条件。
