本发明属于,具体涉及一种融合驾驶训练优化算法的车身稳定控制方法。
背景技术:
1、在汽车的运动控制中,车身稳定系统(electronic stability program,简称esp)是一项关键技术,旨在提高车辆在转向时的稳定性和操控性。esp通过对控制器进行优化,根据车身参数对车轮力矩进行分配,从而保持车辆的方向稳定性和转向过度不足情况。传统的滑膜控制器常用于esp系统,但其参数调优一直是一个挑战。引入群智能算法,这是一种启发式算法,用于自适应地调整滑膜控制器的参数。与传统的参数调优方法相比,群智能算法具有全局搜索和高度并行的特性,能够更有效地搜索参数空间,提高控制器性能。
2、esp系统最初是由bosch公司推出的,它是对原有的abs/asr系统进行改良,对其增加了所需的各种传感器以获取汽车的状态信息来判断行车意图,然后通过中央处理单元分析车辆的实际状态,在汽车急转弯时通过对车轮的控制,保证汽车行驶的稳定性与转向的可靠性。到目前为止,国内外大量学者对其进行了深刻的研究,主要集中在设计控制器,与对控制器参数进行优化两个方面。
3、基于驾驶训练的优化算法(driving training-based optimization,dtbo)是由是2022年提出的一种新型群体智能算法,它背后的基本灵感来自于驾校学习驾驶的过程和驾校教练的培训,通过该方式来进行寻优。该算法具有寻优能力强、快速收敛等特点,非常适合用于优化滑膜控制器参数。但dtbp在寻优过程中会有陷入局部最优的问题,需进一步改进。
技术实现思路
1、本发明的目的在于提供一种融合驾驶训练优化算法的车身稳定控制方法,以解决滑膜控制器的在车身稳定系统中收敛速度固定的问题,以及现有的dtbo算法,易陷入局部最优等缺陷,本发明在面对不同路况条件下和不同方向盘转角输入时具有更好的车身稳定效果,也可自适应地调整控制器的参数,以适应不同的路面情况。
2、为达到上述目的,本发明采用如下技术方案:
3、融合驾驶训练优化算法的车身稳定控制方法,包括以下步骤:
4、步骤1:建立汽车整车模型及车身稳定控制系统模型;
5、步骤2:获取基于驾驶训练的优化算法;
6、步骤3:根据汽车在不同路况下和不同驾驶员输入时滑膜控制器的控制效果,对步骤2中获得的基于驾驶训练的优化算法进行改进,得到改进的基于驾驶训练的优化算法;
7、步骤4:将步骤3中改进的基于驾驶训练的优化算法嵌入车身稳定控制系统模型中的滑膜控制器部分,为滑模面参数和等速趋近率寻找出一组最优参数,使得车身稳定控制系统的能量消耗和跟踪误差最小;
8、步骤5:利用步骤4获得滑膜控制器的滑模面参数和等速趋近率参数,控制汽车车身稳定系统。
9、进一步地,步骤1中建立汽车整车模型,具体如下:
10、
11、
12、
13、其中,公式(1)为车辆纵向运动微分方程;公式(2)为车辆侧向运动微分方程;公式(3)为车辆横摆运动微分方程,其中ωz表示横摆角速;m为整车质量;iz表示整车z轴转动惯量;bf为前轮距;br为后轮距;lf为前轴距;lr为后轴距;rw表示车轮半径;ωw_ij表示四个车轮的角速度;公式(4)到公式(7)为轮胎垂向力方程,其中,mw为轮胎重量;mb为车身重量;公式(8)到公式(11)为各轮轮心纵向速度方程,公式(12)到公式(15)为各轮轮心测向速度方程,公式(16)到公式(19)为各轮轮心合速度速度方程;公式(20)到公式(23)分别为车辆各轮的车轮侧偏角公式;公式(24)为车轮滑移率公式,其中,当滑移率>0,车轮滑转;当滑移率<0,车轮滑移;公式(25)和公式(26)为转向运动学模型公式,该模块输入为方向盘转角rad,输出为两车轮转角rad,其中isw为转向系传动比,vx_fl,vx_fr,vx_rl,vx_rr分别表示左前轮轮心纵向速度,左后轮轮心纵向速度,右前轮轮心纵向速度,右后轮轮心纵向速度,vy_fl,vy_fr,vy_rl,vy_rr分别表示左前轮轮心侧向速度,左后轮轮心侧向速度,右前轮轮心侧向速度,右后轮轮心侧向速度,vfl,vfr,vrl,vrr分别表示左前轮轮心合速度,左后轮轮心合速度,右前轮轮心合速度,右后轮轮心合速度,αfl,αfr,αrl,αrr分别表示左前轮侧偏角,左后轮侧偏角,右前轮侧偏角,右后轮侧偏角λij表示车轮滑移率,δs表示输入方向盘转角,δfr表示右前轮方向盘转角,δfl表示左前轮方向盘转角,fx_fl,fx_fr,fx_rl,fx_rr分别表示左前轮在横向受到的力,左后轮在横向受到的力,右前轮在横向受到的力,右后轮在横向受到的力,fy_fl,fy_fr,fy_rl,fy_rr分别表示左前轮在纵向受到的力,左后轮在纵向受到的力,右前轮在纵向受到的力,右后轮在纵向受到的力,fz_fl,fz_fr,fz_rl,fz_rr分别表示左前轮在垂向受到的力,左后轮在垂向受到的力,右前轮在垂向受到的力,右后轮在垂向受到的力,vx表示车辆在横向上的速度,vy表示车辆在纵向上的速度。
14、进一步地,步骤1中建立车身稳定控制系统模型,具体如下:
15、
16、其中,公式(27)为最终期望横摆角速度取值方程;公式(28)为最终期望质心侧偏角取值方程;公式(29)为横摆角速度滑膜控制方程;公式(30)是质心侧偏角滑膜控制方程,δf为前轮转角,l为轴距,k为稳定性因数kf,kr为前后轴侧偏刚度,由于受到地面附着极限的限制,期望横摆角速度需要满足a为安全系数;μ为路面附着系数;g重力加速度,cωz为误差和误差变化率之间的相对权重系数,cβ为误差和误差变化率之间的相对权重系数,横摆角速度取值公式中的滑膜趋近方式选择等速趋近律,即质心侧偏角取值公式中的滑膜趋近方式选择等速趋近律,即
17、进一步地,步骤2中驾驶训练优化算法,即dtbo,包括以下步骤:
18、步骤3.1:寻优空间中随机初始化种群;
19、步骤3.2:驾驶训练培训:即根据初始化的种群位置,根据公式更新种群位置,并判断是否最优;
20、步骤3.3:学员学习:将上一步中的种群位置再移动到搜索空间中的不同位置;
21、步骤3.4:个人练习:生成种群随机位置,将随机位置与上一步种群位置比较,保留最优位置。
22、进一步地,步骤3.1中首先在寻优空间里随机初始化种群,如式:
23、xi,j=lbj+r·(ubj-lbj)
24、其中,xi,j为个体,lbj为寻优下边界,ubj为寻优上边界,r为[0,1]之间的随机数;
25、步骤3.2中dtbo更新的第一阶段是基于学习驾驶员对驾驶教练的选择,然后是所选驾驶教练对学习驾驶员的驾驶训练,在每次迭代中,基于目标函数值的比较,选择dtbo的n个成员作为驾驶教练,如式所示:
26、
27、式中,di是驾驶教练集合,ndi是驾驶教练的数量,其中ndi=floor(0.1*n*(1-t/t)),t是当前迭代次数,t是最大迭代次数,初始化完成后,需要计算每个成员的新位置,如式所示:
28、
29、随后,如果新位置更优,则该新位置将取代先前位置,如式所示:
30、
31、步骤3.3dtbo更新的第二阶段是基于学习型驾驶员模仿教练,这个过程将dtbo成员移动到搜索空间中的不同位置,基于每个成员与教练的线性组合来生成新的位置,如式所示:
32、
33、如果这个新位置更优,则它将替换先前的位置,如式所示:
34、
35、其中,p的计算如下:
36、
37、步骤3.4中dtbo更新的第三阶段基于每位学习驾驶者的个人实践,以提高驾驶技能,对该dtbo阶段进行数学建模,使得首先每个种群成员附近生成随机位置,如式所示:
38、
39、然后,如果该位置更优,则该位置将取代先前的位置,如式所示:
40、
41、进一步地,对步骤2中获得的基于驾驶训练的优化算法进行改进,得到改进的基于驾驶训练的优化算法,具体步骤包括:
42、步骤4.1:随机初始化种群;
43、步骤4.2:采用生物进化策略对驾驶训练学员种群进行优胜劣汰,将优秀的成员设定为驾驶教练;
44、步骤4.3:开始迭代更新;
45、步骤4.4:结合自适应逐维小孔成像反向学习策略,修订扩大搜索阶段位置更新公式;
46、步骤4.5:改进开发阶段的位置更新公式;
47、步骤4.6:计算种群的适应度,根据适应度的大小选出最优结果;
48、步骤4.7:判断是否达到最大迭代次数,若是,输出即更新后的滑膜控制器参数,若否,返回步骤4.2。
49、进一步地,步骤4.1中随机初始化初始种群,步骤4.2中生物进化策略使得初始化种群进行进化,步骤4.2的具体步骤如下:
50、采用差分策略对个体进行遗传变异,变异向量产生公式如下:
51、vi=xr1+f(xr2-xr3)
52、式中r1,r2,r3是随机整数且r1≠r2≠r3,vi为变异向量,xr1,xr2,xr3分别为不同的种群个体,f是缩放因子,为[0,1]内的常数,用于控制偏差的放大作用;
53、对个体进行交叉,不断交叉产生一个交叉种群,交叉方法为:
54、
55、其中,vij为第j维的第i个变异个体,xij为第j维的第i个目标个体,uij为交叉后选择的第j维第i个个体,cr为是交叉概率,randi(1,d)表示在(1,d)内的一个随机数;
56、采用贪婪原则在原始种群和交叉种群中选择更优秀的作为下一代个体,最终选出的个体即设置为驾驶教练种类个体,方法如下:
57、
58、其中,xi为第i个目标个体,ui为第i个交叉后选择的个体,fit(x)为x的适应度。
59、进一步地,步骤4.4中结合自适应逐维小孔成像反向学习策略,修订扩大搜索阶段位置更新公式,具体为:
60、
61、式中,x’best(t)是第t次迭代得到的最佳解,rand表示0到1间的随机数,ω表示优化参数,aj和bj分别是第j维的上界和下界,n为调节参数,x1(t+1)为t的下一次迭代解,是由第一次迭代生成的,x’best(t)是第t次迭代得到的最佳解,t为最大迭代次数,(1-t/t)用于控制搜索,xm(t)是第t次迭代时当前解的平均位置。
62、进一步地,步骤4.5中采用带反馈机制的动态自适应t分布变异算子改进开发阶段的位置更新公式。
63、进一步地,步骤4.7中利用获得的改进的驾驶训练优化算法的滑膜控制器参数,在车辆发生车身失稳情况后,对四个车轮的力矩进行分配,最后达到优化质心侧偏角和横摆角速度的目的。
64、与现有技术相比,本发明具有以下有益的技术效果:
65、本发明在保证快速寻优的前提下,通过算法实时调节控制器参数,使得滑膜控制器参数保持动态最优,解决了手动通过专家经验设置参数的不确定性问题,以及面对多工况的不可调节性,本发明在面对不同工况时使汽车具有更好的制动效果。
66、进一步地,本发明在扩大搜索阶段采用自适应逐维小孔成像反向学习策略,解决了dtbo在选择搜索空间阶段过早收敛,易陷入局部极值点的情况;在开发阶段融合了带反馈机制的动态自适应t分布变异算子,提高了种群的多样性。
67、本发明相比于传统驾驶训练优化算法,收敛速度更快,质心侧偏角和横摆角速度更接近理想值,在不同极限工况下都取得很好的车身稳定效果。
1.融合驾驶训练优化算法的车身稳定控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤1中建立汽车整车模型,具体如下:
3.根据权利要求1所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤1中建立车身稳定控制系统模型,具体如下:
4.根据权利要求1所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤2中驾驶训练优化算法,即dtbo,包括以下步骤:
5.根据权利要求4所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤3.1中首先在寻优空间里随机初始化种群,如式:
6.根据权利要求1所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,对步骤2中获得的基于驾驶训练的优化算法进行改进,得到改进的基于驾驶训练的优化算法,具体步骤包括:
7.根据权利要求6所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤4.1中随机初始化初始种群,步骤4.2中生物进化策略使得初始化种群进行进化,步骤4.2的具体步骤如下:
8.根据权利要求6所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤4.4中结合自适应逐维小孔成像反向学习策略,修订扩大搜索阶段位置更新公式,具体为:
9.根据权利要求6所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤4.5中采用带反馈机制的动态自适应t分布变异算子改进开发阶段的位置更新公式。
10.根据权利要求6所述的融合驾驶训练优化算法的车身稳定控制方法,其特征在于,步骤4.7中利用获得的改进的驾驶训练优化算法的滑膜控制器参数,在车辆发生车身失稳情况后,对四个车轮的力矩进行分配,最后达到优化质心侧偏角和横摆角速度的目的。