数据-模型双重驱动的智能车辆轨迹跟踪控制系统及方法

    专利查询2025-05-30  37


    本技术涉及智能交通,尤其涉及一种数据-模型双重驱动的智能车辆轨迹跟踪控制方法。


    背景技术:

    1、轨迹跟踪技术是智能驾驶车辆实现智能化的重要环节之一,它是指通过根据某种控制理论,为车辆的控制系统设计一个控制输入作用,使得智能驾驶车辆能够以期望的速度跟踪目标轨迹。通常对于轨迹的跟踪即通过对车辆的纵向与横向实施控制使其跟上期望轨迹,这对智能车辆实现智能化自动化有着重要的意义。目前的研究中一般采用纯跟踪算法、线性二次型调节器、滑膜控制、pid控制、模型预测控制等传统控制方法。

    2、纯跟踪算法、线性二次型调节器等常规控制方法均能通过选择前方目标点并计算所需转向角来解决常速良好路面工况下的轨迹跟踪控制。这些控制方法对于复杂非线性系统来说往往存在着较大误差和振荡现象。滑模控制(smc)是一种鲁棒的控制策略,通过定义滑模面和设计控制律,使系统状态沿滑模面滑动,实现对车辆轨迹的跟踪,该方法可能导致高频抖动(抖振)、设计过程复杂以及在动态特性变化较大时控制精度可能受到限制。pid控制器是一种经典的反馈控制器,用于调节系统的输出,使其接近预期的参考值或轨迹。在车辆轨迹跟踪控制中,pid控制器通常用来调节车辆的转向角(方向盘角度),使车辆沿着预定的轨迹行驶。然而,pid控制器在车辆轨迹跟踪控制中虽然简单有效,但存在显著缺点:适应非线性系统差、难以处理时变系统、预测能力有限以及不适合复杂轨迹或多变环境。模型预测控制(mpc)在轨迹跟踪控制研究中是指在一个有限的预测时间范围内优化所选取的性能指标,获得当前时刻的最优控制指令,并通过滚动优化的方式,将车辆跟踪时在下一时刻的跟踪误差达到最小值。然而,该方法因为控制时域固定,无法根据实际情况调整,在优化过程中对车辆横摆角和目标轨迹的跟踪误差较大,无法满足现阶段智能车辆对于从初始车道到目标车道轨迹跟踪的需求。


    技术实现思路

    1、本技术提供了一种数据-模型双重驱动的智能车辆轨迹跟踪控制系统及方法,其技术目的是解决传统mpc方法在优化过程中,控制时域固定,无法根据实际情况精确调整车辆的横摆角和跟踪轨迹,导致其误差较大,无法满足现阶段智能车辆对于复杂时变目标轨迹的跟踪效果问题。

    2、本技术的上述技术目的是通过以下技术方案得以实现的:

    3、一种数据-模型双重驱动的智能车辆轨迹跟踪控制系统,包括车辆动力学模块、参考轨迹模块、基于强化学习的预测模块、反馈校正模块和滚动优化模块。

    4、基于车辆四自由度模型和经典魔术轮胎公式建立车辆动力学模块,车辆动力学模块用于获取主车状态信息和车辆位置信息;

    5、参考轨迹模块根据车辆动力学模块获取的主车状态信息和车辆位置信息,采用轨迹生成函数,生成目标路径;

    6、强化学习预测模块用于获取控制路径,建立智能体神经网络,设置路径优化的奖励函数r(t),奖励函数r(t)和车辆外部信息作为智能体神经网络的输入,智能体神经网络输出预测状态信息给路径控制决策函数,得到最优控制路径;

    7、反馈校正模块根据车辆实时状态和强化学习预测模块获取的控制路径计算路径反馈校正调整量;

    8、滚动优化模块基于目标路径、控制路径、路径反馈校正调整量和主车状态信息,采用滚动优化函数得到当前时刻的最优控制路径,作用于控制对象;

    9、将当前时刻的最优控制路径作为下一时刻的强化学习预测模块的奖励函数,并将当前时刻的车辆状态信息反馈给轨迹生成函数,实现对车辆轨迹跟踪的实时控制。

    10、进一步的,车辆动力学模块具体为:

    11、

    12、式中m为汽车质量,vx、vy为车辆纵向速度和横向速度,δf为前轮转角,为横摆角,αf、αr为前后轮侧偏角,lf、lr为前后轴距,cf、cr为前后轮侧偏刚度,iz为转动惯量,tf为前轴宽度,tr为后轴宽度,fxfl、fxfr、fxrl、fxrr分别是车辆的前左、前右、后左、后右轮胎纵向力,fyfl、fyfr、fyrl、fyrr分别是车辆的前左、前右、后左、后右轮胎侧向力。

    13、进一步的,参考轨迹模块采用如下轨迹生成函数生成目标路径:

    14、yr(k+j)=αys(k)+(1-α)y(k)

    15、式中,y(k)为系统在时间步k上期望的输出值,k、j为系统时间步,α为误差的加权因子。

    16、进一步的,强化学习预测模块的智能体神经网络包括输入层、全连接层和输出层;

    17、输入层输入的车辆外部信息包括速度、加速度、车辆所受载荷。

    18、进一步的,强化学习预测模块中根据奖励函数r(t)、环境状态变量s(t)和强化信息p得到路径控制决策函数θk+j:

    19、

    20、其中,t为历史数据个数;st为环境状态变量;at为控制决策;函数表示在当前状态和操作下的优势;函数g(*)表示幅度限制函数;表示当前状态决策与新状态决策的概率比值。

    21、进一步的,强化学习预测模块的奖励函数r(t)如下:

    22、

    23、式中,x1表示超调量;xe1表示期望超调量;λ1表示超调量的调整值;x2表示收敛时间;xe2表示期望收敛时间;λ2表示收敛时间的调整值;

    24、环境状态变量s(t)为:

    25、vπ[s(t)]=r{π[s(t)]}+γ∑p[s(t),a(t),s(t+1)]vπ[s(t+1)]

    26、vπ(s)表示状态价值函数;π(s)表示智能体的策略;γ表示回报值;a(t)表示控制决策;p表示强化信息;

    27、强化信息p为:

    28、p[s=s(t+1)/s(t)]=p[s(t),a(t),s(t+1)]。

    29、进一步的,反馈校正模块采用下式计算路径反馈校正调整量:

    30、ym1(k+j)=ym(k+j)+θk+j×[y(k)-ym(k)]

    31、式中,ym(k+j)表示反馈校正量;θk+j×(y(k)-ym(k))表示为反馈校正调整量。

    32、进一步的,滚动优化模块采用的滚动优化函数具体为:

    33、

    34、式中,uk表示时间步k的控制输入;p表示扰动变量;表示状态矩阵;bi表示输入矩阵。

    35、本技术的有益效果在于:本技术所述的数据-模型双重驱动的智能车辆轨迹跟踪控制系统及方法,首先基于车辆四自由度模型和经典魔术轮胎公式建立车辆动力学模块为后续的跟踪控制模块提供基础;其次设计参考轨迹模块,根据主车状态信息生成目标路径;接下来设计强化学习预测模块,得到最优的控制路径;然后设计反馈校正模块,用于保证预测模型的准确性,使预测值与实际值相接近;最后设计滚动优化模块,采用滚动优化函数得到当前时刻的最优控制路径,作用于控制对象。本技术所述轨迹跟踪控制方法降低了智能车辆在运行时横向位移、轨迹跟踪误差、横摆角和期望横摆角的控制难度,实现自车从初始车道到目标车道的安全、平稳切换,保证智能驾驶汽车在时变交通环境下的安全行驶。


    技术特征:

    1.一种数据-模型双重驱动的智能车辆轨迹跟踪控制系统,其特征在于,包括车辆动力学模块、参考轨迹模块、强化学习预测模块、反馈校正模块和滚动优化模块;

    2.根据权利要求1所述的系统,其特征在于,车辆动力学模块具体为:

    3.根据权利要求2所述的系统,其特征在于,参考轨迹模块采用如下轨迹生成函数生成目标路径:

    4.根据权利要求3所述的系统,其特征在于,强化学习预测模块的智能体神经网络包括输入层、全连接层和输出层;

    5.根据权利要求4所述的系统,其特征在于,强化学习预测模块中根据奖励函数r(t)、环境状态变量s(t)和强化信息p得到路径控制决策函数θk+j:

    6.根据权利要求5所述的系统,其特征在于,强化学习预测模块的奖励函数r(t)如下:

    7.根据权利要求6所述的系统,其特征在于,反馈校正模块采用下式计算路径反馈校正调整量:

    8.根据权利要求7所述的系统,其特征在于,滚动优化模块采用的滚动优化函数具体为:

    9.一种基于权利要求1-8任一项所述的控制系统进行车辆轨迹跟踪控制的方法,其特征在于,包括如下步骤:


    技术总结
    本发明公开了一种数据‑模型双重驱动的智能车辆轨迹跟踪控制系统及方法,系统包括基于车辆四自由度模型和经典魔术轮胎公式建立车辆动力学模块;生成目标路径的参考轨迹模块;得到最优的控制路径的强化学习预测模块;用于保证预测模型的准确性的反馈校正模块;采用滚动优化函数得到当前时刻的最优控制路径的滚动优化模块。本申请结合了数据驱动强化学习方法更灵活和模型驱动优化方法更可靠的优势,能够降低智能车辆的轨迹跟踪误差和横摆角偏差,提升智能车辆对于不同行驶轨迹的适应性和跟踪精度,保证了智能驾驶汽车在时变交通环境下的安全行驶。

    技术研发人员:严永俊,张鹏,皮大伟,都超,尹澳,王洪亮,王显会
    受保护的技术使用者:南京理工大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-28894.html

    最新回复(0)