安全速度的康复机器人最优预定时间决策的稳定控制方法

    专利查询2025-04-12  13


    本发明涉及轮式康复机器人的控制,尤其涉及一种安全速度的康复机器人最优预定时间决策的稳定控制方法。


    背景技术:

    1、交通事故及人口老龄化使步行障碍患者逐年增多,随着康复步行机器人在康复中心、养老院等场所的应用,有效解决了康复医生短缺的问题。然而,在实际应用中,训练者承受人机系统暂态运动阶段的调整时间是有限且不同的。如果调整时间过长,机器人将不断变化运动轨迹和运动速度来减少跟踪误差,使人机系统逐渐进入稳态运动阶段。由于训练者的腿部力量较弱,机器人不断改变运动轨迹和运动速度,很难保证人机系统的协调运动,从而威胁训练者的安全。因此,研究人机系统进入稳定运动的时间,可以为康复医生判断训练者是否能够使用机器人进行步行训练提供依据,对提高康复机器人帮助训练者步行运动的安全性具有重要意义。

    2、近年来,关于康复步行机器人跟踪控制已有许多研究成果,然而都没用考虑人机系统跟踪运动的稳定时间问题。实际上,训练者与康复机器人合作才能完成训练任务,人机系统运动的稳定时间直接关系着训练者的安全;同时,为了避免机器人速度调整超过训练者的承受能力,解决人机合作运动的安全速度问题也是极为重要的。到目前为止,关于康复机器人安全速度下的稳定运动预定时间决策的跟踪控制方法还没有相关研究结果。本发明设计了康复机器人的安全速度,并提出了最优预定时间决策的稳定跟踪控制方法,提高了人机系统跟踪运动的稳定性和安全性。


    技术实现思路

    1、本发明就是针对现有技术存在的缺陷,提供一种安全速度的康复机器人最优预定时间决策的稳定控制方法。其目的是获得人机系统稳定运动的最优预定时间,并保障运动速度的安全性。

    2、为实现上述目的,本发明采用如下技术方案,包括步骤如下:

    3、1)基于康复机器人动力学模型,采用反步法设计跟踪控制器,使人机系统跟踪误差预定时间达到稳定。

    4、2)提出康复机器人的强化学习决策算法,从而获得人机系统稳定运动的最优预定时间。

    5、3)建立人机系统安全速度约束条件,并设计安全速度控制障碍函数,进而得到最优预定时间稳定跟踪的安全控制器。

    6、具体步骤如下:

    7、步骤1)基于康复机器人动力学模型,采用反步法设计跟踪控制器,使人机系统跟踪误差预定时间达到稳定。其特征在于:系统的动力学模型描述如下

    8、

    9、其中

    10、

    11、其中,m表示康复机器人质量,m表示康复者质量,x(t)表示康复机器人的实际运动轨迹,u(t)表示四个轮子的控制输入力,r0表示重心到中心的距离,i0表示康复机器人的转动惯量,θ表示水平轴和机器人中心与第一个轮子中心连线间的夹角,即θ=θ1,由康复机器人结构可知θ3=θ+π,li表示系统重心到每个轮子中心的距离,φi表示x′轴和每个轮子对应的li之间的夹角,i=1,2,3,4。

    12、康复机器人动力学模型(1)转化为如下形式:

    13、

    14、令x1(t)=x(t),则模型(2)化为系统状态方程形式如下:

    15、

    16、其中,

    17、医生指定运动轨迹为xd(t)=[xd(t) yd(t) θd(t)]t,其中xd(t),yd(t),θd(t)分别表示x轴、y轴和旋转角方向的指定运动轨迹,x(t)=[x(t) y(t) θ(t)]t为实际运动轨迹,其中x(t),y(t),θ(t)分别表示x轴、y轴和旋转角方向的实际运动轨迹,则轨迹跟踪误差e1(t)和分别为:

    18、e1(t)=x1(t)-xd(t)  (4)

    19、

    20、设计虚拟变量α(t)和速度跟踪误差e2(t)如下:

    21、

    22、e2(t)=x2(t)-α(t)  (7)

    23、其中,0<β<1,μ表示大于零的常数,tc表示给定的预定时间。

    24、结合式(3)、式(6)和式(7)可得:

    25、

    26、针对人机系统(3),利用反步法设计康复机器人预定时间稳定控制器us(t)为:

    27、

    28、其中是g0(x(t))的伪逆矩阵,且

    29、建立康复机器人轨迹误差李雅普诺夫函数如下:

    30、

    31、对式(10)求导,并将式(5)和式(6)代入可得

    32、

    33、建立康复机器人轨迹误差和速度误差的李雅普诺夫函数如下:

    34、

    35、对式(12)求导可得:

    36、

    37、将式(9)代入式(13)可得:

    38、

    39、由赫尔德不等式可得:

    40、

    41、利用式(15)化简式(14)可得:

    42、

    43、定义t*为康复机器人的实际稳定时间,当t∈[0,t*]对式(16)两侧同时积分,可得实际稳定时间t*满足关系如下:

    44、

    45、于是由式(16)和式(17)可知,康复机器人在控制器(9)的作用下可使轨迹跟踪误差和速度跟踪误差预定时间tc内稳定。

    46、步骤2)提出康复机器人的强化学习决策算法,从而获得人机系统稳定运动的最优预定时间。其特征在于:

    47、将康复机器人轨迹误差式(4)写为如下形式:

    48、

    49、其中ex(t),ey(t),eθ(t)表示x轴、y轴和旋转角方向的轨迹误差。定义位置误差ep(t)如下:

    50、

    51、为了决策康复机器人实际稳定时间t*的最优预定值提出强化学习决策算法,定义决策算法的状态condition1,condition2,condition3,condition4为:

    52、

    53、其中,σ和θ0表示指定的跟踪误差界限。

    54、决策算法的动作d1,d2为:

    55、

    56、其中表示系统的初始时刻,表示决策的最优预定时间,δt≥0表示时间的变化量。

    57、设计最优决策预定时间的奖惩值函数r为:

    58、

    59、康复机器人强化学习决策算法如下:

    60、step 1:对康复机器人的行为对(c,d)进行初始化,其中c为康复机器人当前状态,d为当前采取的动作;设置更新状态学习速率α,衰减系数γ,学习动作的选择概率ε,其中α∈[0,1],γ∈[0,1],ε∈[0,1];

    61、step 2:将康复机器人当前位置误差和角度误差与设定值σ和θ0进行比较,并判断机器人在condition1,condition2,condition3,condition4中所处的状态,将其记为c。机器人以概率ε选取d1,d2中的任意一个动作,选取方式为:当p<ε,随机选取d1或d2;当p≥ε,依据maxq(c,d)选取d1或d2,并将选取的动作记为d,从而确定机器人当前时刻的行为对(c,d)。其中p=random()表示随机数,q(c,d)表示在行为对(c,d)下获得的价值,且其更新过程如下:

    62、q(c,d)←q(c,d)+α[r+γq(c*,d*)-q(c,d)](23)

    63、其中c*表示根据奖惩值r机器人进入的下一个状态,再利用概率ε选择新的动作d*,从而获得新的行为对(c*,d*),q(c*,d*)表示在行为对(c*,d*)下获得的价值,进而机器人完成一次预定时间的决策;

    64、step 3:重复step 2,机器人不断进行预定时间的决策,直到机器人状态依然停留在condition4中,则取作为康复机器人决策的最优预定时间

    65、步骤3)建立人机系统安全速度约束条件,并设计安全速度控制障碍函数,进而得到最优预定时间稳定跟踪的安全控制器。其特征在于:康复机器人的安全速度约束条件设计如下:

    66、

    67、其中x2x,x2y,x2θ表示康复机器人在x轴,y轴和旋转角方向的速度,vx,vy,vθ表示x轴,y轴和旋转角方向的安全速度约束值。

    68、为了保证康复机器人具有安全运动速度,设计速度控制障碍函数如下:

    69、

    70、由式(25)可得hv(x)≥0,并对hv(x)沿x(t)求偏导数得:

    71、

    72、依据系统(3),令函数f(x(t))和g(x(t))分别为:

    73、

    74、

    75、对hv(x)沿f(x(t))求lie导数,得到于是康复机器人安全速度的控制输入集合a设计为:

    76、a={u(t)∈u|lfhv(x)+lghv(x)u(t)+khv(x)≥0}  (29)

    77、其中u表示允许的控制输入集合,lghv(x)表示hv(x)沿g(x(t))的lie导数,k>0表示调节参数。

    78、根据康复机器人速度控制障碍函数,将速度安全控制器设计转化为求解如下优化问题:

    79、

    80、其中h表示给定的正定矩阵,τ>0为惩罚因子,δ为松弛变量。通过求解上述优化问题式(30),可得具有安全速度的最优预定时间控制器u*(t),使康复机器人在决策的最优预定时间以安全速度稳定跟踪医生指定的训练轨迹xd(t)。

    81、步骤4)基于stm32f411系列单片机将输出pwm信号提供给电机驱动模块,使康复机器人在决策的最优预定时间稳定跟踪医生指定的运动轨迹,其特征在于:以stm32f411系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电。主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号xd(t)和计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按预定方式运动。

    82、与现有技术相比本发明有益效果。

    83、本发明安全速度的康复机器人最优预定时间决策的稳定控制方法。其特征为:采用反步法设计了康复机器人的预定时间控制器,使人机系统轨迹跟踪误差和速度跟踪误预定时间达到稳定;设计了强化学习决策算法,获得了人机系统稳定运动的最优预定时间;构建了安全速度约束条件并设计控制障碍函数,提出了安全速度的最优预定时间稳定跟踪控制方法。本发明从人机系统安全速度和合作运动稳定时间的新视角,保障了康复机器人的安全性。


    技术特征:

    1.安全速度的康复机器人最优预定时间决策的稳定控制方法,其特征在于:包括步骤:

    2.根据权利要求1所述的安全速度的康复机器人最优预定时间决策的稳定控制方法,其特征在于:步骤s1具体分为:

    3.根据权利要求2所述的安全速度的康复机器人最优预定时间决策的稳定控制方法,其特征在于:步骤s2具体分为:

    4.根据权利要求1所述的安全速度的康复机器人最优预定时间决策的稳定控制方法,其特征在于:步骤s3具体分为:

    5.根据权利要求1所述的安全速度的康复机器人最优预定时间决策的稳定控制方法,其特征在于:还包括步骤:基于stm32f411系列单片机将输出pwm信号提供给电机驱动模块,使康复机器人在决策的最优预定时间稳定跟踪医生指定的运动轨迹;具体为:以stm32f411系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电;主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号xd(t)和计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按预定方式运动。


    技术总结
    本发明涉及轮式康复机器人的控制领域,尤其是安全速度的康复机器人最优预定时间决策的稳定控制方法。其包括基于康复机器人动力学模型,采用反步法设计跟踪控制器,使人机系统跟踪误差预定时间达到稳定;提出康复机器人的强化学习决策算法,从而获得人机系统稳定运动的最优预定时间;建立人机系统安全速度约束条件,并设计安全速度控制障碍函数,进而得到最优预定时间稳定跟踪的安全控制器。基于STM32F411系列单片机将输出PWM信号提供给电机驱动模块,使康复机器人在决策的最优预定时间以安全速度稳定跟踪医生指定的训练轨迹。该方法巧妙地设计了康复机器人的安全速度,并提出了最优预定时间决策的稳定跟踪控制方法,提高了人机系统跟踪运动的稳定性和安全性。

    技术研发人员:孙平,曹涵,常洪彬,杨德国,何维高,王慕文,张琦
    受保护的技术使用者:沈阳工业大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-27444.html

    最新回复(0)