一种具有非对称时滞的动态不确定性系统的自适应跟踪控制方法

专利查询2022-07-08 194

1.本发明涉及遥操作控制技术领域，具体涉及一种具有非对称时滞的动态不确定性系统的自适应跟踪控制方法。

背景技术：

2.遥操作机器人系统可以最大程度地保护操作者探索未知环境时的安全，拓展了未知危险环境中人类的操作能力。典型的遥操作系统是指由人作为操作端在本地通过发送计算机指令或者通过操控操作手臂来远程控制处于远端工作环境中的机器人，使其按照一定方式完成指定任务的机器人控制系统。遥操作系统与全自动系统相比，能够在主端和从端之间双向传输控制指令和工作环境的反馈信息，不仅大幅度地提高了操作者的安全性和机器人的工作效率，而且通过人操作者更加精确的控制能够避免未知环境的干扰，降低机构的故障发生率和损坏率，提高复杂任务的完成效率，操作员使系统更加灵活。
3.目前遥操作机器人系统需要解决两大重点问题：一是存在于主、从端通信信道的时延问题；二是由于系统内、外部模型高度非线性所引起的各类不确定性问题。研究者基于不同思想提出了多种双边遥操作控制算法来克服系统时延对稳定性带来的影响，同时通过与其他控制器设计相结合的方式，解决遥操作双边控制中存在的模型不确定与外界干扰问题。但依然存在下列问题：1)实现系统稳定性的时候，无法兼顾系统透明性，往往通过无源性控制理论来设计，使得系统过度保守而导致透明性下降；2)部分控制律实现始终需要假定时滞导数是有界的，由于信息传输信道的随机性，在连续非线性系统的框架下，很少对抖动时延进行处理；3)高透明性的实现建立在对系统动力学模型参数精确求解的基础上。
4.因此，如何提供一种遥操作控制方法，使其提高了系统的透明性，缩短时间，避免受到外界干扰，是本领域技术人员亟待解决的技术问题。

技术实现要素：

5.为此，本发明提供一种具有非对称时滞的动态不确定性系统的自适应跟踪控制方法，以解决现有技术中由于实现系统稳定性而导致的无法兼顾系统透明性的问题。
6.为了实现上述目的，本发明提供如下技术方案：
7.一种具有非对称时滞的动态不确定性系统的自适应跟踪控制方法，包括以下步骤：
8.s1：以一个包含两个n自由度机器人的遥操作系统为对象，在考虑机器人关节摩擦的条件下，建立系统动力学模型，给出此类非线性模型的结构特征；
9.s2：利用模糊逻辑和神经网络结构，建立数据运算结构；
10.s3：基于反步法，定义从端机器人的位置误差信号、速度误差信号；根据模糊神经网络运算结构，设计从端控制律；设计从端机器人的模糊神经网络权重参数和误差估计的自适应更新律，使得模糊神经网络能够在不依赖加速度信号和外部扰动上界信息的条件下
逼近机器人的动力学；
11.s4：利用主端机器人的位置时延信号，设计具有重力补偿的主端模糊神经网络控制律；设计主端机器人的模糊神经网络权重参数和误差估计的自适应更新律，使得从端实际的力反馈信息能够实时提供给主端。
12.进一步地，建立s1中的双边遥操作系统的动力学模型具体包括以下步骤：
13.s101：建立主端机器人模型：
[0014][0015]
建立从端机器人模型：
[0016][0017]
其中，qi，分别为主从端机器人的关节位置、速度和加速度；为主从端机器人的正定惯性矩阵；为主从端机器人的科氏力和离心力项；为主从端机器人的重力项；为粘性摩擦力；为库伦摩擦力，μ
ci
为库伦摩擦系数；为存在上界的外部扰动；主从端机器人各关节的输入力矩；为操作者施加在主端机器人上的力；为从端机器人受到的环境力；为雅克比矩阵；下标i∈{m,s}表示主、从端机械臂；
[0018]
s102：建立操作者动力学模型：
[0019][0020]
建立远程环境模型：
[0021][0022]
其中，mi，bi，为操作者或远程环境的质量矩阵、阻尼矩阵和刚度矩阵，下标i∈{h,e}代表操作者和远速度矢量，为操作者或远程环境产生的外力；
[0023]
s103：将操作者动力学模型与主端机器人模型整合，得到主端系统动力学模型：
[0024][0025]
将远程环境模型与从端机器人模型整合，得到从端系统动力学模型：
[0026][0027]
其中，
[0028]
上述双边遥操作系统的动力学模型具有如下结构特征：
[0029]
1)存在不等式成立||mi||≤b1 b2||qi|| b3||qi||2，即动力学模型不确定和外部非线性扰动存在上界；
[0030]
2)其中，为斜正定矩阵。
[0031]
进一步地，所述步骤s3中利用反步法处理位置误差参考信号得到从端控制律，利用反步法处理速度误差信号并借助模糊神经网络逼近其中的不确定项，以此设计从端自适应更新律，所述步骤s3具体包括以下步骤：
[0032]
s301：定义如下变量对变量x1和x2求导，可以得到如下等式：
[0033][0034][0035]
系统输出选取为y＝x1；
[0036]
s302：定义位置误差信号：
[0037][0038]
定义速度误差信号：
[0039][0040]
定义虚拟控制信号：
[0041][0042]
将式(16)和式(17)两端对时间t求导，并考虑式(18)，可以表达为
[0043][0044]
其中
[0045]
s303：选取如下李雅普诺夫方程：
[0046][0047]
将李雅普诺夫方程式(20)对时间t求导，得到
[0048][0049]
显然，当误差信号z2趋近于零时，根据李雅普诺夫稳定性判据，从端系统将渐进收敛，设计如下从端控制律：
[0050][0051]
其中，为误差估计自适应更新律，为模糊神经网络的实际逼近值；
[0052]
s304：选取如下李雅普诺夫方程：
[0053][0054]
然后，对其取相对时间的导数并得到如下等式
[0055][0056]
将式从端控制律(22)代入式(24)，可以得到
[0057][0058]
利用模糊神经网络逼近不确定项ψs，则有
[0059][0060]
其中，且模糊神经网络的实际逼近值为
[0061]
s305：考虑到估计式(26)，式(24)可以变换为
[0062][0063]
进一步可以得到
[0064][0065]
其中，
[0066]
s306：设计模糊神经网络权重参数自适应更新律为
[0067][0068]
其中，γs代表对角正定常数矩阵；
[0069]
设计误差估计自适应更新律选择为
[0070][0071]
进一步地，在式(26)中，模糊神经网络被用来逼近不确定项φs，但模糊神经网络的输入变量中包含加速度信号，为了避免量测加速度信号带来的诸多不便，给出一种无加速度信号的等价输入变量，根据主端动力学模型，主端加速度信号可表达为
[0072][0073]
将从端系统的模糊神经网络输入变量替换为如下不依赖于加速度信号的形式：
[0074][0075]
进一步地，所述步骤s4具体包括以下步骤：
[0076]
s401：定义主端机器人关节位置时延信号
[0077][0078]
设计具有重力补偿的主端机器人控制律为
[0079][0080]
其中，
[0081]
s402：考虑到主端机器人动力学模型的重力项不确定性主端机器人控制律(34)变为
[0082][0083]
其中，代表主端机器人系统不确定项和摩擦力；
[0084]
s403：利用模糊神经网络对上述不确定项um进行在线估计，得到
[0085][0086]
其中，xm代表模糊神经网络的输入量，代表规则层的输出量，
òm代表模糊神经网络的最优估计误差；
[0087]
s404：取um的估计为
[0088][0089]
将式(35)中不确定项替换为估计值式(37)，那么式(34)中给出的主端控制律可以重写为：
[0090][0091]
进一步地，参考从端更新律的结构设计主端自适应更新律，模糊神经网络权值主端自适应更新律为
[0092][0093]
其中，γm为对角正定常数矩阵；
[0094]
设计误差估计项参数主端自适应更新律选择为
[0095][0096]
进一步地，所述步骤s103中进行模型整合时利用的是作业空间中末端速度和关节角度空间中关节速度之间的映射关系：
[0097][0098]
其微分为：
[0099][0100]
其中，机器人关节速度雅可比矩阵
[0101]
进一步地，所述步骤s2中的模糊神经网络包括成员函数层、规则层和模糊逻辑层，所述成员函数层以矩形框节点表示输入变量的隶属度函数，以区分输入量x＝[x1…
xi…
xn]
t
与分类器的契合度，所述规则层以标有π的圆形节点表示模糊推理规则，所述模糊逻辑层以标有σ的圆形节点表示网络的输出信号。
[0102]
进一步地，所述步骤s2中建立数据运算结构具体包括以下步骤：
[0103]
s201：所述成员函数层选取如下高斯成员函数作为输入量的隶属度函数：
[0105][0106]
其中ci和分别高斯函数的平均值和标准偏差；
[0107]
s202：所述规则层将推理结果传递到模糊逻辑层，规则层的输出可以表述为：
[0108][0109]
其中，lk代表规则层第k个输出，代表输出层和规则层之间的权值；
[0110]
s203：所述模糊逻辑层的输出信号按照如下方法计算：
[0111][0112]
按照模糊函数向量的概念，模糊神经网络的输出可以归纳为
[0113]
[0114]
其中，y＝[y
1 y2ꢀ…ꢀyo
]，
[0115]
s204：根据全局逼近理论，对于任意闭集上的非线性函数u存在一个最优逼近权值矩阵w*，满足如下形式：
[0116][0117]
其中，
ò
(x(t))代表有界最小逼近误差。
[0118]
本发明具有如下优点：
[0119]
本发明解决了具有非对称时延与附加不确定性问题的非线性双边遥操作系统稳定性跟踪问题，本发明利用模糊神经网络逼近模型中的不确定项，并结合反步法来设计了从端控制器，使得系统位置跟踪误差一致收敛，并提高了系统的透明性。本发明在方法上利用自适应的思想，去实时在线更新控制律模型中的权重参数以及跟踪误差，进一步缩短了实际系统实现稳定的调节时间，同时控制律的信号设计避免了神经网络逼近过程中对于加速度信号以及外部扰动上界信息的依赖。
附图说明
[0120]
为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引伸获得其它的实施附图。
[0121]
本说明书所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定本发明可实施的限定条件，故不具技术上的实质意义，任何结构的修饰、比例关系的改变或大小的调整，在不影响本发明所能产生的功效及所能达成的目的下，均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
[0122]
图1为本发明所设计的具有非对称时滞系统的自适应跟踪控制器结构示意图；
[0123]
图2为本发明所设计控制器的模糊逻辑结构示意图；
[0124]
图3为本发明所设计控制器的仿真系统示意图；
[0125]
图4为本发明所设计控制器在操作者施加交变外力条件下的位置跟踪仿真图；
[0126]
图5为本发明所设计控制器在操作者施加交变外力条件下的位置跟踪误差仿真图；
[0127]
图6为本发明所设计控制器在操作者施加交变外力条件下的控制力矩跟踪仿真图；
[0128]
图7为本发明所设计控制器在物理碰撞条件下的位置跟踪仿真图；
[0129]
图8为本发明所设计控制器在物理碰撞条件下的控制力矩跟踪仿真图；
[0130]
图9为本发明所设计控制器与其他两类神经网络控制器进行圆轨迹跟踪的位置跟踪仿真图；
具体实施方式
[0131]
以下由特定的具体实施例说明本发明的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0132]
一种具有非对称时滞的动态不确定性系统的自适应跟踪控制方法，包括以下步骤：
[0133]
s1：以一个包含两个n自由度机器人的遥操作系统为对象，在考虑机器人关节摩擦的条件下，建立系统动力学模型，具体为：
[0134]
s101：建立主端机器人模型：
[0135][0136]
建立从端机器人模型：
[0137][0138]
其中，qi，分别为主从端机器人的关节位置、速度和加速度；为主从端机器人的正定惯性矩阵，为主从端机器人的科氏力和离心力项，为主从端机器人的重力项；为粘性摩擦力；为库伦摩擦力，μ
ci
为库伦摩擦系数；为存在上界的外部扰动；主从端机器人各关节的输入力矩；为操作者施加在主端机器人上的力；为从端机器人受到的环境力；为雅克比矩阵；下标i∈{m,s}表示主、从端机械臂；
[0139]
s102：建立操作者动力学模型：
[0140][0141]
建立远程环境模型：
[0142][0143]
其中，mi，bi，为操作者或远程环境的质量矩阵、阻尼矩阵和刚度矩阵，下标i∈{h,e}代表操作者、远速度矢量；为操作者或远程环境产生的外力；
[0144]
s103：将操作者动力学模型与主端机器人模型整合，得到主端系统动力学模型：
[0145][0146]
将远程环境模型与从端机器人模型整合，得到从端系统动力学模型：
[0147][0148]
其中，
[0149]
进行模型整合时利用的是作业空间中末端速度和关节角度空间中关节速度之间的映射关系：
[0150][0151]
其微分为：
[0152][0153]
其中，机器人关节速度雅可比矩阵
[0154]
上述遥操作主从端系统动力学模型具有如下结构特征：
[0155]
1)存在不等式成立||mi||≤b1 b2||qi|| b3||qi||2，也就是说，动力学模型不确定和外部非线性扰动存在上界；
[0156]
2)为斜正定矩阵。
[0157]
控制算法的稳定性需要在满足上述结构特征的情况下证明。
[0158]
如图2所示，模糊神经网络包括成员函数层、规则层和模糊逻辑层，所述成员函数层以矩形框节点表示输入变量的隶属度函数，以区分输入量x＝[x1…
xi…
xn]
t
与分类器的契合度，所述规则层以标有π的圆形节点表示模糊推理规则，所述模糊逻辑层以标有σ的圆形节点表示网络的输出信号。
[0159]
s2：利用模糊逻辑和神经网络结构，建立数据运算结构，具体为：
[0160]
s201：所述成员函数层选取如下高斯成员函数作为输入量的隶属度函数：
[0162][0163]
其中ci和分别高斯函数的平均值和标准偏差；
[0164]
s202：所述规则层将推理结果传递到模糊逻辑层，规则层的输出可以表述为：
[0165][0166]
其中，lk代表规则层第k个输出，代表输出层和规则层之间的权值；
[0167]
s203：所述模糊逻辑层的输出信号按照如下方法计算：
[0168][0169]
按照模糊函数向量的概念，模糊神经网络的输出可以归纳为
[0170][0171]
其中，y＝[y
1 y2ꢀ…ꢀyo
]，
[0172]
s204：根据全局逼近理论，对于任意闭集上的非线性函数u存在一个最优逼近权值矩阵w*，满足如下形式：
[0173][0174]
其中，
ò
(x(t))代表有界最小逼近误差。
[0175]
建立模糊神经网络运算结构对输入信号进行处理，用来在线估计系统动力学模型中的不确定项。
[0176]
s3：基于反步法，定义从端机器人的位置误差信号、速度误差信号；根据模糊神经网络运算结构，设计从端控制律；设计从端机器人的模糊神经网络权重参数和误差估计的自适应更新律，使得模糊神经网络能够在不依赖加速度信号和外部扰动上界信息的条件下
逼近机器人的动力学。
[0177]
利用反步法处理位置误差参考信号得到从端控制律，利用反步法处理速度误差信号并借助模糊神经网络逼近其中的不确定项，以此设计从端自适应更新律，具体为：
[0178]
s301：定义如下变量对变量x1和x2求导，可以得到如下等式：
[0179][0180][0181]
系统输出选取为y＝x1；
[0182]
s302：定义位置误差信号：
[0183][0184]
定义速度误差信号：
[0185][0186]
定义虚拟控制信号：
[0187][0188]
将式(16)和式(17)两端对时间t求导，并考虑式(18)，可以表达为
[0189][0190]
其中
[0191]
s303：选取如下李雅普诺夫方程：
[0192][0193]
将李雅普诺夫方程式(20)对时间t求导，得到
[0194][0195]
显然，当误差信号z2趋近于零时，根据李雅普诺夫稳定性判据，从端系统将渐进收敛，设计如下从端控制律：
[0196][0197]
其中，为误差估计自适应更新律，为模糊神经网络的实际逼近值；
[0198]
s304：选取如下李雅普诺夫方程：
[0199][0200]
然后，对其取相对时间的导数并得到如下等式
[0201][0202]
将式从端控制律(22)代入式(24)，可以得到
[0203]
[0204]
利用模糊神经网络逼近不确定项ψs，则有
[0205][0206]
其中，且模糊神经网络的实际逼近值为
[0207]
s305：考虑到估计式(26)，式(24)可以变换为
[0208][0209]
进一步可以得到
[0210][0211]
其中，
[0212]
s306：设计模糊神经网络权重参数自适应更新律为
[0213][0214]
其中，γs代表对角正定常数矩阵；
[0215]
设计误差估计自适应更新律选择为
[0216][0217]
在式(26)中，模糊神经网络被用来逼近不确定项φs，但是模糊神经网络的输入变量中包含加速度信号，为了避免量测加速度信号带来的诸多不便，给出一种无加速度信号的等价输入变量，根据主端动力学模型，主端加速度信号可表达为
[0218][0219]
这表明从端系统的模糊神经网络输入变量可以替换为如下不依赖于加速度信号的形式：
[0220][0221]
s4：利用主端机器人的位置时延信号，设计具有重力补偿的主端模糊神经网络控制律；设计主端机器人的模糊神经网络权重参数和误差估计的自适应更新律，使得从端实际的力反馈信息能够实时提供给主端。具体为：
[0222]
s401：定义主端机器人关节位置时延信号
[0223][0224]
设计具有重力补偿的主端机器人控制律为
[0225][0226]
其中，
[0227]
s402：考虑到主端机器人动力学模型的重力项不确定性主端机器人控制律(34)变为
[0228][0229]
其中，代表主端机器人系统不确定项和摩擦力；
[0230]
s403：利用模糊神经网络对上述动力学不确定项进行um在线估计，得到
[0231][0232]
其中，xm代表模糊神经网络的输入量，代表规则层的输出量，
òm代表模糊神经网络的最优估计误差；
[0233]
s404：取um的估计为
[0234][0235]
将式(35)中不确定项替换为估计值式(37)，那么式(34)中给出的主端控制律可以重写为：
[0236][0237]
参考从端更新律的结构设计主端自适应更新律，设计模糊神经网络权值主端自适应更新律为
[0238][0239]
其中，γm为对角正定常数矩阵；
[0240]
设计误差估计项参数主端自适应更新律选择为
[0241][0242]
如图1所示，d1、d2代表时延信号，且通讯网络中只有速度和位置信号，本发明通过双边控制器的设计，可以削弱时延的影响并解决一定的不确定性问题，满足系统稳定控制的要求。
[0243]
如图1所示，本发明是在通讯链路存在非对称时延条件下，动态不确定性控制系统主从端达到跟踪稳定的仿真研究，具体操作步骤如下：
[0244]
步骤1：建立遥操作系统动力学模型：
[0245]
本发明使用两个相同的二自由度机械臂作为遥操作系统仿真对象，如图3所示。
[0246]
主端系统模型：
[0247]
从端系统模型：
[0248]
主从端系统模型中各个矩阵和向量具体表达式如下：
[0249][0250][0251][0252]
其中：si＝sin(qi)，ci＝cos(qi)；
[0253]
摩擦力模型如下：
[0254][0255]
机械臂参数如下：
[0256]
m1＝20.34kg；m2＝17.68kg；l1＝l2＝0.511m；μ
f1
＝3.1,μ
f2
＝3.6,μ
c1
＝4.2,μ
c2
＝4.5
[0257]
系统时延参数如下：
[0258]
d1＝1.2s，d2＝1.6s
[0259]
步骤2：建立控制器为：
[0260]
主端控制器：
[0261]
从端控制器：
[0262]
其中
[0263]
模糊神经网络权重参数自适应更新律设计为：
[0264]
主端：
[0265]
从端：
[0266]
其中
[0267]
跟踪误差自适应更新律设计为
[0268]
主端：
[0269]
从端：
[0270]
参数选择如下：
[0271]kp
＝-10.7，kd＝8.2，k
p
＝-10.7，λ1＝λ2＝5，b＝4，c＝[-2,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0]；初始位置qm＝[π/2
ꢀ‑
π/2]
t
，qs＝[π/2
ꢀ‑
π/2]
t
，初始速度
[0272]
为了更好地验证本发明算法的有效性和先进性，仿真实验共设计三类不同测试：1)交变外力下的跟踪实验，初始操作者施加力为实验时间为50s；2)碰撞与恢复实验，初始操作者施加力为实验时间为50s，在t∈[15,20]时，加入墙体阻拦从端机械臂ds＝[-80-80]；3)与其他类神经网络的对比测试，对比对象1为pd-神经网络控制器，参数为k
p
＝diag{5,5}，k
mv
＝diag{25,25}，k
sv
＝diag{1.0,1.0}，γ＝diag{3.5,3.5}，对比对象2为rbf神经网络控制器，参数为k
mv
＝diag{40,40}，k
mv
＝diag{40,40}，γm＝diag{2.5,2.5}，γs＝diag{3.5,3.5}，三款控制器进行画圆轨迹跟踪操作，操作者施加力为实验时间为40s。
[0273]
结合附图对本发明效果做进一步说明：
[0274]
通过图4-6可以看出，在说明中给定的初始条件下和参数设置下，遥操作系统中从
端可以按照期望的运动轨迹跟踪主端，并完成遥操作运动，在15s内，主、从端各机械臂的运动轨迹跟踪实现收敛，同时跟踪误差较小，具有良好的轨迹跟踪性能，所设计控制器生成的控制力矩满足有界性。
[0275]
通过图7-8可以看出，当15s时，从端机械臂发生物理碰撞。然后，主端系统的控制力矩更新环境的物理碰撞，数值突然变大，实现了操作者的力反馈性能。当物理碰撞在25s释放时，经过快速衰减振荡后，从端机械臂继续完成其跟踪任务，实验显示出所设计控制器从物理碰撞中的恢复能力和鲁棒性。
[0276]
通过图9可以看出，虽然这三个控制器都能在非对称时延和不确定性条件下实现渐近稳定控制，但与其他两类控制器相比，采用本发明所设计控制器的遥操作系统具有更好的精确操作能力。因此，在固定非对称时延、各种非线性和不确定性条件下，所设计控制器的位置跟踪方面的先进性得到了证明。
[0277]
虽然，上文中已经用一般性说明及具体实施例对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

转载请注明原文地址:https://tc.8miu.com/read-1955.html

专利

最新回复(0)