机械手臂自动化精密装配方法及装置

    专利查询2025-11-26  3


    本技术涉及机械手臂,尤其涉及一种机械手臂自动化精密装配方法及装置。


    背景技术:

    1、当前,工业生产过程中使用的自动化装配系统所涉及的装配方法包括:基于预设的程序和固定的操作模式使用机械手臂配合视觉系统进行部件的精确定位和装配,由于前述方法主要依赖于预设的程序和固定的操作模式实现,从而导致了前述方法虽然能够有效执行重复性高且变化小的装配任务,但在应用于复杂多变的装配环境中时,前述方法装配部件的准确性较低。


    技术实现思路

    1、本技术提供了一种机械手臂自动化精密装配方法及装置,主要目的在于解决相关技术在应用于复杂多变的装配环境中时,装配部件的准确性较低的问题。

    2、根据本技术的第一方面,提供了一种机械手臂自动化精密装配方法,其中,包括:

    3、控制3d扫描设备对整个装配环境进行扫描,得到多张目标点云数据;基于点云配准算法对所述多张目标点云数据进行处理,得到整个装配环境的3d环境数据;基于预训练的空间目标识别模型对所述3d环境数据进行物体识别,得到物体数据;所述物体数据包括待装配部件的初始空间坐标信息、装配目标位置的空间坐标信息;

    4、控制工业摄像头对待装配部件进行实时拍照,基于图像处理模块进行目标图像实时分析,得到待装配部件的类别信息、姿态信息;

    5、控制环境传感器采集所述待装配部件所处的环境信息,所述环境信息包括温度、光照强度以及机械手臂移动所述待装配部件的速度信息;

    6、基于增强学习决策模型根据所述物体数据、类别信息和姿态信息生成对所述待装配部件进行装配的第一装配策略;

    7、基于mpc算法根据所述物体数据、类别信息、姿态信息及环境信息生成对所述待装配部件进行装配的第二装配策略;

    8、对所述第二装配策略和所述第一装配策略进行加权融合,得到目标装配策略;

    9、根据所述目标装配策略控制所述机械手臂对所述待装配部件进行相应的装配操作。

    10、优选地,所述对所述第二装配策略和所述第一装配策略进行加权融合包括:

    11、基于预设评价指标分别对所述第一装配策略和所述第二装配策略进行评价,分别得到所述第一装配策略和所述第二装配策略两者在特定操作条件下的表现评分,所述特定操作条件由所述物体数据、类别信息、姿态信息及环境信息定义;

    12、根据两者在特定操作条件下的表现评分动态分配所述第一装配策略对应的第一权重以及所述第二装配策略对应的第二权重;

    13、基于所述第一权重、所述第二权重对所述第一装配策略、所述第二装配策略进行加权平均,得到所述目标装配策略。

    14、进一步地,所述图像处理模块为图像分割与点云分析的复合算法模块;

    15、图像分割与点云分析的复合算法模块基于所述目标图像进行特征提取,得到目标特征数据并根据所述目标特征数据确定所述待装配部件的所述类别信息、姿态信息;

    16、基于预设变换矩阵公式结合所述工业摄像头的内参矩阵、所述目标图像对所述待装配部件在所述世界坐标系中的位置和姿态进行估计,得到所述待装配部件的姿态信息,所述姿态信息包括从所述世界坐标系到摄像头坐标系的旋转矩阵;

    17、所述预设变换矩阵公式为:

    18、;

    19、其中,p是待装配部件在所述世界坐标系中的所述位置信息,r是从世界坐标系到摄像头坐标系的旋转矩阵,t是从世界坐标系到摄像头坐标系的平移向量,k是摄像头的内参矩阵,所述内参矩阵包括焦距和主点坐标,t(p)表示所述待装配部件在目标图像平面上的投影点p的齐次坐标,[r|t]是一个增广矩阵,其通过将旋转矩阵r和平移向量t组合起来形成,用于同时表示旋转和平移变换。

    20、进一步地,基于增强学习决策模型根据所述物体数据、类别信息和姿态信息对所述待装配部件进行装配的第一装配策略包括:

    21、所述增强学习决策模型采用软演员-评论家算法;所述软演员-评论家算法包括演员网络和评论家网络;

    22、基于演员网络根据所述物体数据、类别信息和姿态信息生成对所述待装配部件进行装配的第一装配策略。

    23、进一步地,在根据所述目标装配策略控制所述机械手臂对所述待装配部件进行相应的装配操作之后,所述机械手臂自动化精密装配方法还包括:

    24、基于评论家网络中的奖励函数对所述机械手臂根据所述目标装配策略执行的装配操作的表现进行奖励评价,得到奖励值;

    25、根据所述奖励值对所述评论家网络和所述演员网络进行迭代更新,得到包括更新后评论家网络和更新后演员网络的更新后增强学习决策模型;

    26、基于所述更新后增强学习决策模型对后续所述机械手臂执行的装配操作进行控制;

    27、所述奖励函数的公式为:

    28、;

    29、其中,d表示所述机械手臂的执行装配操作后的状态与目标状态之间的目标距离,δt表示完成装配操作所需时间,e表示能量消耗,系数α为所述目标距离的权重参数,β为所述装配操作所需时间的权重参数,γ是能量消耗的权重参数,α,β和γ用于调整奖励函数中各项的影响力,r(s,a)表示在s状态下采取动作a后所获得的奖励值。

    30、进一步地,根据所述奖励值对所述评论家网络和所述演员网络进行迭代更新,得到包括更新后评论家网络和更新后演员网络的更新后增强学习决策模型包括:

    31、根据所述评论家网络中的价值函数对所述机械手臂根据所述目标装配策略执行的装配操作的表现进行价值评价,得到目标价值;

    32、基于所述目标价值定义所述评论家网络的损失函数;

    33、基于所述损失函数计算所述评论家网络的目标梯度,并基于随机梯度下降算法根据所述目标梯度迭代更新所述评论家网络的网络参数,得到所述更新后评论家网络;

    34、根据所述目标价值计算所述演员网络的策略梯度,并基于随机梯度下降算法根据所述策略梯度迭代更新所述演员网络的网络参数,得到所述更新后演员网络;

    35、基于所述更新后评论家网络和所述更新后演员网络替换所述评论家网络和所述演员网络,得到包括所述更新后评论家网络和所述更新后演员网络的更新后增强学习决策模型;

    36、所述随机梯度下降算法的公式为:

    37、;

    38、其中,θ表示网络参数,η是学习率,▽θq(s,a∣θ)是对目标函数q(s,a∣θ)的梯度,表示调整θ以增加在状态s下采取行动a后所获得的所述目标价值,目标价值依赖于网络参数θ,θold在更新之前的网络参数,θnew表示更新后的网络参数。

    39、优选地,基于mpc算法根据所述物体数据、类别信息、姿态信息及环境信息生成对所述待装配部件进行装配的第二装配策略包括:

    40、基于mpc算法的第一成本函数根据所述物体数据、类别信息、姿态信息及环境信息生成对所述待装配部件进行装配的第二装配策略;

    41、第一成本函数的公式为:

    42、;

    43、其中,j(x,u)是第一成本函数的总成本,总成本为系统状态序列x和控制输入序列u的函数,xk表示在时间步k的系统状态,uk表示在时间步k的控制输入,xn表示在预测范围n中任一时间步的系统状态,q和r是权重矩阵,用于平衡状态误差和控制动作的成本,q矩阵用于加权状态变量的偏差,反映对系统状态接近期望目标的偏好,r矩阵用于加权控制输入,反映对控制动作经济成本或能量消耗的偏好,p是终端权重矩阵,用于在预测范围结束时评估最终状态与目标状态之间的差异,n是预测范围,t表示转置矩阵、min表示最小化操作。

    44、进一步地,所述机械手臂自动化精密装配方法包括:

    45、基于第二成本函数对所述机械手臂的运行参数和/或图像分割与点云分析的复合算法的属性参数进行调整,以保证装配操作的准确度,所述第二成本函数设置于遗传算法或模拟退火算法;

    46、所述第二成本函数的公式为:

    47、;

    48、其中,ω代表成本函数,θ代表参数集,tc、ec和qc分别代表周期时间、能耗和质量控制的成本,λ1,λ2,λ3是调节各因素重要性的权重,周期时间tc的优化目标为减少每个装配周期内的总时间,能耗ec的优化目标为降低系统运行的平均功耗,质量控制qc的优化关注于减少不合格品的产出比例。

    49、进一步地,还包括:

    50、根据物体数据、类别信息、姿态信息及环境信息判断所述机械手臂在执行装配操作的过程中是否存在异常;

    51、在确定存在异常的情况下,执行告警并输出维修方案。

    52、本技术的第二方面公开了一种机械手臂自动化精密装配装置,包括:

    53、控制单元,用于控制3d扫描设备对整个装配环境进行扫描,得到多张目标点云数据;用于控制工业摄像头对待装配部件进行实时拍照;用于控制环境传感器采集所述待装配部件所处的环境信息,所述环境信息包括温度、光照强度以及所述机械手臂移动所述待装配部件的速度信息;

    54、处理单元,用于基于点云配准算法对所述多张目标点云数据进行处理,得到整个装配环境的3d环境数据;用于基于预训练的空间目标识别模型对所述3d环境数据进行物体识别,得到物体数据;所述物体数据包括待装配部件的初始空间坐标信息、装配目标位置的空间坐标信息;用于基于图像处理模块进行目标图像实时分析,得到待装配部件的类别信息、姿态信息;

    55、第一生成单元,用于基于增强学习决策模型根据所述物体数据、类别信息和姿态信息生成对所述待装配部件进行装配的第一装配策略;

    56、第二生成单元,用于基于mpc算法根据所述物体数据、类别信息、姿态信息及环境信息生成对所述待装配部件进行装配的第二装配策略;

    57、融合单元,用于对所述第二装配策略和所述第一装配策略进行加权融合,得到目标装配策略;

    58、装配单元,用于根据所述目标装配策略控制所述机械手臂对所述待装配部件进行相应的装配操作。

    59、根据本技术的第三方面,提供了一种电子设备,包括:

    60、至少一个处理器;以及

    61、与所述至少一个处理器通信连接的存储器;其中,

    62、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面所述的机械手臂自动化精密装配方法。

    63、根据本技术的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述第一方面所述的机械手臂自动化精密装配方法。

    64、根据本技术的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如前述第一方面所述的机械手臂自动化精密装配方法。

    65、本发明的有益效果是:利用3d扫描设备、工业摄像头及环境传感器的结合,则实现了复杂多变的装配环境中相关信息的采集;利用点云配准算法、预训练的空间目标识别模型及图像处理模块,实现了装配环境下的待装配部件的初始空间坐标信息、装配目标位置的空间坐标信息、待装配部件的类别信息和待装配部件的姿态信息的精确获得,为后续依据上述数据及信息进行机械手臂的运动轨迹路径规划提供了保障;随着不同装配环境的变化,第二装配策略和第一装配策略进行动态加权融合,进而实现对复杂多变的装配环境的适应;通过将所述第一装配策略和所述第二装配策略加权融合后控制所述机械手臂执行装配操作,则提高了装配操作的准确性。


    技术特征:

    1.一种机械手臂自动化精密装配方法,其特征在于,包括:

    2.根据权利要求1所述的机械手臂自动化精密装配方法,其特征在于,对所述第二装配策略和所述第一装配策略进行加权融合包括:

    3.根据权利要求2所述的机械手臂自动化精密装配方法,其特征在于,所述图像处理模块为图像分割与点云分析的复合算法模块;

    4.根据权利要求3所述的机械手臂自动化精密装配方法,其特征在于,基于增强学习决策模型根据所述物体数据、类别信息和姿态信息生成对所述待装配部件进行装配的第一装配策略包括:

    5.根据权利要求4所述的机械手臂自动化精密装配方法,其特征在于,在根据所述目标装配策略控制所述机械手臂对所述待装配部件进行相应的装配操作之后,所述机械手臂自动化精密装配方法还包括:

    6.根据权利要求5所述的机械手臂自动化精密装配方法,其特征在于,根据所述奖励值对所述评论家网络和所述演员网络进行迭代更新,得到包括更新后评论家网络和更新后演员网络的更新后增强学习决策模型包括:

    7.根据权利要求1-6任一项所述的机械手臂自动化精密装配方法,其特征在于,基于mpc算法根据所述物体数据、类别信息、姿态信息及环境信息生成对所述待装配部件进行装配的第二装配策略包括:

    8.根据权利要求7所述的机械手臂自动化精密装配方法,其特征在于,所述机械手臂自动化精密装配方法包括:

    9.根据权利要求8所述的机械手臂自动化精密装配方法,其特征在于,还包括:

    10.一种机械手臂自动化精密装配装置,其特征在于,包括:


    技术总结
    本申请公开了机械手臂自动化精密装配方法及装置,涉及机械手技术领域,基于增强学习决策模型根据物体数据、类别信息和姿态信息生成对待装配部件进行装配的第一装配策略;基于MPC算法根据物体数据、类别信息、姿态信息及环境信息生成对待装配部件进行装配的第二装配策略,通过将第一装配策略和第二装配策略加权融合后,实现了随着不同装配环境的变化,动态生成对机械手臂进行控制的目标装配策略,进而实现对复杂多变的装配环境的适应,控制机械手臂执行装配操作,提高了装配操作的准确性。

    技术研发人员:陈诚,沈鲁光,陈培佳,张锦辉,郭容成,成思源,林心扬,伍钧,方梓骅
    受保护的技术使用者:广东工业大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-32218.html

    最新回复(0)