(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210844316.3
(22)申请日 2022.07.19
(65)同一申请的已公布的文献号
申请公布号 CN 114986518 A
(43)申请公布日 2022.09.02
(73)专利权人 聊城一明五金 科技有限公司
地址 252000 山东省聊城市高新区32 9省道
南鲁西化工西临19 9号
(72)发明人 黄绪明
(74)专利代理 机构 北京真致博文知识产权代理
事务所(普通 合伙) 11720
专利代理师 娄华
(51)Int.Cl.
B25J 9/16(2006.01)
B23P 19/00(2006.01)(56)对比文件
CN 113313265 A,2021.08.27
CN 111179121 A,2020.0 5.19
CN 111496770 A,2020.08.07
CN 110321666 A,2019.10.1 1
US 2021397959 A1,2021.12.23
US 2022019866 A1,202 2.01.20
WO 2020207219 A1,2020.10.15
CN 111488988 A,2020.08.04
周友行等.基 于运动轨 迹的机器人运动学逆
解研究. 《机 械科学与技术》 .2009,第28卷(第07
期),
审查员 张曼丽
(54)发明名称
用于汽车拆解生产线的智能控制方法及系
统
(57)摘要
本发明涉及智能控制技术领域, 具体涉及一
种用于汽车拆解生产线的智能控制方法及系统,
该方法基于拆解汽车的顺序, 采集每个阶段拆解
前待拆解汽 车的俯视图像, 并获取拆解专家在拆
解过程中, 设定机械臂在每个阶段所对应的位姿
状态向量和动作变化向量, 以构成拆解专家的专
家拆解轨迹; 将每个阶段的俯视图像和拆解专家
拆解时设定机械臂的所述位姿状态向量, 通过策
略网络得到待拆解汽车的AI拆解轨迹, 构建AI拆
解轨迹和专家 拆解轨迹 之间的错位熵 函数, 利用
错位熵函数对 策略网络进行迭代训练, 以通过训
练好的策略网络对汽车进行拆解。 该方法使 得智
能拆解操作出现错误时, 能够探索其他策略, 增
强策略网络的鲁棒性, 保证了智能控制的拆解效
果。
权利要求书2页 说明书8页 附图1页
CN 114986518 B
2022.11.04
CN 114986518 B
1.一种用于汽车拆解 生产线的智能控制方法, 其特 征在于, 该 方法包括以下步骤:
基于拆解汽车的顺序, 采集每个阶段拆解前待拆解汽车的俯视 图像, 并获取拆解专家
在所述待拆解汽车 的拆解过程中, 设定机械臂在每个阶段所对应的位姿状态向量, 以及设
定机械臂在每个阶段的位姿变化所对应的动作变化向量, 令最后一个阶段的动作变化向量
中的元素都为0, 将每个阶段的所述位姿状态向量和所述动作变化向量组成二元组数据, 以
构成拆解专 家的专家拆解轨 迹;
将每个阶段的所述俯视图像和拆解专家拆解 时设定机械臂的所述位姿状态向量, 通过
策略网络得到所述待拆解汽 车的AI拆解轨迹, 构建所述A I拆解轨迹和所述专家拆解轨迹 之
间的错位熵函数, 利用所述错位熵函数对策略网络进行迭代训练, 以通过训练好的策略网
络对汽车进行拆解;
其中, 所述AI拆解轨 迹的获取 方法, 包括:
将第i个阶段的所述俯视图像和拆解专家在第 i个阶段中的所述位姿状态向量, 输入策
略网络得到第i个阶段中设定机械臂对应的AI动作变化向量, 将所述AI动作变化向量和所
述位姿状态向量组成第i个阶段的AI 二元组数据;
获取所有阶段的所述AI二元组数据, 将所有的所述AI二元组数据组成所述AI拆解轨
迹;
所述构建所述AI拆解轨 迹和所述专 家拆解轨 迹之间的错 位熵函数的方法, 包括:
获取当前阶段的标准机械爪状态向量和实际机械爪状态向量, 所述实际机械爪状态向
量是由策略网络进行智能操作下得到的, 所述标准机械爪状态向量是在拆解专家的拆解过
程中得到的;
当所标准机械爪状态向量和所述实际机械爪状态向量之间不满足预设条件时, 重新进
行当前阶段的操作, 直到满足预设条件或达到重做 次数阈值, 并计算所述标准机械爪状态
向量和所述实际机械爪状态向量之间的状态差异值; 当满足预设条件时, 则进行下一阶段
操作;
获取每个阶段的所述状态差异值, 由所述状态差异值构建所述AI拆解轨迹和所述专家
拆解轨迹之间的错 位熵函数, 所述 错位熵函数的计算公式为:
其中,
为动作策 略函数;
为信息熵;
为第i个阶段的动作策 略;
为第i
个阶段的所述状态差异值;
为所述错位熵函数;
为阶段的总数;
所述利用所述 错位熵函数对策略网络进行迭代训练的方法, 包括:
结合所述错位熵函数和所有阶段的总奖励值, 利用梯度 下降法得到策略网络对拆解过
程的最优策略, 最优策略是指最佳AI拆解轨 迹, 则最优策略的计算公式为:
其中,
为最优策略;
为总奖励值;
为温度系数;
为期望;
为期
望最大时所对应的动作策略。权 利 要 求 书 1/2 页
2
CN 114986518 B
22.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法, 其特征在于, 所述位
姿状态向量的获取 方法, 包括:
根据设定机械臂中任意一个关节的位置和姿态自由度组成对应关节的状态数据, 得到
所有关节的所述状态数据; 获取设定机械臂的固定装置的状态, 将所有关节的所述状态数
据和所述固定装置的状态组成设定 机械臂的所述 位姿状态向量。
3.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法, 其特征在于, 所述动
作变化向量的获取 方法, 包括:
采用KDL运动学库构 建设定机械臂的运动学模型,并基于TRAC ‑IK逆运动学求解器计算
设定机械臂的末端参考轨迹所对应的关节角度序列; 获取机械臂的固定装置的开合度变动
程度, 将所述关节角度 序列和所述 开合度变动程度组成所述动作变化向量。
4.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法, 其特征在于, 所述标
准机械爪状态向量和所述实际机械爪状态向量都是由机械爪的三个角度值和四个爪的压
力值组成的。
5.如权利要求4所述的一种用于汽车拆解生产线的智能控制方法, 其特征在于, 所述预
设条件为:
其中,
为所述标准机械爪状态向量;
为所述实际机械爪状态向量;
表示余弦
相似度,
表示同时满足两侧的条件,
为任意一个,
表示取绝对值,
为所述标准机
械爪状态向量中的第
个角度值,
为所述实际机械爪状态向量中的第
个角度值,
为
所述标准机械爪状态向量 中的第
个压力值,
为所述实际机械爪状态向量 中的第
个压
力值。
6.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法, 其特征在于, 所述总
奖励值的获取 方法, 包括:
将当前阶段中第 一次重新操作 得到的所述AI二元组数据作为初始二元组、 最后 一次重
新操作的所述AI 二元组数据作为 最优二元组;
获取每个阶段的所述最优二元组和所述初始二元组, 将所有阶段的所述最优二元组构
成最优AI轨迹、 所有阶段的所述初始二元组构成初始AI轨迹; 利用奖励函数分别获取所述
最优AI轨迹的第一奖励值和所述初始A I轨迹的第二奖励值, 对第一奖励值和 第二奖励值进
行加权求和得到所述总奖励值, 所述第二奖励值的权重为所有阶段的实际重做次数总和与
所有阶段的重做次数阈值总和之间的比值, 所述第一奖励值的权重为1减去所述比值的结
果。
7.一种用于汽车拆解生产线的智能控制系统, 包括存储器、 处理器以及存储在所述存
储器中并在所述处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计算机程
序时实现如权利要求1 ‑6任意一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114986518 B
3
专利 用于汽车拆解生产线的智能控制方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:14:04上传分享