专利用于汽车拆解生产线的智能控制方法及系统

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210844316.3 (22)申请日 2022.07.19 (65)同一申请的已公布的文献号申请公布号 CN 114986518 A (43)申请公布日 2022.09.02 (73)专利权人聊城一明五金科技有限公司地址 252000 山东省聊城市高新区32 9省道南鲁西化工西临19 9号 (72)发明人黄绪明　 (74)专利代理机构北京真致博文知识产权代理事务所(普通合伙) 11720 专利代理师娄华 (51)Int.Cl. B25J 9/16(2006.01) B23P 19/00(2006.01)(56)对比文件 CN 113313265 A,2021.08.27 CN 111179121 A,2020.0 5.19 CN 111496770 A,2020.08.07 CN 110321666 A,2019.10.1 1 US 2021397959 A1,2021.12.23 US 2022019866 A1,202 2.01.20 WO 2020207219 A1,2020.10.15 CN 111488988 A,2020.08.04 周友行等.基于运动轨迹的机器人运动学逆解研究. 《机械科学与技术》 .2009,第28卷(第07 期), 审查员张曼丽 (54)发明名称用于汽车拆解生产线的智能控制方法及系统 (57)摘要本发明涉及智能控制技术领域，具体涉及一种用于汽车拆解生产线的智能控制方法及系统，该方法基于拆解汽车的顺序，采集每个阶段拆解前待拆解汽车的俯视图像，并获取拆解专家在拆解过程中，设定机械臂在每个阶段所对应的位姿状态向量和动作变化向量，以构成拆解专家的专家拆解轨迹；将每个阶段的俯视图像和拆解专家拆解时设定机械臂的所述位姿状态向量，通过策略网络得到待拆解汽车的AI拆解轨迹，构建AI拆解轨迹和专家拆解轨迹之间的错位熵函数，利用错位熵函数对策略网络进行迭代训练，以通过训练好的策略网络对汽车进行拆解。该方法使得智能拆解操作出现错误时，能够探索其他策略，增强策略网络的鲁棒性，保证了智能控制的拆解效果。权利要求书2页说明书8页附图1页 CN 114986518 B 2022.11.04 CN 114986518 B 1.一种用于汽车拆解生产线的智能控制方法，其特征在于，该方法包括以下步骤：基于拆解汽车的顺序，采集每个阶段拆解前待拆解汽车的俯视图像，并获取拆解专家在所述待拆解汽车的拆解过程中，设定机械臂在每个阶段所对应的位姿状态向量，以及设定机械臂在每个阶段的位姿变化所对应的动作变化向量，令最后一个阶段的动作变化向量中的元素都为0，将每个阶段的所述位姿状态向量和所述动作变化向量组成二元组数据，以构成拆解专家的专家拆解轨迹；将每个阶段的所述俯视图像和拆解专家拆解时设定机械臂的所述位姿状态向量，通过策略网络得到所述待拆解汽车的AI拆解轨迹，构建所述A I拆解轨迹和所述专家拆解轨迹之间的错位熵函数，利用所述错位熵函数对策略网络进行迭代训练，以通过训练好的策略网络对汽车进行拆解；其中，所述AI拆解轨迹的获取方法，包括：将第i个阶段的所述俯视图像和拆解专家在第 i个阶段中的所述位姿状态向量，输入策略网络得到第i个阶段中设定机械臂对应的AI动作变化向量，将所述AI动作变化向量和所述位姿状态向量组成第i个阶段的AI 二元组数据；获取所有阶段的所述AI二元组数据，将所有的所述AI二元组数据组成所述AI拆解轨迹；所述构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数的方法，包括：获取当前阶段的标准机械爪状态向量和实际机械爪状态向量，所述实际机械爪状态向量是由策略网络进行智能操作下得到的，所述标准机械爪状态向量是在拆解专家的拆解过程中得到的；当所标准机械爪状态向量和所述实际机械爪状态向量之间不满足预设条件时，重新进行当前阶段的操作，直到满足预设条件或达到重做次数阈值，并计算所述标准机械爪状态向量和所述实际机械爪状态向量之间的状态差异值；当满足预设条件时，则进行下一阶段操作；获取每个阶段的所述状态差异值，由所述状态差异值构建所述AI拆解轨迹和所述专家拆解轨迹之间的错位熵函数，所述错位熵函数的计算公式为：其中，为动作策略函数；为信息熵；为第i个阶段的动作策略；为第i 个阶段的所述状态差异值；为所述错位熵函数；为阶段的总数；所述利用所述错位熵函数对策略网络进行迭代训练的方法，包括：结合所述错位熵函数和所有阶段的总奖励值，利用梯度下降法得到策略网络对拆解过程的最优策略，最优策略是指最佳AI拆解轨迹，则最优策略的计算公式为：其中，为最优策略；为总奖励值；为温度系数；为期望；为期望最大时所对应的动作策略。权　利　要　求　书 1/2 页 2 CN 114986518 B 22.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法，其特征在于，所述位姿状态向量的获取方法，包括：根据设定机械臂中任意一个关节的位置和姿态自由度组成对应关节的状态数据，得到所有关节的所述状态数据；获取设定机械臂的固定装置的状态，将所有关节的所述状态数据和所述固定装置的状态组成设定机械臂的所述位姿状态向量。 3.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法，其特征在于，所述动作变化向量的获取方法，包括：采用KDL运动学库构建设定机械臂的运动学模型,并基于TRAC ‑IK逆运动学求解器计算设定机械臂的末端参考轨迹所对应的关节角度序列；获取机械臂的固定装置的开合度变动程度，将所述关节角度序列和所述开合度变动程度组成所述动作变化向量。 4.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法，其特征在于，所述标准机械爪状态向量和所述实际机械爪状态向量都是由机械爪的三个角度值和四个爪的压力值组成的。 5.如权利要求4所述的一种用于汽车拆解生产线的智能控制方法，其特征在于，所述预设条件为：其中，为所述标准机械爪状态向量；为所述实际机械爪状态向量；表示余弦相似度，表示同时满足两侧的条件，为任意一个，表示取绝对值，为所述标准机械爪状态向量中的第个角度值，为所述实际机械爪状态向量中的第个角度值，为所述标准机械爪状态向量中的第个压力值，为所述实际机械爪状态向量中的第个压力值。 6.如权利要求1所述的一种用于汽车拆解生产线的智能控制方法，其特征在于，所述总奖励值的获取方法，包括：将当前阶段中第一次重新操作得到的所述AI二元组数据作为初始二元组、最后一次重新操作的所述AI 二元组数据作为最优二元组；获取每个阶段的所述最优二元组和所述初始二元组，将所有阶段的所述最优二元组构成最优AI轨迹、所有阶段的所述初始二元组构成初始AI轨迹；利用奖励函数分别获取所述最优AI轨迹的第一奖励值和所述初始A I轨迹的第二奖励值，对第一奖励值和第二奖励值进行加权求和得到所述总奖励值，所述第二奖励值的权重为所有阶段的实际重做次数总和与所有阶段的重做次数阈值总和之间的比值，所述第一奖励值的权重为1减去所述比值的结果。 7.一种用于汽车拆解生产线的智能控制系统，包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1 ‑6任意一项所述方法的步骤。权　利　要　求　书 2/2 页 3 CN 114986518 B 3

专利 用于汽车拆解生产线的智能控制方法及系统

专利用于汽车拆解生产线的智能控制方法及系统