专利图像识别模型的训练方法、电子设备和存储介质

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202111614740.0 (22)申请日 2021.12.28 (65)同一申请的已公布的文献号申请公布号 CN 114005015 A (43)申请公布日 2022.02.01 (73)专利权人合肥的卢深视科技有限公司地址 230091 安徽省合肥市高新区习友路 3333号中国（合肥）国际智能语音产业园研发中心楼611-217室 (72)发明人浦煜　何武　付贤强　朱海涛　户磊　 (74)专利代理机构北京智晨知识产权代理有限公司 11584 专利代理师张婧(51)Int.Cl. G06V 10/774(2022.01) G06K 9/62(2022.01) 审查员刘晨曦 (54)发明名称图像识别模型的训练方法、电子设备和存储介质 (57)摘要本申请实施例涉及视觉搜索技术领域，公开了一种图像识别模型的训练方法、电子设备和存储介质，该方法包括：获取第一模型的训练样本；其中，训练样本标注用于表征训练样本的特征的特征类别的标签；基于第一模型的网络结构，构建第二模型；根据训练样本和第三模型，获取第三模型对应的各特征类别的类别中心向量；其中，第一模型和第三模型为功能相同的模型；根据各特征类别的类别中心向量，确定第二模型的分类层权重；根据训练样本和标签对第二模型进行迭代训练，更新第二模型的除分类层权重之外的参数，训练出的模型提取出的特征集可以直接与用旧模型提取出的特征库进行对比，省时省力，降低了成本，极大地提升了模型工业部署的便利性。权利要求书3页说明书11页附图4页 CN 114005015 B 2022.05.31 CN 114005015 B 1.一种图像识别模型的训练方法，其特征在于，包括：获取第一模型的训练样本；其中，所述第一模型为图像识别模型，所述训练样本为图像，所述训练样本标注有标签，所述标签用于表征所述训练样本的特征的特征类别；基于所述第一模型的网络结构，构建第二模型；根据所述训练样本和第三模型，获取所述第三模型对应的各特征类别的类别中心向量；其中，所述第一模型和所述第三模型为功能相同的图像识别模型，所述第三模型的发布时间晚于所述第一模型，所述第三模型的性能优于所述第一模型；根据所述各特征类别的类别中心向量，确定所述第二模型的分类层权重；根据所述训练样本和所述标签对所述第二模型进行迭代训练，更新所述第二模型的除所述分类层权重之外的参数。 2.根据权利要求1所述的图像识别模型的训练方法，其特征在于，所述训练样本为若干个，所述根据所述训练样本和所述标签对所述第二模型进行迭代训练，更新所述第二模型的除所述分类层权重之外的参数，包括：将各所述训练样本分别输入至所述第一模型和所述第二模型中，获取所述第一模型从各所述训练样本中分别提取出的各第一特征向量和所述第二模型分别从各所述训练样本中提取出的各第二特征向量；根据所述训练样本的数量、所述特征类别的总数、所述各第一特征向量、所述各第二特征向量、所述标签和所述分类层权重，构建损失函数；以所述损失函数为监督，基于小批量梯度下降法对所述第二模型进行迭代训练，更新所述第二模型的除所述分类层权重之外的参数，直到所述损失函数满足预设的收敛条件。 3.根据权利要求2所述的图像识别模型的训练方法，其特征在于，所述损失函数包括第一损失项，所述构建损失函数，包括：根据所述训练样本的数量、所述特征类别的总数，所述各第二特征向量、所述标签、所述分类层权重和预设的softmax交叉熵损失函数，构建所述第一损失项。 4.根据权利要求3所述的图像识别模型的训练方法，其特征在于，所述损失函数还包括第二损失项，所述损失函数为所述第一损失项与所述第二损失项之和，在构建所述第一损失项之后，还包括：根据所述各第一特征向量和所述标签，计算所述各特征类别中同一特征类别的训练样本两两之间的第一欧氏距离，并确定所述各特征类别对应的计算的次数；根据所述各特征类别对应的计算的次数和各所述第一欧氏距离，计算所述各特征类别对应的第一欧氏距离的均值；根据所述各第二特征向量和所述标签，计算所述各特征类别中同一特征类别的训练样本两两之间的第二欧氏距离；根据所述各特征类别对应的计算的次数和各所述第二欧氏距离，计算所述各特征类别对应的第二欧氏距离的均值；根据所述第一欧氏距离的均值、所述第二欧氏距离的均值和预设的L1损失函数，构建所述第二损失项。 5.根据权利要求4所述的图像识别模型的训练方法，其特征在于，通过以下公式，根据所述第一欧氏距离的均值、所述第二欧氏距离的均值和预设的L1损失函数，构建所述第二权　利　要　求　书 1/3 页 2 CN 114005015 B 2损失项：其中， Ldis为所述第二损失项， λ为预设的平衡因子， K为所述特征类别的总数， N(k)为所述第k个特征类别的训练样本的集合， SmoothL1为所述预设的L1损失函数， φ1k(xi,xj)为第k 个特征类别对应的第一欧氏距离的均值， φ2k(xi,xj)为所述第k个特征类别对应的第二欧氏距离的均值， Bk为所述第k个特征类别对应的计算的次数， f1(xi)为所述第k个特征类别中的第i个训练样本的第一特征向量， f2(xi)为所述第k个特征类别中的第i个训练样本的第二特征向量， f1(xj)为所述第k个特征类别中的第j个训练样本的第一特征向量， f1(xj)为所述第k个特征类别中的第j个训练样本的第二特征向量。 6.根据权利要求1至权利要求5中任一项所述的图像识别模型的训练方法，其特征在于，所述训练样本为若干个，所述根据所述训练样本和第三模型，获取所述第三模型对应的各特征类别的类别中心向量，包括：将各所述训练样本输入至所述第三模型中，获取所述第三模型从各所述训练样本中分别提取出的各第三特征向量；根据所述各第三特征向量和所述标签，计算所述各特征类别中同一特征类别对应的第三特征向量的第三均值，并将所述同一特征类别对应的第三特征向量的第三均值作为所述第三模型对应的所述特征类别的类别中心向量。 7.根据权利要求6中所述的图像识别模型的训练方法，其特征在于，通过以下公式，计算所述各特征类别中同一特征类别对应的第三特征向量的第三均值并将所述同一特征类别对应的第三特征向量的第三均值，作为所述第三模型对应的所述特征类别的类别中心向量：其中， wk为第k个特征类别的类别中心向量， mk为所述第k个特征类别的训练样本的数量， N(k)为所述第k个特征类别的训练样本的集合， f3(x)为所述第三特征向量， K为所述特征类别的总数。 8.根据权利要求6所述的图像识别模型的训练方法，其特征在于，所述根据所述各特征类别的类别中心向量，确定所述第二模型的分类层权重，包括：权　利　要　求　书 2/3 页 3 CN 114005015 B 3

专利 图像识别模型的训练方法、电子设备和存储介质

专利图像识别模型的训练方法、电子设备和存储介质