说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111614740.0 (22)申请日 2021.12.28 (65)同一申请的已公布的文献号 申请公布号 CN 114005015 A (43)申请公布日 2022.02.01 (73)专利权人 合肥的卢深视科技有限公司 地址 230091 安徽省合肥市高新区习友路 3333号中 国 (合肥) 国际智能语音产业 园研发中心 楼611-217室 (72)发明人 浦煜 何武 付贤强 朱海涛  户磊  (74)专利代理 机构 北京智晨知识产权代理有限 公司 11584 专利代理师 张婧(51)Int.Cl. G06V 10/774(2022.01) G06K 9/62(2022.01) 审查员 刘晨曦 (54)发明名称 图像识别模 型的训练方法、 电子设备和存储 介质 (57)摘要 本申请实施例涉及视觉搜索技术领域, 公开 了一种图像识别模型的训练方法、 电子设备和存 储介质, 该方法包括: 获取第一模型的训练样本; 其中, 训练样本标注用于表征训练样本的特征的 特征类别的标签; 基于第一模型的网络结构, 构 建第二模型; 根据训练样本和第三模型, 获取第 三模型对应的各特征类别的类别中心向量; 其 中, 第一模型和第三模型为功能相同的模型; 根 据各特征类别的类别中心向量, 确定第二模型的 分类层权重; 根据训练样本和标签对第二模型进 行迭代训练, 更新第二模型的除分类层权重之外 的参数, 训练出的模型提取出的特征集可以直接 与用旧模型提取出的特征库进行对比, 省时省 力, 降低了成本, 极大地提升了模型工业部署的 便利性。 权利要求书3页 说明书11页 附图4页 CN 114005015 B 2022.05.31 CN 114005015 B 1.一种图像识别模型的训练方法, 其特 征在于, 包括: 获取第一模型的训练样本; 其中, 所述第一模型为图像识别模型, 所述训练样本为图 像, 所述训练样本标注有标签, 所述标签用于表征 所述训练样本的特 征的特征类别; 基于所述第一模型的网络结构, 构建第二模型; 根据所述训练样本和第三模型, 获取所述第三模型对应的各特征类别的类别中心向 量; 其中, 所述第一模型和所述第三模 型为功能相同的图像识别模型, 所述第三模型的发布 时间晚于所述第一模型, 所述第三模型的性能优于所述第一模型; 根据所述各 特征类别的类别中心向量, 确定所述第二模型的分类层权 重; 根据所述训练样本和所述标签对所述第 二模型进行迭代训练, 更新所述第 二模型的除 所述分类层权 重之外的参数。 2.根据权利要求1所述的图像识别模型的训练方法, 其特征在于, 所述训练样本为若干 个, 所述根据所述训练样本和所述标签对所述第二模型进行迭代训练, 更新所述第二模型 的除所述分类层权 重之外的参数, 包括: 将各所述训练样本分别输入至所述第 一模型和所述第 二模型中, 获取所述第 一模型从 各所述训练样本中分别提取出的各第一特征向量和所述第二模型分别从各所述训练样本 中提取出的各第二特 征向量; 根据所述训练样本的数量、 所述特征类别的总数、 所述各第 一特征向量、 所述各第二特 征向量、 所述标签和所述分类层权 重, 构建损失函数; 以所述损 失函数为监督, 基于小批量梯度下降法对所述第二模型进行迭代训练, 更新 所述第二模型的除所述分类层权 重之外的参数, 直到所述损失函数满足预设的收敛 条件。 3.根据权利要求2所述的图像识别模型的训练方法, 其特征在于, 所述损失函数包括第 一损失项, 所述构建损失函数, 包括: 根据所述训练样本的数量、 所述特征类别的总数, 所述各第二特征向量、 所述标签、 所 述分类层权 重和预设的softmax交叉熵损失函数, 构建所述第一损失项。 4.根据权利要求3所述的图像识别模型的训练方法, 其特征在于, 所述损失函数还包括 第二损失项, 所述损失函数为所述第一损失项与所述第二损失项之和, 在构建所述第一损 失项之后, 还 包括: 根据所述各第 一特征向量和所述标签, 计算所述各特征类别中同一特征类别的训练样 本两两之间的第一欧氏距离, 并确定所述各 特征类别对应的计算的次数; 根据所述各特征类别对应的计算的次数和各所述第 一欧氏距离, 计算所述各特征类别 对应的第一欧氏距离的均值; 根据所述各第 二特征向量和所述标签, 计算所述各特征类别中同一特征类别的训练样 本两两之间的第二欧氏距离; 根据所述各特征类别对应的计算的次数和各所述第 二欧氏距离, 计算所述各特征类别 对应的第二欧氏距离的均值; 根据所述第一欧氏距离的均值、 所述第二欧氏距离的均值和预设的L1损失函数, 构建 所述第二损失项。 5.根据权利要求4所述的图像识别模型的训练方法, 其特征在于, 通过以下公式, 根据 所述第一欧氏距离的均值、 所述第二欧氏距离的均值和预设的L1损失函数, 构建所述第二权 利 要 求 书 1/3 页 2 CN 114005015 B 2损失项: 其中, Ldis为所述第二损失项, λ为预设的平衡因子, K为所述特征类别的总数, N(k)为所 述第k个特征类别的训练样本的集合, SmoothL1为所述预设的L1损失函数, φ1k(xi,xj)为第k 个特征类别对应的第一欧氏距离的均值, φ2k(xi,xj)为所述第k个特征类别对应的第二欧 氏距离的均值, Bk为所述第k个特征类别对应的计算的次数, f1(xi)为所述第k个特征类别中 的第i个训练样本的第一特征向量, f2(xi)为所述第k个特征类别中的第i个训练样本的第二 特征向量, f1(xj)为所述第k个特征类别中的第j个训练样本的第一特征向量, f1(xj)为所述 第k个特征类别中的第j个训练样本的第二特 征向量。 6.根据权利要求1至权利要求5中任一项所述的图像识别模型的训练方法, 其特征在 于, 所述训练样 本为若干个, 所述根据所述训练样本和 第三模型, 获取所述第三模型对应的 各特征类别的类别中心向量, 包括: 将各所述训练样本输入至所述第 三模型中, 获取所述第 三模型从各所述训练样本 中分 别提取出的各第三特 征向量; 根据所述各第 三特征向量和所述标签, 计算所述各特征类别中同一特征类别对应的第 三特征向量的第三均值, 并将所述同一特征类别对应的第三特征向量的第三均值作为所述 第三模型对应的所述特 征类别的类别中心向量。 7.根据权利要求6中所述的图像识别模型的训练方法, 其特征在于, 通过以下公式, 计 算所述各特征类别中同一特征类别对应的第三特征向量的第三均值并将所述同一特征类 别对应的第三特征向量的第三均值, 作为所述第三模型对应的所述特征类别的类别中心向 量: 其中, wk为第k个特征类别的类别中心向量, mk为所述第k个特征类别的训练样本的数 量, N(k)为所述第k个特征类别的训练样本的集合, f3(x)为所述第三特征向量, K为所述特 征类别的总数。 8.根据权利要求6所述的图像识别模型的训练方法, 其特征在于, 所述根据所述各特征 类别的类别中心向量, 确定所述第二模型的分类层权 重, 包括:权 利 要 求 书 2/3 页 3 CN 114005015 B 3

.PDF文档 专利 图像识别模型的训练方法、电子设备和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像识别模型的训练方法、电子设备和存储介质 第 1 页 专利 图像识别模型的训练方法、电子设备和存储介质 第 2 页 专利 图像识别模型的训练方法、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。