说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111640853.8 (22)申请日 2021.12.2 9 (71)申请人 京东方科技 集团股份有限公司 地址 100015 北京市朝阳区酒仙桥路10号 (72)发明人 刘童 上官泽钰  (74)专利代理 机构 北京三高永信知识产权代理 有限责任公司 1 1138 代理人 雷思鸣 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06K 9/62(2022.01)G06T 7/11(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像处理模 型的训练方法、 图像 分类方法及 装置 (57)摘要 本申请公开了一种图像处理模型的训练方 法、 图像分类方法及装置, 该训练方法通过对多 张原始图像进行裁剪, 可以有效扩充训练样本的 数量, 确保训练得到的图像处理模型的效果较 好。 并且, 用于训练图像处理模型的每个正样本 对中的两个训练样本的类别相同, 而负样本对中 的两个训练样本的类别不同。 由此, 可 以确保训 练得到的图像处理模型能够较好的学习到不同 类别的图像的特征, 进而进一步改善了图像处理 模型的效果。 权利要求书3页 说明书13页 附图4页 CN 114299363 A 2022.04.08 CN 114299363 A 1.一种图像处 理模型的训练方法, 其特 征在于, 所述方法包括: 获取多个原始图像集, 每个所述原始图像集包括多张相同类别的原始图像, 且不同所 述原始图像集包括的原 始图像的类别不同; 对所述多个原始图像集中的多张原始图像进行裁剪, 得到训练样本集, 所述训练样本 集包括多个训练样本, 每个所述训练样本为一张原始图像, 或者对一张原始图像进行裁剪 得到的子图像; 从所述训练样本集中确定多个正样本对和多个负样本对, 其中每个所述正样本对包括 基于同一个原始图像集中的不同原始图像得到的两个训练样本, 每个所述负样本对包括基 于不同原 始图像集中的原 始图像得到的两个训练样本; 采用所述多个正样本对和多个负 样本对训练图像处 理模型。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述多个原始图像集中的多 张原始 图像样本进行裁 剪, 包括: 对于所述多个原始图像集中用于裁剪的每一张原始图像, 随机生成位于目标尺寸范围 内的一个裁 剪尺寸; 基于所述原 始图像的尺寸和所述裁 剪尺寸确定 裁剪区域的参 考点; 基于所述裁剪尺寸和所述参考点在所述原始图像中确定所述裁剪区域, 并对所述裁剪 区域进行裁 剪。 3.根据权利要求2所述的方法, 其特征在于, 所述目标尺寸范围包括宽度 范围和高度 范 围, 所述裁 剪尺寸包括 位于所述宽度范围内的宽度, 以及位于所述高度范围内的高度; 所述裁剪区域为矩形区域, 所述裁剪区域的参考点为所述矩形区域的一个顶点, 或所 述矩形区域的中心点。 4.根据权利要求1至3任一所述的方法, 其特征在于, 从所述训练样本集中确定多个正 样本对, 包括: 从所述训练样本集中确定多个备选样本对, 每个所述备选样本对均包括基于同一个原 始图像集中的不同原 始图像得到的两个训练样本; 确定每个所述备选样本对的相似度; 将相似度大于相似度阈值的所述备选样本对确定为 正样本对。 5.根据权利要求4所述的方法, 其特征在于, 所述确定每个所述备选样本对的相似度, 包括: 采用卷积神经网络提取每 个所述备选样本对中的每 个训练样本的特 征向量; 对于每个所述备选样本对, 采用相似度度量算法处理所述备选样本对中的两个训练样 本的特征向量, 得到所述备选样本对的相似度。 6.根据权利要求1至3任一所述的方法, 其特征在于, 从所述训练样本集中确定多个负 样本对, 包括: 从所述训练样本集中确定数量与所述多个正样本对的数量相同的多个负 样本对。 7.根据权利要求1至3任一所述的方法, 其特征在于, 所述采用所述多个正样本对和多 个负样本对训练图像处 理模型, 包括: 将每个所述正样本对的真值均标记为1, 并将每 个所述负 样本对的真值均标记为0; 采用标记后的所述多个正样本对, 以及标记后的所述多个负样本对训练图像处理模权 利 要 求 书 1/3 页 2 CN 114299363 A 2型。 8.一种图像分类方法, 其特 征在于, 所述方法包括: 获取待分类的目标图像; 将所述目标图像输入至图像分类模型, 得到所述图像分类模型输出的所述目标图像的 类别; 其中, 所述图像分类模型采用如权利要求1至7任一所述的方法训练得到 。 9.根据权利要求8所述的方法, 其特征在于, 所述将所述目标图像输入至图像分类模 型, 得到所述图像分类模型输出的所述目标图像的类别, 包括: 将目标图像输入至图像分类模型, 得到所述图像分类模型输出的所述目标图像与不同 类别的参 考图像的相似度; 将所述不同类别的参考图像中, 与 所述目标图像的相似度最高的参考图像的类别确定 为所述目标图像的类别。 10.根据权利要求8所述的方法, 其特征在于, 所述将目标图像输入至图像分类模型, 得 到所述图像分类模型输出的所述目标图像的类别, 包括: 将目标图像输入至图像分类模型, 得到所述图像分类模型输出的所述目标图像与不同 类别的图像特 征的相似度; 将所述不同类别的图像特征中, 与 所述目标图像的相似度最高的图像特征的类别确定 为所述目标图像的类别; 其中, 每个类别的图像特 征是对所述类别的多个训练样本进行 特征提取得到的。 11.一种图像处 理模型的训练装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取多个原始图像集, 每个所述原始图像集包括多张相同类别的原始 图像, 且不同所述原 始图像集包括的原 始图像的类别不同; 裁剪模块, 用于对所述多个原始图像集中的多张原始图像进行裁剪, 得到训练样本集, 所述训练样本集包括多个训练样本, 每个所述训练样本为一张原始图像, 或者对一张原始 图像进行裁 剪得到的子图像; 确定模块, 用于从所述训练样本集中确定多个正样本对和多个负样本对, 其中每个所 述正样本对包括基于同一个原始图像集中的不同原始图像得到的两个训练样本, 每个所述 负样本对包括基于不同原 始图像集中的原 始图像得到的两个训练样本; 训练模块, 用于采用所述多个正样本对和多个负 样本对训练图像处 理模型。 12.一种图像分类装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待分类的目标图像; 分类模块, 用于将所述目标图像输入至 图像分类模型, 得到所述图像分类模型输出的 所述目标图像的类别; 其中, 所述图像分类模型采用如权利要求11所述的图像处理模型的训练装置训练得 到。 13.一种图像处理设备, 其特征在于, 所述图像处理设备包括处理器和存储器, 所述存 储器中存储有指 令, 所述指 令由所述处理器加载并执行以实现如权利要求 1至7任一所述的 图像处理模型的训练方法, 或如权利要求8至10任一所述的图像分类方法。 14.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有指令, 所述指令由权 利 要 求 书 2/3 页 3 CN 114299363 A 3

.PDF文档 专利 图像处理模型的训练方法、图像分类方法及装置

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像处理模型的训练方法、图像分类方法及装置 第 1 页 专利 图像处理模型的训练方法、图像分类方法及装置 第 2 页 专利 图像处理模型的训练方法、图像分类方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。