专利图像处理模型的训练方法、图像分类方法及装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111640853.8 (22)申请日 2021.12.2 9 (71)申请人京东方科技集团股份有限公司地址 100015 北京市朝阳区酒仙桥路10号 (72)发明人刘童　上官泽钰　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 1 1138 代理人雷思鸣 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06K 9/62(2022.01)G06T 7/11(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称图像处理模型的训练方法、图像分类方法及装置 (57)摘要本申请公开了一种图像处理模型的训练方法、图像分类方法及装置，该训练方法通过对多张原始图像进行裁剪，可以有效扩充训练样本的数量，确保训练得到的图像处理模型的效果较好。并且，用于训练图像处理模型的每个正样本对中的两个训练样本的类别相同，而负样本对中的两个训练样本的类别不同。由此，可以确保训练得到的图像处理模型能够较好的学习到不同类别的图像的特征，进而进一步改善了图像处理模型的效果。权利要求书3页说明书13页附图4页 CN 114299363 A 2022.04.08 CN 114299363 A 1.一种图像处理模型的训练方法，其特征在于，所述方法包括：获取多个原始图像集，每个所述原始图像集包括多张相同类别的原始图像，且不同所述原始图像集包括的原始图像的类别不同；对所述多个原始图像集中的多张原始图像进行裁剪，得到训练样本集，所述训练样本集包括多个训练样本，每个所述训练样本为一张原始图像，或者对一张原始图像进行裁剪得到的子图像；从所述训练样本集中确定多个正样本对和多个负样本对，其中每个所述正样本对包括基于同一个原始图像集中的不同原始图像得到的两个训练样本，每个所述负样本对包括基于不同原始图像集中的原始图像得到的两个训练样本；采用所述多个正样本对和多个负样本对训练图像处理模型。 2.根据权利要求1所述的方法，其特征在于，所述对所述多个原始图像集中的多张原始图像样本进行裁剪，包括：对于所述多个原始图像集中用于裁剪的每一张原始图像，随机生成位于目标尺寸范围内的一个裁剪尺寸；基于所述原始图像的尺寸和所述裁剪尺寸确定裁剪区域的参考点；基于所述裁剪尺寸和所述参考点在所述原始图像中确定所述裁剪区域，并对所述裁剪区域进行裁剪。 3.根据权利要求2所述的方法，其特征在于，所述目标尺寸范围包括宽度范围和高度范围，所述裁剪尺寸包括位于所述宽度范围内的宽度，以及位于所述高度范围内的高度；所述裁剪区域为矩形区域，所述裁剪区域的参考点为所述矩形区域的一个顶点，或所述矩形区域的中心点。 4.根据权利要求1至3任一所述的方法，其特征在于，从所述训练样本集中确定多个正样本对，包括：从所述训练样本集中确定多个备选样本对，每个所述备选样本对均包括基于同一个原始图像集中的不同原始图像得到的两个训练样本；确定每个所述备选样本对的相似度；将相似度大于相似度阈值的所述备选样本对确定为正样本对。 5.根据权利要求4所述的方法，其特征在于，所述确定每个所述备选样本对的相似度，包括：采用卷积神经网络提取每个所述备选样本对中的每个训练样本的特征向量；对于每个所述备选样本对，采用相似度度量算法处理所述备选样本对中的两个训练样本的特征向量，得到所述备选样本对的相似度。 6.根据权利要求1至3任一所述的方法，其特征在于，从所述训练样本集中确定多个负样本对，包括：从所述训练样本集中确定数量与所述多个正样本对的数量相同的多个负样本对。 7.根据权利要求1至3任一所述的方法，其特征在于，所述采用所述多个正样本对和多个负样本对训练图像处理模型，包括：将每个所述正样本对的真值均标记为1，并将每个所述负样本对的真值均标记为0；采用标记后的所述多个正样本对，以及标记后的所述多个负样本对训练图像处理模权　利　要　求　书 1/3 页 2 CN 114299363 A 2型。 8.一种图像分类方法，其特征在于，所述方法包括：获取待分类的目标图像；将所述目标图像输入至图像分类模型，得到所述图像分类模型输出的所述目标图像的类别；其中，所述图像分类模型采用如权利要求1至7任一所述的方法训练得到。 9.根据权利要求8所述的方法，其特征在于，所述将所述目标图像输入至图像分类模型，得到所述图像分类模型输出的所述目标图像的类别，包括：将目标图像输入至图像分类模型，得到所述图像分类模型输出的所述目标图像与不同类别的参考图像的相似度；将所述不同类别的参考图像中，与所述目标图像的相似度最高的参考图像的类别确定为所述目标图像的类别。 10.根据权利要求8所述的方法，其特征在于，所述将目标图像输入至图像分类模型，得到所述图像分类模型输出的所述目标图像的类别，包括：将目标图像输入至图像分类模型，得到所述图像分类模型输出的所述目标图像与不同类别的图像特征的相似度；将所述不同类别的图像特征中，与所述目标图像的相似度最高的图像特征的类别确定为所述目标图像的类别；其中，每个类别的图像特征是对所述类别的多个训练样本进行特征提取得到的。 11.一种图像处理模型的训练装置，其特征在于，所述装置包括：获取模块，用于获取多个原始图像集，每个所述原始图像集包括多张相同类别的原始图像，且不同所述原始图像集包括的原始图像的类别不同；裁剪模块，用于对所述多个原始图像集中的多张原始图像进行裁剪，得到训练样本集，所述训练样本集包括多个训练样本，每个所述训练样本为一张原始图像，或者对一张原始图像进行裁剪得到的子图像；确定模块，用于从所述训练样本集中确定多个正样本对和多个负样本对，其中每个所述正样本对包括基于同一个原始图像集中的不同原始图像得到的两个训练样本，每个所述负样本对包括基于不同原始图像集中的原始图像得到的两个训练样本；训练模块，用于采用所述多个正样本对和多个负样本对训练图像处理模型。 12.一种图像分类装置，其特征在于，所述装置包括：获取模块，用于获取待分类的目标图像；分类模块，用于将所述目标图像输入至图像分类模型，得到所述图像分类模型输出的所述目标图像的类别；其中，所述图像分类模型采用如权利要求11所述的图像处理模型的训练装置训练得到。 13.一种图像处理设备，其特征在于，所述图像处理设备包括处理器和存储器，所述存储器中存储有指令，所述指令由所述处理器加载并执行以实现如权利要求 1至7任一所述的图像处理模型的训练方法，或如权利要求8至10任一所述的图像分类方法。 14.一种计算机可读存储介质，其特征在于，所述存储介质中存储有指令，所述指令由权　利　要　求　书 2/3 页 3 CN 114299363 A 3

专利 图像处理模型的训练方法、图像分类方法及装置

专利图像处理模型的训练方法、图像分类方法及装置