专利模型训练方法、图像分类方法、系统、设备及介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111653650.2 (22)申请日 2021.12.3 0 (71)申请人携程旅游信息技术（上海）有限公司地址 201203 上海市浦东新区张江高科技园区碧波路518号3 02室 (72)发明人吕心铋　罗超　梁贤朋　邹宇　 (74)专利代理机构上海弼兴律师事务所 31283 代理人马涛　罗朗 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称模型训练方法、图像分类方法、系统、设备及介质 (57)摘要本发明公开了一种模型训练方法、图像分类方法、系统、设备及介质，包括：获取训练集，该训练集包括历史图像多标签数据；根据Repulsion Loss函数和BCE_ FocalLoss函数计算得到新的损失函数；基于历史图像标签数据以及新的损失函数训练神经网络模型，以得到图像多标签分类模型。本发明利用基于Repulsion Loss函数和BCE_ FocalLoss函数计算得到的新的损失函数，再结合历史图像多标签数据训练神经网络模型，以得到图像多标签分类模型；以便利用图像多标签分类模型实现对图像多标签的准确分类，提高了图像多标签分类模型的准确性。权利要求书3页说明书11页附图6页 CN 114299340 A 2022.04.08 CN 114299340 A 1.一种模型训练方法，其特征在于，包括：获取训练集，所述训练集包括历史图像多标签数据；根据Repulsi on Loss函数和BC E_FocalLoss函数计算得到新的损失函数；基于所述历史图像标签数据以及所述新的损失函数训练神经网络模型，以得到图像多标签分类模型。 2.如权利要求1所述的模型训练方法，其特征在于，所述新的损失函数的表达式为： L＝ Lc+α Lr 其中， Lc＝‑(1‑p)γylog(p)‑pγ(1‑y)log(1‑p)， Lr＝max(P(Top ‑k)‑P(Top‑1)+margi n,0)， L表示新的损失函数， Lr表示Repulsion Loss函数， Lc表示BCE_FocalLoss函数， γ表示难易样本权重参数， p表示模型多标签预测结果向量， y表示真实标签， Top ‑1表示标签对应的最大的概率分数， Top ‑k表示标签对应的最小的概率分数， α(t)表示时变权重参数， α 随着模型迭代轮次t的增加逐渐变大， T1和T2表示线性变化迭代轮次起始点和停止点， αf表示稳定后的权重值。 3.如权利要求1所述的模型训练方法，其特征在于，所述模型训练方法还包括：获取历史图像多标签数据集；按照预设比例对所述历史图像多标签数据集进行划分，以得到训练集和测试集；利用所述测试集测试所述图像多标签分类模型的分类结果，以得到所述测试集对应的目标预测分类结果；和/或，所述模型训练方法还包括：获取所述测试集对应的真实分类结果；根据所述测试集对应的目标预测分类结果以及所述测试集对应的真实分类结果优化图像多标签分类模型，以得到优化后的图像多标签分类模型；和/或，所述利用所述测试集测试所述图像多标签分类模型的分类结果，以得到所述测试集对应的目标预测分类结果的步骤包括：提取所述测试集对应的多个类特征向量；将所述多个类特征向量输入所述图像多标签分类模型，以得到每个标签对应的预测分类结果的概率值；选择所述概率值最大的预测分类结果作为所述目标预测分类结果。 4.一种模型训练系统，其特征在于，包括第一获取模块、计算模块和训练模块；所述第一获取模块，用于获取训练集，所述训练集包括历史图像多标签数据；所述计算模块，用于根据Repulsion Loss函数和BCE_FocalLoss函数计算得到新的损失函数；权　利　要　求　书 1/3 页 2 CN 114299340 A 2所述训练模块，用于基于所述历史图像标签数据以及所述新的损失函数训练神经网络模型，以得到图像多标签分类模型。 5.如权利要求4所述的模型训练系统，其特征在于，所述新的损失函数的表达式为： L＝ Lc+α Lr 其中， Lc＝‑(1‑p)γylog(p)‑pγ(1‑y)log(1‑p)， Lr＝max(P(Top ‑k)‑P(Top‑1)+margi n,0)， L表示新的损失函数， Lr表示Repulsion Loss函数， Lc表示BCE_FocalLoss函数， γ表示难易样本权重参数， p表示模型多标签预测结果向量， y表示真实标签， Top ‑1表示标签对应的最大的概率分数， Top ‑k表示标签对应的最小的概率分数， α(t)表示时变权重参数， α 随着模型迭代轮次t的增加逐渐变大， T1和T2表示线性变化迭代轮次起始点和停止点， αf表示稳定后的权重值。 6.如权利要求4所述的模型训练系统，其特征在于，所述模型训练系统还包括第二获取模块、划分模块和测试模块；所述第二获取模块，用于获取历史图像多标签数据集；所述划分模块，用于按照预设比例对所述历史图像多标签数据集进行划分，以得到训练集和测试集；所述测试模块，用于利用所述测试集测试所述图像多标签分类模型的分类结果，以得到所述测试集对应的目标预测分类结果；和/或，所述模型训练系统还包括第三获取模块和优化模块；所述第三获取模块，用于获取所述测试集对应的真实分类结果；所述优化模块，用于根据所述测试集对应的目标预测分类结果以及所述测试集对应的真实分类结果优化图像多标签分类模型，以得到优化后的图像多标签分类模型；和/或，所述测试模块包括提取单元、输入单元和选择单元；所述提取单元，用于提取所述测试集对应的多个类特征向量；所述输入单元，用于将所述多个类特征向量输入所述图像多标签分类模型，以得到每个标签对应的预测分类结果的概率值；所述选择单元，用于选择所述概率值最大的预测分类结果作为所述目标预测分类结果。 7.一种图像分类方法，其特征在于，包括：获取待分类图像；将所述待分类图像输入图像多标签分类模型进行分类，以得到分类结果；其中，所述图像多标签分类模型利用上述权利要求1 ‑3中任一项所述的模型训练方法训练得到。权　利　要　求　书 2/3 页 3 CN 114299340 A 3

专利 模型训练方法、图像分类方法、系统、设备及介质

专利模型训练方法、图像分类方法、系统、设备及介质