说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111653650.2 (22)申请日 2021.12.3 0 (71)申请人 携程旅游信息技 术 (上海) 有限公司 地址 201203 上海市浦东 新区张江高科技 园区碧波路518号3 02室 (72)发明人 吕心铋 罗超 梁贤朋 邹宇  (74)专利代理 机构 上海弼兴律师事务所 31283 代理人 马涛 罗朗 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 模型训练方法、 图像分类方法、 系统、 设备及 介质 (57)摘要 本发明公开了一种模 型训练方法、 图像 分类 方法、 系统、 设备及介质, 包 括: 获取训练集, 该训 练集包括历史图像多标签数据; 根据Repulsion   Loss函数和BCE_ FocalLoss函数计算得到新的损 失函数; 基于历史图像标签数据以及新的损失函 数训练神经网络模型, 以得到图像多标签分类模 型。 本发明利用基于Repulsion  Loss函数和BCE_ FocalLoss函数计算得到的新的损失函数, 再结 合历史图像多标签数据训练神经网络模 型, 以得 到图像多标签 分类模型; 以便利用图像多标签分 类模型实现对图像多 标签的准确分类, 提高了图 像多标签分类模型的准确性。 权利要求书3页 说明书11页 附图6页 CN 114299340 A 2022.04.08 CN 114299340 A 1.一种模型训练方法, 其特 征在于, 包括: 获取训练集, 所述训练集包括历史图像多标签数据; 根据Repulsi on Loss函数和BC E_FocalLoss函数计算得到新的损失函数; 基于所述历史图像标签数据以及所述新的损失函数训练神经网络模型, 以得到图像多 标签分类模型。 2.如权利要求1所述的模型训练方法, 其特征在于, 所述新的损失函数的表达 式为: L= Lc+α Lr 其中, Lc=‑(1‑p)γylog(p)‑pγ(1‑y)log(1‑p), Lr=max(P(Top ‑k)‑P(Top‑1)+margi n,0), L表示新的损失函数, Lr表示Repulsion  Loss函数, Lc表示BCE_FocalLoss函数, γ表示 难易样本权重参数, p表示模型多标签预测结果 向量, y表示真实标签, Top ‑1表示标签对应 的最大的概率分数, Top ‑k表示标签对应的最小的概率分数, α(t)表 示时变权重参数, α 随着 模型迭代轮次t的增加逐渐变大, T1和T2表示线性变化迭代轮次起始点和停止点, αf表示稳 定后的权 重值。 3.如权利要求1所述的模型训练方法, 其特 征在于, 所述模型训练方法还 包括: 获取历史图像多标签数据集; 按照预设比例对所述历史图像多标签数据集进行划分, 以得到训练集和 测试集; 利用所述测试集测试所述图像多标签分类模型的分类结果, 以得到所述测试集对应的 目标预测分类结果; 和/或, 所述模型训练方法还 包括: 获取所述测试集对应的真实分类结果; 根据所述测试集对应的目标预测分类结果以及所述测试集对应的真实分类结果优化 图像多标签分类模型, 以得到优化后的图像多标签分类模型; 和/或, 所述利用所述测试集测试所述图像多标签分类模型的分类结果, 以得到所述测试集对 应的目标 预测分类结果的步骤 包括: 提取所述测试集对应的多个 类特征向量; 将所述多个类特征向量输入所述图像多标签分类模型, 以得到每个标签对应的预测分 类结果的概 率值; 选择所述概率值最大的预测分类结果作为所述目标 预测分类结果。 4.一种模型训练系统, 其特 征在于, 包括第一获取模块、 计算模块和训练模块; 所述第一获取模块, 用于获取训练集, 所述训练集包括历史图像多标签数据; 所述计算模块, 用于根据Repulsion  Loss函数和BCE_FocalLoss函数计算得到新的损 失函数;权 利 要 求 书 1/3 页 2 CN 114299340 A 2所述训练模块, 用于基于所述历史图像标签数据以及所述新的损失函数训练神经网络 模型, 以得到图像多标签分类模型。 5.如权利要求4所述的模型训练系统, 其特征在于, 所述新的损失函数的表达 式为: L= Lc+α Lr 其中, Lc=‑(1‑p)γylog(p)‑pγ(1‑y)log(1‑p), Lr=max(P(Top ‑k)‑P(Top‑1)+margi n,0), L表示新的损失函数, Lr表示Repulsion  Loss函数, Lc表示BCE_FocalLoss函数, γ表示 难易样本权重参数, p表示模型多标签预测结果 向量, y表示真实标签, Top ‑1表示标签对应 的最大的概率分数, Top ‑k表示标签对应的最小的概率分数, α(t)表 示时变权重参数, α 随着 模型迭代轮次t的增加逐渐变大, T1和T2表示线性变化迭代轮次起始点和停止点, αf表示稳 定后的权 重值。 6.如权利要求4所述的模型训练系统, 其特征在于, 所述模型训练系统还包括第 二获取 模块、 划分模块和 测试模块; 所述第二获取模块, 用于获取历史图像多标签数据集; 所述划分模块, 用于按照预设比例对所述历史图像多标签数据集进行划分, 以得到训 练集和测试集; 所述测试模块, 用于利用所述测试集测试所述图像多标签分类模型的分类结果, 以得 到所述测试集对应的目标 预测分类结果; 和/或, 所述模型训练系统还 包括第三获取模块和优化模块; 所述第三获取模块, 用于获取 所述测试集对应的真实分类结果; 所述优化模块, 用于根据所述测试集对应的目标预测分类结果以及所述测试集对应的 真实分类结果优化图像多标签分类模型, 以得到优化后的图像多标签分类模型; 和/或, 所述测试模块包括 提取单元、 输入单 元和选择 单元; 所述提取单元, 用于提取 所述测试集对应的多个 类特征向量; 所述输入单元, 用于将所述多个类特征向量输入所述图像多标签分类模型, 以得到每 个标签对应的预测分类结果的概 率值; 所述选择单元, 用于选择所述概率值最大的预测分类结果作为所述目标预测分类结 果。 7.一种图像分类方法, 其特 征在于, 包括: 获取待分类图像; 将所述待分类图像输入图像多标签分类模型进行分类, 以得到分类结果; 其中, 所述图像多标签分类模型利用上述权利要求1 ‑3中任一项所述的模型训练方法 训练得到 。权 利 要 求 书 2/3 页 3 CN 114299340 A 3

.PDF文档 专利 模型训练方法、图像分类方法、系统、设备及介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、图像分类方法、系统、设备及介质 第 1 页 专利 模型训练方法、图像分类方法、系统、设备及介质 第 2 页 专利 模型训练方法、图像分类方法、系统、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:56:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。