说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111636815.5 (22)申请日 2021.12.2 9 (71)申请人 浙江大华 技术股份有限公司 地址 310051 浙江省杭州市滨江区滨安路 1187号 (72)发明人 段陆文 熊剑平  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 何倚雯 (51)Int.Cl. G06K 9/62(2022.01) G06T 7/136(2017.01) G06T 7/194(2017.01) G06V 10/774(2022.01) (54)发明名称 模型训练方法、 图像识别方法、 终端设备及 计算机介质 (57)摘要 本申请公开了一种模 型训练方法、 图像识别 方法、 终端设备及计算机介质, 该方法包括: 获取 图像训练集, 包括若干单一类别的第一训练图 像; 获取每一类别的第一训练图像的第一分割伪 标签; 将若干第一训练图像输入待训练的分割模 型, 获取第一预测标签; 基于第一预测标签和第 一分割伪标签构建第一损失函数; 提取相同类别 的第一训练图像的第一图像特征对, 以及不同类 别的第一训练图像的第二图像特征对; 获取第一 图像特征对的第一相似度和第二图像特征对的 第二相似度, 构建第二损失函数, 利用第一损失 函数和第二损失函数对分割模型进行训练。 本申 请的图像识别方法, 约束不同类别的图像特征对 的不相似性以及同类别的图像特征对的相似性, 提高模型准确度。 权利要求书3页 说明书13页 附图9页 CN 114548213 A 2022.05.27 CN 114548213 A 1.一种模型训练方法, 其特 征在于, 所述模型训练方法包括: 获取图像训练集, 其中, 所述图像训练集包括若干单一类别的第一训练图像; 获取每一类别的第一训练图像的第一分割伪标签; 将若干所述第 一训练图像输入待训练 的分割模型, 获取所述第 一训练图像的第 一预测 标签; 基于所述第一预测标签和所述第一分割伪标签构建第一损失函数; 提取相同类别的第 一训练图像的第 一图像特征对, 以及不同类别的第 一训练图像的第 二图像特 征对; 获取所述第一图像特 征对的第一相似度, 以及所述第二图像特 征对的第二相似度; 基于所述第 一相似度和所述第 二相似度构建第 二损失函数, 利用所述第 一损失函数和 所述第二损失函数对所述分割模型进行训练。 2.根据权利要求1所述的模型训练方法, 其特 征在于, 所述获取每一类别的第一训练图像的分割伪标签, 包括: 将所述第一训练图像进行归一 化处理; 基于预设分割阈值在归一化处理后的第 一训练图像区分前景区域和背景区域, 从而获 取所述第一训练图像的第一分割伪标签。 3.根据权利要求1所述的模型训练方法, 其特 征在于, 所述获取所述第一图像特征对的第一相似度, 以及所述第二图像特征对的第二相似 度, 包括: 分别获取目标类别的两个第一训练图像的第一图像特 征以及第二图像特 征; 获取所述第一图像特 征与所述第二图像特 征的第一相似度; 分别获取目标类别的一个第一训练图像的第三图像特征以及其他类别的一个第一训 练图像的第四图像特 征; 获取所述第三图像特 征与所述第四图像特 征的第二相似度。 4.根据权利要求1 ‑3任一项所述的模型训练方法, 其特 征在于, 所述基于所述第一相似度和所述第二相似度构建第二损失函数, 包括: 计算所述第一相似度与所述第二相似度的和; 基于所述第一相似度以及所述和的比值构建所述第二损失函数。 5.根据权利要求1所述的模型训练方法, 其特 征在于, 所述获取每一类别的第一训练图像的分割伪标签之后, 所述模型训练方法还 包括: 将不同类别的第一训练图像进行混合, 以得到第二训练图像以及第二分割伪标签, 其 中, 所述第二分割伪标签由不同类别的第一训练图像的第一分割伪标签混合得到; 将所述第二训练图像输入所述分割模型, 获取 所述第二训练图像的第二预测标签; 基于所述第二预测标签和所述第二分割伪标签构建第三损失函数; 提取所述第 二训练图像中相同类别的第 三图像特征对, 以及不同类别的第四图像特征 对; 获取所述第三图像特 征对的第三相似度, 以及所述第四图像特 征对的第四相似度; 基于所述第 三相似度和所述第四相似度构建第四损失函数, 利用所述第 三损失函数和 所述第四损失函数对所述分割模型进行训练。权 利 要 求 书 1/3 页 2 CN 114548213 A 26.根据权利要求5所述的模型训练方法, 其特 征在于, 所述第三图像特征对包括高概率点特征以及不确定性点特征, 其中, 所述高概率点为 预测置信度高于预设置信度阈值的图像像素点, 所述不确定性点为预测置信度低于所述预 设置信度阈值的图像 像素点; 所述第四图像特 征对包括不同类别区域的高概 率点特征。 7.根据权利要求5或6所述的模型训练方法, 其特 征在于, 所述模型训练方法还 包括: 基于所述第二分割伪标签确定所述第二训练图像中每一类别的前 景区域; 基于所述第 二预测标签获取每一类别的前景区域的像素数目, 以及在所述第 二训练图 像中每一类别的像素 预测概率和; 基于所述像素 数目以及所述像素 预测概率和构建第五损失函数; 利用所述第 三损失函数、 所述第四损失函数以及所述第五损失函数对所述分割 模型进 行训练。 8.根据权利要求1所述的模型训练方法, 其特 征在于, 所述图像训练集还包括第 三训练图像, 以及对所述第 三训练图像标注的真实图像级标 签, 其中, 所述真实图像级标签标注所述第三训练图像中包 含的类别; 所述模型训练方法还 包括: 将所述第三训练图像输入所述分割模型, 获取 所述第三训练图像的预测图像级标签; 基于所述真实图像级标签和所述预测图像级标签构建第六损失函数, 利用所述第六损 失函数对所述分割模型进行训练。 9.根据权利要求8所述的模型训练方法, 其特 征在于, 所述模型训练方法还 包括: 将所述第三训练图像输入所述分割 模型, 获取所述预测图像级标签中每一个类别对应 的图像区域; 利用所述每一个 类别对应的图像区域分割出 单一类别的第一训练图像。 10.根据权利要求1所述的模型训练方法, 其特 征在于, 所述图像训练集中还 包括多类别的第四训练图像; 所述模型训练方法, 还 包括: 将单一类别的第一训练图像与多类别的第四训练图像进行拼接, 以得到第五训练图 像; 将所述第五训练图像输入所述分割模型, 获取所述第五训练图像的类别响应图, 其中, 所述类别响应图包括所述第五训练图像的第三预测标签; 将所述类别响应图通过拼接获取所述第一训练图像对应的第一类别响应图以及第四 训练图像对应的第二类别响应图; 基于所述第一训练图像的分割伪标签以及所述第一类别响应图的预测标签构建第七 损失函数; 基于所述第四训练图像的分割伪标签以及所述第二类别响应图的预测标签构建第八 损失函数; 利用所述第七损失函数和所述第八损失函数对所述分割模型进行训练。 11.根据权利要求10所述的模型训练方法, 其特 征在于,权 利 要 求 书 2/3 页 3 CN 114548213 A 3

.PDF文档 专利 模型训练方法、图像识别方法、终端设备及计算机介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、图像识别方法、终端设备及计算机介质 第 1 页 专利 模型训练方法、图像识别方法、终端设备及计算机介质 第 2 页 专利 模型训练方法、图像识别方法、终端设备及计算机介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:45:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。