说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210960566.3 (22)申请日 2022.08.09 (71)申请人 上海闪马智能科技有限公司 地址 200210 上海市浦东 新区自由贸易试 验区临港新片区环湖西二路8 88号C楼 (72)发明人 林亦宁 易芮 安超  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 赵静 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/40(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 图像的识别方法及装置 (57)摘要 本发明实施例提供了一种图像的识别方法 及装置, 包括: 获取待识别图像; 通过目标神经网 络模型的主干神经网络对待识别图像进行下采 样, 得到N个下采样特征图; 通过目标神经网络模 型的特征金字塔网络对N个下采样特征图进行上 采样, 得到M个上采样特征图; 通过目标神经网络 模型的信息整合网络对M个上采样特征图进行处 理, 得到待识别图像的识别结果。 通过本发明, 解 决了图像中目标对象的识别准确率较低的问题, 进而达到了提高目标对象识别准确率的效果。 权利要求书2页 说明书10页 附图3页 CN 115205603 A 2022.10.18 CN 115205603 A 1.一种图像的识别方法, 其特 征在于, 包括: 获取待识别图像; 通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样, 得到N个下采 样特征图, 其中, N大于1; 通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样, 得到M个上采样特征图, 其中, M大于或等于N, 所述M个上采样特征图中的部分特征图与所述 N个下采样特 征图中的部分特 征图的倍 率相同; 通过所述目标神经网络模型的信息整合网络对所述M个上采样特征图进行处理, 得到 所述待识别图像的识别结果, 其中, 所述识别结果包括所述待识别图像中目标对象 的类别、 所述目标对象的位置信息 。 2.根据权利要求1所述的方法, 其特 征在于, 通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样, 得到N个下采 样特征图, 包括: 通过所述主干神经网络对所述待识别图像进行下采样, 得到8倍下采样特 征图、 16倍下采样特征图和32倍下采样特征图, 所述N个下采样特征图包括: 所述8倍下采样 特征图、 16倍下采样特 征图和32倍下采样特 征图; 通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样, 得到M个上采样特征图, 包括: 通过所述特征金字塔网络对所述8倍下采样特征图、 16倍下采 样特征图和32倍下采样特征图进行上采样, 得到4倍上采样特征图、 16倍上采样特征图、 32 倍上采样特征图和64倍上采样特征图, 其中, 所述M个上采样特征图包括: 所述4倍上采样特 征图、 所述16倍上采样特 征图、 所述32倍上采样特 征图和所述64 倍上采样特 征图。 3.根据权利要求2所述的方法, 其特征在于, 所述通过所述目标神经网络模型的信 息整 合网络对所述M个上采样特 征图进行处 理, 得到所述待识别图像的识别结果, 包括: 通过所述目标神经网络模型的信息整合网络对所述4倍上采样特征图、 所述16倍上采 样特征图、 所述32倍上采样特征图和所述64倍上采样特征图进行处理, 得到所述待识别图 像的识别结果。 4.根据权利要求2所述的方法, 其特征在于, 在所述通过所述目标神经网络模型的特征 金字塔网络对所述 N个下采样特 征图进行 上采样之前, 所述方法还 包括: 获取训练样本图像集 合; 通过所述训练样本图像集 合对待训练的初始神经网络模型进行迭代训练; 在训练过程中, 若所述初始神经网络模型输出的样本识别结果与输入的训练样本图像 的已知识别结果满足预设损失条件, 则停止训练得到所述 目标神经网络模型, 若不满足所 述预设损失条件, 则调整所述初始神经网络模型的模型, 继续进行训练。 5.根据权利要求4所述的方法, 其特征在于, 通过所述训练样本图像集合对待训练的初 始神经网络模型进行迭代训练, 包括: 通过以下步骤对所述待训练的初始神经网络模型进行第i轮训练, 其中, i大于或等于 1, 第0轮训练的初始神经网络模型为未 经训练的初始神经网络模型: 将第i轮训练使用的训练样本图像输入第i ‑1轮确定的初始神经网络模型, 通过第i ‑1 轮确定的主干神经网络对所述训练样本图像进行 下采样, 得到N个样本下采样特 征图; 通过第i‑1轮确定的特征金字塔网络对所述N个样本下采样特征图进行上采样, 得到M权 利 要 求 书 1/2 页 2 CN 115205603 A 2个样本上采样特征图, 其中, 所述M个样本上采样特征图中的部分特征图与所述N个样本下 采样特征图中的部分特 征图的倍 率相同; 通过第i‑1轮确定的信息整合网络对所述M个样本上采样特征图进行处理, 得到所述第 i轮训练使用的训练样本图像的样本识别结果; 在所述样本识别结果与所述第 i轮训练使用的训练样本图像的已知识别结果满足所述 预设损失条件的情况下, 将所述第i ‑1轮确定的初始神经网络模型确定为所述目标神经网 络模型。 6.根据权利要求5所述的方法, 其特征在于, 在所述样本识别结果与所述第i轮训练使 用的训练样本图像的已知识别结果满足所述预设损失条件的情况下, 将所述第i ‑1轮确定 的初始神经网络模型确定为所述目标神经网络模型, 包括: 获取所述样本识别结果中所述训练样本图像中样本对象的预估类别, 以及所述样本识 别结果中所述样本对象的预估位置; 确定所述样本对象的预估类别与所述样本对象的已知类别之间的第一损 失值, 其中, 所述已知识别结果包括所述样本对象的已知类别; 确定所述样本对象的预估位置与所述样本对象的已知位置之间的第二损 失值, 其中, 所述已知识别结果还 包括所述样本对象的已知位置; 在所述第一损失值和所述第二损 失值满足所述预设损失条件的情况下, 将所述第i ‑1 轮确定的初始神经网络模型确定为所述目标神经网络模型。 7.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 将所述第一损失值和所述第二损失值的和 确定为目标损失值; 在所述目标损失值小于或等于预设阈值的情况下, 确定所述第 一损失值和所述第 二损 失值满足所述预设损失条件。 8.一种图像的识别装置, 其特 征在于, 包括: 获取模块, 用于获取待识别图像; 第一处理模块, 用于通过目标神经网络模型的主干神经网络对所述待识别图像进行下 采样, 得到N个下采样特 征图, 其中, N大于1; 第二处理模块, 用于通过所述目标神经网络模型的特征金字塔网络对所述N个下采样 特征图进行上采样, 得到M个上采样特征图, 其中, M大于或等于N, 所述M个上采样特征图中 的部分特 征图与所述 N个下采样特 征图中的部分特 征图的倍 率相同; 第三处理模块, 用于通过所述目标神经网络模型的信息整合网络对所述M个上采样特 征图进行处理, 得到所述待识别图像的识别结果, 其中, 所述识别结果包括所述待识别图像 中目标对象的类别、 所述目标对象的位置信息 。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法 的步骤。 10.一种电子装置, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处理器被设置为运行所述计算机程序以执行所述权利要求 1至7任一项中所述的方 法。权 利 要 求 书 2/2 页 3 CN 115205603 A 3

.PDF文档 专利 图像的识别方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像的识别方法及装置 第 1 页 专利 图像的识别方法及装置 第 2 页 专利 图像的识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:13:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。