说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210960566.3 (22)申请日 2022.08.09 (71)申请人 上海闪马智能科技有限公司 地址 200210 上海市浦东 新区自由贸易试 验区临港新片区环湖西二路8 88号C楼 (72)发明人 林亦宁 易芮 安超 (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 赵静 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/40(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 图像的识别方法及装置 (57)摘要 本发明实施例提供了一种图像的识别方法 及装置, 包括: 获取待识别图像; 通过目标神经网 络模型的主干神经网络对待识别图像进行下采 样, 得到N个下采样特征图; 通过目标神经网络模 型的特征金字塔网络对N个下采样特征图进行上 采样, 得到M个上采样特征图; 通过目标神经网络 模型的信息整合网络对M个上采样特征图进行处 理, 得到待识别图像的识别结果。 通过本发明, 解 决了图像中目标对象的识别准确率较低的问题, 进而达到了提高目标对象识别准确率的效果。 权利要求书2页 说明书10页 附图3页 CN 115205603 A 2022.10.18 CN 115205603 A 1.一种图像的识别方法, 其特 征在于, 包括: 获取待识别图像; 通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样, 得到N个下采 样特征图, 其中, N大于1; 通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样, 得到M个上采样特征图, 其中, M大于或等于N, 所述M个上采样特征图中的部分特征图与所述 N个下采样特 征图中的部分特 征图的倍 率相同; 通过所述目标神经网络模型的信息整合网络对所述M个上采样特征图进行处理, 得到 所述待识别图像的识别结果, 其中, 所述识别结果包括所述待识别图像中目标对象 的类别、 所述目标对象的位置信息 。 2.根据权利要求1所述的方法, 其特 征在于, 通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样, 得到N个下采 样特征图, 包括: 通过所述主干神经网络对所述待识别图像进行下采样, 得到8倍下采样特 征图、 16倍下采样特征图和32倍下采样特征图, 所述N个下采样特征图包括: 所述8倍下采样 特征图、 16倍下采样特 征图和32倍下采样特 征图; 通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样, 得到M个上采样特征图, 包括: 通过所述特征金字塔网络对所述8倍下采样特征图、 16倍下采 样特征图和32倍下采样特征图进行上采样, 得到4倍上采样特征图、 16倍上采样特征图、 32 倍上采样特征图和64倍上采样特征图, 其中, 所述M个上采样特征图包括: 所述4倍上采样特 征图、 所述16倍上采样特 征图、 所述32倍上采样特 征图和所述64 倍上采样特 征图。 3.根据权利要求2所述的方法, 其特征在于, 所述通过所述目标神经网络模型的信 息整 合网络对所述M个上采样特 征图进行处 理, 得到所述待识别图像的识别结果, 包括: 通过所述目标神经网络模型的信息整合网络对所述4倍上采样特征图、 所述16倍上采 样特征图、 所述32倍上采样特征图和所述64倍上采样特征图进行处理, 得到所述待识别图 像的识别结果。 4.根据权利要求2所述的方法, 其特征在于, 在所述通过所述目标神经网络模型的特征 金字塔网络对所述 N个下采样特 征图进行 上采样之前, 所述方法还 包括: 获取训练样本图像集 合; 通过所述训练样本图像集 合对待训练的初始神经网络模型进行迭代训练; 在训练过程中, 若所述初始神经网络模型输出的样本识别结果与输入的训练样本图像 的已知识别结果满足预设损失条件, 则停止训练得到所述 目标神经网络模型, 若不满足所 述预设损失条件, 则调整所述初始神经网络模型的模型, 继续进行训练。 5.根据权利要求4所述的方法, 其特征在于, 通过所述训练样本图像集合对待训练的初 始神经网络模型进行迭代训练, 包括: 通过以下步骤对所述待训练的初始神经网络模型进行第i轮训练, 其中, i大于或等于 1, 第0轮训练的初始神经网络模型为未 经训练的初始神经网络模型: 将第i轮训练使用的训练样本图像输入第i ‑1轮确定的初始神经网络模型, 通过第i ‑1 轮确定的主干神经网络对所述训练样本图像进行 下采样, 得到N个样本下采样特 征图; 通过第i‑1轮确定的特征金字塔网络对所述N个样本下采样特征图进行上采样, 得到M权 利 要 求 书 1/2 页 2 CN 115205603 A 2个样本上采样特征图, 其中, 所述M个样本上采样特征图中的部分特征图与所述N个样本下 采样特征图中的部分特 征图的倍 率相同; 通过第i‑1轮确定的信息整合网络对所述M个样本上采样特征图进行处理, 得到所述第 i轮训练使用的训练样本图像的样本识别结果; 在所述样本识别结果与所述第 i轮训练使用的训练样本图像的已知识别结果满足所述 预设损失条件的情况下, 将所述第i ‑1轮确定的初始神经网络模型确定为所述目标神经网 络模型。 6.根据权利要求5所述的方法, 其特征在于, 在所述样本识别结果与所述第i轮训练使 用的训练样本图像的已知识别结果满足所述预设损失条件的情况下, 将所述第i ‑1轮确定 的初始神经网络模型确定为所述目标神经网络模型, 包括: 获取所述样本识别结果中所述训练样本图像中样本对象的预估类别, 以及所述样本识 别结果中所述样本对象的预估位置; 确定所述样本对象的预估类别与所述样本对象的已知类别之间的第一损 失值, 其中, 所述已知识别结果包括所述样本对象的已知类别; 确定所述样本对象的预估位置与所述样本对象的已知位置之间的第二损 失值, 其中, 所述已知识别结果还 包括所述样本对象的已知位置; 在所述第一损失值和所述第二损 失值满足所述预设损失条件的情况下, 将所述第i ‑1 轮确定的初始神经网络模型确定为所述目标神经网络模型。 7.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 将所述第一损失值和所述第二损失值的和 确定为目标损失值; 在所述目标损失值小于或等于预设阈值的情况下, 确定所述第 一损失值和所述第 二损 失值满足所述预设损失条件。 8.一种图像的识别装置, 其特 征在于, 包括: 获取模块, 用于获取待识别图像; 第一处理模块, 用于通过目标神经网络模型的主干神经网络对所述待识别图像进行下 采样, 得到N个下采样特 征图, 其中, N大于1; 第二处理模块, 用于通过所述目标神经网络模型的特征金字塔网络对所述N个下采样 特征图进行上采样, 得到M个上采样特征图, 其中, M大于或等于N, 所述M个上采样特征图中 的部分特 征图与所述 N个下采样特 征图中的部分特 征图的倍 率相同; 第三处理模块, 用于通过所述目标神经网络模型的信息整合网络对所述M个上采样特 征图进行处理, 得到所述待识别图像的识别结果, 其中, 所述识别结果包括所述待识别图像 中目标对象的类别、 所述目标对象的位置信息 。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法 的步骤。 10.一种电子装置, 包括存储器和 处理器, 其特征在于, 所述存储器中存储有计算机程 序, 所述处理器被设置为运行所述计算机程序以执行所述权利要求 1至7任一项中所述的方 法。权 利 要 求 书 2/2 页 3 CN 115205603 A 3
专利 图像的识别方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 10:13:53
上传分享
举报
下载
原文档
(561.2 KB)
分享
友情链接
ISO 9283 1998 Manipulating industrial robots — Performance criteria and related test meth.pdf
ISO-IEC 23001-14 2019-AMD1 2021 Amendment 1 - Information technology - MPEG systems technologies - Part 14 Partial file format - Support for HTTP entities enhanced file type and byte-range priorities..pdf
ISO 21254-2 2011 Lasers and laser-related equipment — Test methods for laser-induced damage threshold — Part 2 Threshold determination.pdf
ISO 7326 2016 Rubber and plastics hoses — Assessment of ozone resistance under static.pdf
ISO IEC 14598-6 2001 Software engineering — Product evaluation — Part 6 Documentation of evaluation modules.pdf
ISO-IEEE 11073-10701 2024 Health informatics Device interoperability Part 10701 Point-of-care medical device communication Metric provisioning by participants in a Service-oriented Device Connectiv.pdf
ISO 5794-2 2014 Rubber compounding ingredients — Silica, precipitated, hydrated — Part 2 Evaluation procedures in styrene-butadiene rubber.pdf
ISO 11358-3 2021 Plastics Thermogravimetry (TG) of polymers Part 3 Determination of the activation energy using the Ozawa-Friedman plot and analysis of the reaction kinetics.pdf
ISO 19426-7 2021 Structures for mine shafts — Part 7 Rope guides.pdf
ISO TR 16982 2002 Ergonomics of human-system interaction — Usability methods supporting human-centred design.pdf
GB-T 28723-2012 固体有机化学品纯度的测定 差示扫描量热法.pdf
GB-T 16404.2-1999 声学 声强法测定噪声源的声功率级 第2部分 扫描测量.pdf
GB-T 36878-2018 密封胶抗撕裂强度的测定.pdf
GB-T 32993-2016 碳纤维体积电阻率的测定.pdf
GB-T 1115.1-2002 圆柱形铣刀 第1部分 型式和尺寸.pdf
GB-T 17454.2-2017 机械安全 压敏保护装置 第2部分∶压敏边和压敏棒的设计和试验通则.pdf
GB-T 22162-2008 盘装和架装工业过程测量和控制仪表的盘面和开孔尺寸.pdf
GB-T 19321-2003 小艇 操舵装置 齿轮传动连接系统.pdf
GB-T 18931-2022 碳含量小于7%的碱性致密定形耐火制品分类.pdf
GB-T 17847-1999 小艇 电动风机.pdf
1
/
3
16
评价文档
赞助1.5元 点击下载(561.2 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。