说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210907494.6 (22)申请日 2022.07.29 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 辛颖 薛松 冯原 李超 张滨 王云浩 韩树民 (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 徐升升 阎敏 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/42(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像分类方法、 装置、 设备以及存 储介质 (57)摘要 本公开提供了一种图像分类方法、 装置、 设 备以及存储介质。 涉及人工智 能技术领域, 具体 涉及深度学习、 图像处理、 计算机视觉技术领域, 可应用于图像分类等场景。 具体实现方案为: 通 过第一网络模 型提取目标图像的第一图像特征, 第一网络模 型包括卷积神经网络模块; 通过第二 网络模型提取目标图像的第二图像特征, 第二网 络 模 型 包 括 深 度 自 注 意 力 变 换 网 络 (Transformer)模块; 对第一图像特征和第二图 像特征进行融合处理, 得到待识别目标特征; 基 于待识别目标特征对目标图像进行分类。 根据本 公开的技 术方案, 能提高图像的分类准确率。 权利要求书4页 说明书11页 附图4页 CN 115331048 A 2022.11.11 CN 115331048 A 1.一种图像分类方法, 包括: 通过第一网络模型提取目标图像的第 一图像特征, 所述第 一网络模型包括卷积神经网 络模块; 通过第二网络模型提取所述目标图像的第 二图像特征, 所述第 二网络模型包括深度自 注意力变换网络Transformer模块; 对所述第一图像特 征和所述第二图像特 征进行融合处 理, 得到待识别目标 特征; 基于所述待识别目标 特征对所述目标图像进行分类。 2.根据权利要求1所述的方法, 其中, 所述对所述第 一图像特征和所述第 二图像特征进 行融合处 理, 得到待识别目标 特征, 包括: 将所述第一图像特征与所述第 二图像特征通过第 一融合方式进行特征融合, 得到第 三 图像特征; 将所述第二图像特征与所述第 一图像特征通过第 二融合方式进行特征融合, 得到第四 图像特征; 将所述第三图像特征与所述第四图像特征通过第 三融合方式进行特征融合, 得到所述 待识别目标 特征。 3.根据权利要求2所述的方法, 其中, 所述将所述第 一图像特征与所述第 二图像特征通 过第一融合方式进行 特征融合, 得到第三图像特 征, 包括: 以所述第一图像特征为基准, 将所述目标图像的相同位置处 的所述第 二图像特征与 所 述第一图像特 征相加, 得到所述第三图像特 征。 4.根据权利要求2所述的方法, 其中, 所述将所述第 二图像特征与所述第 一图像特征通 过第二融合方式进行 特征融合, 得到第四图像特 征, 包括: 以所述第二图像特征为基准, 将所述目标图像的目标位置处 的所述第 一图像特征与 所 述第二图像特 征相加, 得到所述第四图像特 征。 5.根据权利要求2所述的方法, 其中, 所述将所述第 三图像特征与所述第四图像特征通 过第三融合方式进行 特征融合, 得到所述待识别目标 特征, 包括: 将所述第三图像特 征与所述第一图像特 征进行特征堆叠, 得到第一目标 特征; 将所述第四图像特 征与所述第二图像特 征进行特征堆叠, 得到第二目标 特征; 将所述第一目标 特征与所述第二目标 特征进行特征堆叠, 得到所述待识别目标 特征。 6.根据权利要求5所述的方法, 其中, 所述将所述第 一目标特征与所述第 二目标特征进 行特征堆叠, 得到所述待识别目标 特征, 包括: 将通过所述第一网络模型的第m个卷积层确定的第一目标特征, 与通过所述第二网络 模型的第n个网络层确定的第二目标特征进行特征融合, 得到第k个目标特征; 其中, 所述m、 所述n和所述k均为大于等于1的正整数; 将所述第k个目标特征分别输入所述第一网络模型的第m+1个卷积层和所述第二网络 模型的第n+1个网络层, 得到通过所述第一网络模 型的第m+1个卷积层输出的所述第一目标 特征, 以及通过 所述第二网络模型的第n+1个网络层输出的所述第二目标 特征; 将所述第一目标 特征与所述第二目标 特征进行特征融合, 得到第k+1个目标 特征; 根据所述第k+1个目标 特征确定所述待识别目标 特征。 7.根据权利要求6所述的方法, 所述方法还 包括:权 利 要 求 书 1/4 页 2 CN 115331048 A 2获取指示信息, 所述指示信息用于指示所述目标图像的检测类别; 基于所述指示信息确定所述第一网络模型的第一运行层数和所述第二网络模型的第 二运行层数; 基于所述第一 运行层数和所述第二 运行层数确定所述m的值、 所述 n的值和所述 k的值。 8.根据权利要求2所述的方法, 其中, 所述将所述第 一图像特征与所述第 二图像特征通 过第一融合方式进行 特征融合, 得到第三图像特 征, 包括: 将所述第 一网络模型的第j个卷积层输出的第 一图像特征, 和所述第 二网络模型的第i 个网络层输出的第二图像特征, 输入 所述第一网络模型的第 j+1个卷积层, 得到所述第一网 络模型的第j+1个卷积层输出的所述第一图像特征; 其中, 所述i和所述j均为大于等于1的 正整数; 根据所述第一图像特 征确定所述第三图像特 征。 9.根据权利要求2所述的方法, 其中, 所述将所述第 二图像特征与所述第 一图像特征通 过第二融合方式进行 特征融合, 得到第四图像特 征, 包括: 将所述第 二网络模型的第q个网络层输出的第 二图像特征, 和所述第 一网络模型的第p 个卷积层输出的第一图像特征, 输入 所述第二网络模型的第q+1个网络层, 得到所述第二网 络模型的第q+1个网络层输出的所述第二图像特征, 其中, 所述p和所述q均为大于等于1的 正整数; 根据所述第二图像特 征确定所述第四图像特 征。 10.一种图像分类装置, 包括: 第一获取模块, 用于通过第一网络模型提取目标图像的第一图像特征, 所述第一网络 模型包括卷积神经网络模块; 第二获取模块, 用于通过第二网络模型提取所述目标图像的第二图像特征, 所述第二 网络模型包括深度自注意力变换网络Transformer模块; 特征融合模块, 用于对所述第一图像特征和所述第二图像特征进行融合处理, 得到待 识别目标 特征; 分类模块, 用于基于所述待识别目标 特征对所述目标图像进行分类。 11.根据权利要求10所述的装置, 其中, 所述特 征融合模块, 包括: 第一融合子模块, 用于将所述第 一图像特征与 所述第二图像特征通过第 一融合方式进 行特征融合, 得到第三图像特 征; 第二融合子模块, 用于将所述第 二图像特征与 所述第一图像特征通过第 二融合方式进 行特征融合, 得到第四图像特 征; 第三融合子模块, 用于将所述第 三图像特征与 所述第四图像特征通过第 三融合方式进 行特征融合, 得到所述待识别目标 特征。 12.根据权利要求1 1所述的装置, 其中, 所述第一融合子模块, 用于: 以所述第一图像特征为基准, 将所述目标图像的相同位置处 的所述第 二图像特征与 所 述第一图像特 征相加, 得到所述第三图像特 征。 13.根据权利要求1 1所述的装置, 其中, 所述第二融合子模块, 用于: 以所述第二图像特征为基准, 将所述目标图像的目标位置处 的所述第 一图像特征与 所 述第二图像特 征相加, 得到所述第四图像特 征。权 利 要 求 书 2/4 页 3 CN 115331048 A 3
专利 图像分类方法、装置、设备以及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 10:13:44
上传分享
举报
下载
原文档
(699.3 KB)
分享
友情链接
ISO 20480-4 2021 Fine bubble technology General principles for usage and measurement of fine bubbles Part 4 Terminology related to microbubble beds.pdf
ISO 7291 2010 Gas welding equipment — Pressure regulators for manifold systems used in welding, cutting and allied processes up to 30 MPa (300 bar).pdf
ISO 25539-1 2017 Cardiovascular implants — Endovascular devices — Part 1 Endovascular prostheses.pdf
ISO 23814 2009 Cranes — Competency requirements for crane inspectors.pdf
专利 基于ISO13399的协同设计制造数据集成系统及金属加工设计方法.PDF
ISO 26868 2009 Space data and information transfer systems — Image data compression.pdf
ISO 11427 2024 Jewellery and precious metals — Determination of silver — Pote.pdf
ISO 4341-1978Information processing. Magnetic tape cassette and cartridge labelling and file structu.pdf
ISO IEC TR 20943-5 2013 Information technology — Procedures for achieving metadata registry content consistency — Part 5 Metadata mapping procedure.pdf
ISO 22449-2 2020 Use of reclaimed water in industrial cooling systems — Part 2 Guidelines for cost analysis.pdf
GB-T 24008-2024 环境影响及相关环境因素的货币价值评估.pdf
GB-T 8941-2013 纸和纸板 镜面光泽度的测定.pdf
GB-T 30082-2013 硫化铜、硫化铅和硫化锌精矿 批料中金属质量的测定.pdf
GB-T 35083.2-2018 滑动轴承 轴承材料摩擦学特性试验 第2部分 聚合物轴承材料试验.pdf
GB-T 11885-2015 自动轨道衡.pdf
GB-T 3099.4-2021 紧固件术语 控制、检查、交付、接收和质量.pdf
GB-T 18814-2002 小艇 电气系统 交流装置.pdf
GB-T 40552-2021 教育服务效果测评指南.pdf
GB-T 2423.17-2008 电工电子产品环境试验 第2部分 试验方法 试验Ka 盐雾.pdf
GB-T 4638-1997 35mm电影发行拷贝上画面和光学声迹的位置和尺寸.pdf
1
/
3
20
评价文档
赞助1.5元 点击下载(699.3 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。