说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210896367.0 (22)申请日 2022.07.28 (71)申请人 浙江大华 技术股份有限公司 地址 310053 浙江省杭州市滨江区滨安路 1187号 (72)发明人 叶凡杰 程淼 郑春煌 金达  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 杜晶 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 20/40(2022.01) (54)发明名称 一种目标检测方法、 装置、 设备及 介质 (57)摘要 本申请一些实施例提供了一种目标检测方 法、 装置、 设备及介质, 该方法中在将每个裁剪图 像输入到预先训练完成的第一特征提取网络模 型中进行特征提取之前, 将待检测的图像按照预 设形状, 切分为预设数量的裁剪图像, 有效避免 了在目标检测过程中, 特征提取层和空间金字塔 池化层在缩放的过程中丢失图像的细节信息的 问题, 在之后的目标检测过程中, 全连接层基于 注意力机制确定待检测的图像的权重矩阵, 根据 权重矩阵以及第一图像特征向量为包含目标的 区域分配更多的权重, 提高了对于小目标检测的 准确率与召回率。 权利要求书2页 说明书16页 附图4页 CN 115272823 A 2022.11.01 CN 115272823 A 1.一种目标检测方法, 其特 征在于, 所述方法包括: 将待检测的图像按照预设形状, 切分为预设数量的裁 剪图像; 将每个所述裁剪图像输入到预先训练完成的第 一特征提取网络模型中, 所述第 一特征 提取网络模型的特征提取层提取每个所述裁剪图像的特征图像, 并将所述特征图像输入到 空间金字塔池化层中; 所述空间金字塔池化层获取池化后的第一图像特征向量, 并将所述 第一图像特征向量输入到全连接层中; 所述全连接层基于注意力机制确定所述待检测的图 像的权重矩阵, 并根据所述权重矩阵以及所述第一图像特征向量, 确定检测到的第一 目标 并输出。 2.如权利要求1所述的方法, 其特征在于, 所述根据 所述权重矩阵以及所述第 一图像特 征向量, 确定检测到的第一目标包括: 将基于通道注意力机制确定的所述待检测的图像的第一权重矩阵与所述第一图像特 征向量相乘, 得到第二图像特征向量; 将基于像素注意力机制确定的所述待检测的图像的 第二权重矩阵与所述第二图像特 征向量相乘, 得到检测到的第一目标并输出。 3.如权利要求1所述的方法, 其特征在于, 若所述待检测的图像为视频中的任一视频帧 图像, 所述方法还 包括: 针对所述待检测的图像中的每个像素点, 计算该像素点的像素值与历史像素点样本集 中保存的每个与该像素点相邻的第二预设数量的像素点的像素值的差值; 统计所述差值大 于等于第一预设数值且小于等于第二预设数值的第一数量, 若所述第一数量大于第一预设 数量阈值, 则确定该像素点为背景像素点; 统计所述差值小于所述第一预设数值或大于所 述第二预设数值的第二数量, 若所述第二数量大于第二预设数量阈值, 则确定该像素点为 前景像素点, 将所述前 景像素点确定为检测到的第二目标 上的像素点; 对所述待检测的图像中所述第一目标和所述第二目标进行 标注并输出。 4.如权利要求3所述的方法, 其特征在于, 所述对所述待检测的图像中所述第 一目标和 所述第二目标进行 标注并输出之前, 所述方法还 包括: 针对确定的每个所述前景像素点, 判断该前景像素点是否在连续的第 二预设数量的视 频帧图像中均被确定为前 景像素点, 若是, 则将该 前景像素点置为背景像素点。 5.如权利要求3所述的方法, 其特 征在于, 所述历史像素点样本集的确定过程包括: 获取所述视频中预设视频帧位置的图像, 针对所述图像中的每个像素点, 将所述图像 中该像素点和与该像素点相邻的所述第二预设数量的像素点的像素值保存到所述历史像 素点样本集中。 6.如权利要求3 ‑5任一所述的方法, 其特 征在于, 所述方法还 包括: 针对确定的每个背景像素点, 使用该背景像素点的像素值, 按照预设更新概率, 对该背 景像素点对应的保存在所述历史像素点样本集中的像素点的像素值进行 更新。 7.如权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 针对所述视频中的每个视频帧, 获取与 该视频帧相邻的第 三预设数量的视频帧的图像 中检测到的每个第三目标, 所述第三目标包括检测到的每个所述第一目标和所述第二目 标; 针对获取到的所述第 三预设数量的每个视频帧的图像, 根据该视频帧的图像中检测到 的第三目标, 以及与该视频帧相 邻的视频帧的图像中检测到的第三目标的中心像素点在预权 利 要 求 书 1/2 页 2 CN 115272823 A 2设方向上的矢量速度, 确定所述第三目标的最大运动梯度; 根据所述每个第 三目标的最大运动梯度以及所述每个第 三目标的中心像素点, 确定潜 在目标的像素点。 8.如权利要求7 所述的方法, 其特 征在于, 所述方法还 包括: 针对每个所述潜在目标的像素点, 以该潜在目标的像素点为中心, 按照第一预设像素 大小标准裁剪获取小图抠图; 选取第四预设数量的视频帧中的同一第三目标对应的所述小 图抠图得到第一小图集合; 并基于双线性插值以及所述第一小图集合, 得到第二预设像素 大小的第二小图集 合; 将所述第二小图集合以及所述第三目标的目标最大运动梯度输入到预先训练完成的 第二特征提取网络模型中, 获取所述第二特征提取网络模型的特征提取层提取的特征图 像; 将所述特征图像输入到空间金字塔池化层中, 所述空间金字塔池化层获取池化后的第 三图像特征向量; 将所述第三图像特征向量输入到全连接层中, 所述全连接层基于注意力 机制确定所述特征图像的权重矩阵, 并根据所述权重矩阵以及所述第三图像特征向量, 确 定检测到的第四目标并输出。 9.一种目标检测装置, 其特 征在于, 所述装置包括: 裁剪模块, 用于将待检测的图像按照预设形状, 切分为预设数量的裁 剪图像; 检测模块, 用于将每个所述裁剪图像输入到预先训练完成的第一特征提取网络模型 中, 所述第一特征提取网络模型 的特征提取层提取每个所述裁剪图像的特征图像, 并将所 述特征图像输入到空间金字塔池化层中; 所述空间金字塔池化层获取池化后的第一图像特 征向量, 并将所述第一图像特征向量输入到全连接层中; 所述全连接层基于注意力机制确 定所述待检测的图像的权重矩阵, 并根据所述权重矩阵以及所述第一图像特征向量, 确定 检测到的第一目标并输出。 10.一种电子设备, 其特征在于, 所述电子设备至少包括处理器和存储器, 所述处理器 用于执行存储器中存储的计算机程序时实现权利要求 1‑8中任一所述的目标检测方法的步 骤。 11.一种计算机可读存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序被 处理器执行时实现权利要求1 ‑8中任一所述的目标检测方法的步骤。权 利 要 求 书 2/2 页 3 CN 115272823 A 3

.PDF文档 专利 一种目标检测方法、装置、设备及介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种目标检测方法、装置、设备及介质 第 1 页 专利 一种目标检测方法、装置、设备及介质 第 2 页 专利 一种目标检测方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:12:43上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。