说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111635796.4 (22)申请日 2021.12.2 9 (71)申请人 浙江大华 技术股份有限公司 地址 310053 浙江省杭州市滨江区滨安路 1187号 (72)发明人 廖紫嫣 张姜 邸德宁 郝敬松  朱树磊 殷俊  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 代理人 潘平 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/40(2022.01) G06V 10/80(2022.01) G06V 10/74(2022.01)G06K 9/62(2022.01) (54)发明名称 一种目标识别的方法、 装置及电子设备 (57)摘要 本申请公开一种目标识别的方法、 装置及电 子设备, 该方法包括提取待处理视频中目标对象 的不同模态的多个特征, 并确定所述待处理视频 对应的参考特征, 在这里, 参考特征可 以基于多 个参考视频的特征确定, 且参考视频为具有不同 模态中至少一种模态的特征的视频, 然后基于确 定的参考特征, 对待处理视频的多个特征进行融 合, 得到待处理视频的融合特征, 再利用该融合 特征, 确定目标对象的识别结果。 基于上述方法 可以得到目标对象的不同模态的融合特征, 解决 现有技术因单一模态特征而导致识别目标识别 准确率低的问题, 进一步, 结合参考特征来对提 取的不同模态的特征进行融合, 能够有效提升目 标识别的准确率。 权利要求书3页 说明书16页 附图4页 CN 114359796 A 2022.04.15 CN 114359796 A 1.一种目标识别的方法, 其特 征在于, 所述方法包括: 提取待处 理视频中目标对象的不同模态的多个特 征; 确定所述待处理视频对应的参考特征; 其中, 所述参考特征基于多个参考视频的特征 确定, 所述 参考视频为具有所述 不同模态中至少一种模态的特 征的视频; 基于所述参考特征, 对所述待处理视频的所述多个特征进行融合, 得到所述待处理视 频的融合特 征; 利用所述融合特 征, 确定所述目标对象的识别结果。 2.如权利要求1所述的方法, 其特征在于, 所述提取待处理视频中目标对象的不同模态 的多个特 征, 包括: 在待处理视频中提取出第 一图像集合, 对所述第 一图像集合中的每张图像执行如下操 作: 计算单张图像与所述第 一图像集合中的每张图像之间的相似度值, 若所有相似度值都 大于预设相似度阈值, 则将所述单张图像添加到第二图像集 合; 在所述第二图像集 合中, 提取 各张图像中目标对象的不同模态的特 征; 分别对从所述各张图像中提取的同一模态的多个特征进行加权求和, 计算所述同一模 态的一个特 征, 得到所述 不同模态的多个特 征; 将计算得到的所述 不同模态的多个特 征作为所述待处 理视频的不同模态的多个特 征。 3.如权利要求2所述的方法, 其特征在于, 所述在所述待处理视频中提取出第 一图像集 合, 包括: 提取待处理视频中的多 张图像作为第 三图像集合, 计算所述第 三图像集合中各张图像 的图像质量分数; 提取所有大于预设阈值的图像质量分数对应的图像组成第一图像集 合。 4.如权利要求1所述的方法, 其特征在于, 在所述提取待处理视频中目标对象的不同模 态的多个特 征之后, 还 包括: 对所述待处 理视频进行 特征编码, 得到所述待处 理视频对应的视频 特征; 将所述视频特征逐一添加到所述多个特征的每个特征中, 得到各个特征对应的编码特 征, 并将得到的多个编码特 征作为所述待处 理视频的多个特 征。 5.如权利要求1所述的方法, 其特征在于, 所述确定所述待处理视频对应的参考特征, 包括: 分别计算所述多个特征中每个特征与预设视频中各个特征之间的相似度值, 得到所述 多个特征中每个特征的多个相似度值; 按照所述相似度值的大小, 对所述多个特征中每个特征的多个相似度值进行排列, 并 取排列在目标位置的相似度值对应的预设视频作为 参考视频; 提取各个参考视频中的所述不同模态的特征, 并将提取出的特征作为所述待处理视频 对应的参 考特征。 6.如权利要求5所述的方法, 其特征在于, 所述提取各个参考视频中的所述不同模态的 特征, 并将提取 出的特征作为所述待处 理视频对应的参 考特征, 包括: 判断各个参 考视频中是否包 含所述不同模态的缺失的特 征; 若否, 则提取所述各个参考视频中所述不同模态的特征, 并将提取出的特征作为所述权 利 要 求 书 1/3 页 2 CN 114359796 A 2待处理视频对应的参 考特征; 若是, 则提取所述各个参考视频中所述不同模态的特征, 并使用指定向量填充提取的 缺失的特 征, 将所述 不同模态的经 过填充后的特 征作为所述待处 理视频对应的参 考特征。 7.如权利要求1 ‑6任一项所述的方法, 其特征在于, 所述基于所述参考特征, 对所述待 处理视频的所述多个特 征进行融合, 得到所述待处 理视频的融合特 征, 包括: 确定由所述多个特 征以及所述 参考特征共同组成的特 征矩阵; 获取与所述特征矩阵对应的邻接矩阵; 其中, 所述邻接矩阵表征所述特征矩阵中不同 特征之间进行融合的连接关系; 通过对所述特 征矩阵以及所述邻接矩阵进行聚合, 得到所述待处 理视频的融合特 征。 8.如权利要求7所述的方法, 其特征在于, 所述获取所述特征矩阵对应的邻接矩阵, 包 括: 确定所述多个特 征中每个特征与所述特 征矩阵中每 个特征之间进行融合的连接系数; 根据确定的连接系数, 得到由所述确定的连接系数组成的邻接矩阵。 9.如权利要求7所述的方法, 其特征在于, 所述通过对所述特征矩阵以及所述邻 接矩阵 进行聚合, 得到所述待处 理视频的融合特 征, 包括: 响应于所述特 征矩阵中不存在缺失的参 考特征, 获取预设更新次数; 通过图神经网络, 对所述特征矩阵和所述邻接矩阵进行所述预设更新次数的聚合, 得 到所述特 征矩阵更新后的目标 特征矩阵; 其中, 所述目标 特征矩阵由目标 特征组成; 在所述目标特征矩阵中, 提取与所述多个特征对应的多个目标特征, 并对所述多个目 标特征进行融合, 得到所述待处 理视频的融合特 征。 10.如权利要求7所述的方法, 其特征在于, 所述通过对所述特征矩阵以及所述邻接矩 阵进行聚合, 得到所述待处 理视频的融合特 征, 包括: 响应于所述特征矩阵中存在缺失的参考特征, 在所述邻接矩阵中, 将与所述缺失的参 考特征相关的连接系数调整为指定数值; 通过图神经网络, 对所述特征矩阵和调整后的邻接矩阵进行预设更新次数的聚合, 得 到所述特 征矩阵更新后的目标 特征矩阵; 根据预设的掩码矩阵与预设的缩放矩阵, 对所述目标特征矩阵进行再更新, 得到所述 待处理视频的融合特 征。 11.一种目标识别的装置, 其特 征在于, 所述装置包括: 提取模块, 提取待处 理视频中目标对象的不同模态的多个特 征; 确定模块, 确定所述待处理视频对应的参考特征; 其中, 所述参考特征基于多个参考视 频的特征确定, 所述 参考视频为具有所述 不同模态中至少一种模态的特 征的视频的特 征; 融合模块, 基于所述参考特征, 对所述待处理视频的所述多个特征进行融合, 得到所述 待处理视频的融合特 征; 识别模块, 利用所述融合特 征, 确定所述目标对象的识别结果。 12.一种电子设备, 其特 征在于, 包括: 存储器, 用于存放计算机程序; 处理器, 用于执行所述存储器上所存放的计算机程序时, 实现权利要求1 ‑10中任一项 所述的方法步骤。权 利 要 求 书 2/3 页 3 CN 114359796 A 3

.PDF文档 专利 一种目标识别的方法、装置及电子设备

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种目标识别的方法、装置及电子设备 第 1 页 专利 一种目标识别的方法、装置及电子设备 第 2 页 专利 一种目标识别的方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:42:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。