说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221079690 5.9 (22)申请日 2022.07.05 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 杨虎 李国豪 冯知凡 柴春光  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 吕朝蕙 (51)Int.Cl. G06F 16/783(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06N 3/08(2006.01) G06V 10/82(2022.01)G06V 30/19(2022.01) (54)发明名称 获取视频数据的方法、 深度学习模 型的训练 方法和装置 (57)摘要 本公开提供了一种获取视频数据的方法、 深 度学习模型的训练方法、 装置、 设备、 介质和产 品, 涉及知识图谱、 自然语言处理、 深度学习等人 工智能技术领域。 获取视频数据的方法包括: 处 理与第一类型视频数据相关联的第一文本数据, 得到候选字词和与候选字词对应的字词类别; 基 于字词类别, 从候选字词 中确定目标字词; 基于 目标字词, 从第二类型视频数据中获取与第一类 型视频数据相关联的目标视频数据。 权利要求书3页 说明书14页 附图8页 CN 115098730 A 2022.09.23 CN 115098730 A 1.一种获取视频 数据的方法, 包括: 处理与第一类型视频数据相关联的第 一文本数据, 得到候选字词和与 所述候选字词对 应的字词类别; 基于所述字词类别, 从所述 候选字词中确定目标字词; 以及 基于所述目标字词, 从第 二类型视频数据中获取与所述第 一类型视频数据相关联的目 标视频数据。 2.根据权利要求1所述的方法, 其中, 所述处理与第 一类型视频数据相关联的第 一文本 数据, 得到候选 字词和与所述 候选字词对应的字词类别包括: 将所述第一文本数据的文本类型从第 一文本类型转换为第 二文本类型, 得到转换后的 第一文本数据; 以及 利用序列 标注方式处理所述转换后的第 一文本数据, 得到所述候选字词和与 所述候选 字词对应的所述字词类别。 3.根据权利要求2所述的方法, 其中, 所述基于所述目标字词, 从第二类型视频数据中 获取与所述第一类型视频 数据相关联的目标视频 数据包括: 获取与所述第二类型视频数据相关联的第二文本数据, 其中, 所述第二文本数据的文 本类型为所述第二文本类型; 以及 基于所述目标字词和所述第 二文本数据, 从所述第 二类型视频数据中获取所述目标视 频数据, 其中, 与所述目标视频 数据对应的第二文本数据与所述目标字词相匹配。 4.根据权利要求1所述的方法, 其中, 所述字词类别包括第一字词类别; 所述处理与第 一类型视频数据相关联的第一文本数据, 得到候选字词和与所述候选字词对应的字词类别 包括: 对所述第一文本数据进行分词处 理, 得到所述 候选字词; 以及 对所述候选字词进行分类, 得到与所述 候选字词对应的所述第一字词类别。 5.根据权利要求1或4所述的方法, 其中, 所述字词类别包括第二字词类别; 所述处理与 第一类型视频数据相关联的第一文本数据, 得到候选字词和与所述候选字词对应的字词类 别包括: 对所述第一文本数据进行分词处 理, 得到所述 候选字词; 以及 对所述候选字词进行语义理解, 得到与所述 候选字词对应的所述第二字词类别。 6.根据权利要求5所述的方法, 其中, 所述对所述候选字词进行语义理解, 得到与所述 候选字词对应的所述第二字词类别包括: 对所述候选字词进行语义理解, 得到与所述 候选字词对应的标准字词; 从树结构中确定与所述标准字词相关联的目标分支结构, 其中, 所述树结构包括P个结 点, 所述P个结点对应于P个类别, 所述目标分支结构包括Q个结点, 所述Q个结点对应于Q个 类别, P为大于1的整数, Q 为小于等于P的整数; 以及 将所述Q个类别中的至少一个 类别确定为所述第二字词类别。 7.根据权利要求5所述的方法, 其中, 所述基于所述字词类别, 从所述候选字词中确定 目标字词包括: 基于所述第 一字词类别, 从所述候选字词中确定第 一目标字词, 其中, 所述候选字词包 括所述第一目标字词和剩余 候选字词;权 利 要 求 书 1/3 页 2 CN 115098730 A 2响应于确定所述第 一目标字词的数量少于预设数量, 基于所述剩余候选字词的所述第 二字词类别, 从所述剩余 候选字词中确定第二目标字词; 以及 将所述第一目标字词和所述第二目标字词, 确定为所述目标字词。 8.根据权利要求1 ‑3中任意一项所述的方法, 其中, 与所述目标字词对应的所述字词类 别包括以下至少一个: 名词类别、 场景类别、 感官 特征类别。 9.根据权利要求1 ‑8中任意一项所述的方法, 其中, 所述基于所述字词类别, 从所述候 选字词中确定目标字词包括: 从所述候选字词中删除字词类别为第 三字词类别的候选字词, 将剩余的候选字词确定 为所述目标字词, 其中, 所述第三字词类别包括以下至少一项: 数量词类别、 助词类别、 介词类别、 修饰词 类别。 10.一种深度学习模型的训练的方法, 包括: 获取样本 视频数据; 以及 利用所述样本 视频数据, 训练深度学习模型, 其中, 所述样本 视频数据是根据权利要求1 ‑9中任意一项所述的方法获得的。 11.一种获取视频 数据的装置, 包括: 处理模块, 用于处理与第一类型视频数据相关联的第一文本数据, 得到候选字词和与 所述候选字词对应的字词类别; 确定模块, 用于基于所述字词类别, 从所述 候选字词中确定目标字词; 以及 获取模块, 用于基于所述目标字词, 从第二类型视频数据中获取与所述第一类型视频 数据相关联的目标视频 数据。 12.根据权利要求1 1所述的装置, 其中, 所述处 理模块包括: 转换子模块, 用于将所述第 一文本数据的文本类型从第 一文本类型转换为第 二文本类 型, 得到转换后的第一文本数据; 以及 处理子模块, 用于利用序列标注方式处理所述转换后的第一文本数据, 得到所述候选 字词和与所述 候选字词对应的所述字词类别。 13.根据权利要求12所述的装置, 其中, 所述获取模块包括: 第一获取子模块, 用于获取与 所述第二类型视频数据相关联的第二文本数据, 其中, 所 述第二文本数据的文本类型为所述第二文本类型; 以及 第二获取子模块, 用于基于所述目标字词和所述第二文本数据, 从所述第二类型视频 数据中获取所述目标视频数据, 其中, 与所述 目标视频数据对应的第二文本数据与所述 目 标字词相匹配。 14.根据权利要求11所述的装置, 其中, 所述字词类别包括第一字词类别; 所述处理模 块包括: 第一分词子模块, 用于对所述第一文本数据进行分词处 理, 得到所述 候选字词; 以及 分类子模块, 用于对所述候选字词进行分类, 得到与所述候选字词对应的所述第一字 词类别。 15.根据权利要求11或14所述的装置, 其中, 所述字词类别包括第二字词类别; 所述处 理模块包括:权 利 要 求 书 2/3 页 3 CN 115098730 A 3

.PDF文档 专利 获取视频数据的方法、深度学习模型的训练方法和装置

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 获取视频数据的方法、深度学习模型的训练方法和装置 第 1 页 专利 获取视频数据的方法、深度学习模型的训练方法和装置 第 2 页 专利 获取视频数据的方法、深度学习模型的训练方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。