专利获取视频数据的方法、深度学习模型的训练方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221079690 5.9 (22)申请日 2022.07.05 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人杨虎　李国豪　冯知凡　柴春光　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师吕朝蕙 (51)Int.Cl. G06F 16/783(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06N 3/08(2006.01) G06V 10/82(2022.01)G06V 30/19(2022.01) (54)发明名称获取视频数据的方法、深度学习模型的训练方法和装置 (57)摘要本公开提供了一种获取视频数据的方法、深度学习模型的训练方法、装置、设备、介质和产品，涉及知识图谱、自然语言处理、深度学习等人工智能技术领域。获取视频数据的方法包括：处理与第一类型视频数据相关联的第一文本数据，得到候选字词和与候选字词对应的字词类别；基于字词类别，从候选字词中确定目标字词；基于目标字词，从第二类型视频数据中获取与第一类型视频数据相关联的目标视频数据。权利要求书3页说明书14页附图8页 CN 115098730 A 2022.09.23 CN 115098730 A 1.一种获取视频数据的方法，包括：处理与第一类型视频数据相关联的第一文本数据，得到候选字词和与所述候选字词对应的字词类别；基于所述字词类别，从所述候选字词中确定目标字词；以及基于所述目标字词，从第二类型视频数据中获取与所述第一类型视频数据相关联的目标视频数据。 2.根据权利要求1所述的方法，其中，所述处理与第一类型视频数据相关联的第一文本数据，得到候选字词和与所述候选字词对应的字词类别包括：将所述第一文本数据的文本类型从第一文本类型转换为第二文本类型，得到转换后的第一文本数据；以及利用序列标注方式处理所述转换后的第一文本数据，得到所述候选字词和与所述候选字词对应的所述字词类别。 3.根据权利要求2所述的方法，其中，所述基于所述目标字词，从第二类型视频数据中获取与所述第一类型视频数据相关联的目标视频数据包括：获取与所述第二类型视频数据相关联的第二文本数据，其中，所述第二文本数据的文本类型为所述第二文本类型；以及基于所述目标字词和所述第二文本数据，从所述第二类型视频数据中获取所述目标视频数据，其中，与所述目标视频数据对应的第二文本数据与所述目标字词相匹配。 4.根据权利要求1所述的方法，其中，所述字词类别包括第一字词类别；所述处理与第一类型视频数据相关联的第一文本数据，得到候选字词和与所述候选字词对应的字词类别包括：对所述第一文本数据进行分词处理，得到所述候选字词；以及对所述候选字词进行分类，得到与所述候选字词对应的所述第一字词类别。 5.根据权利要求1或4所述的方法，其中，所述字词类别包括第二字词类别；所述处理与第一类型视频数据相关联的第一文本数据，得到候选字词和与所述候选字词对应的字词类别包括：对所述第一文本数据进行分词处理，得到所述候选字词；以及对所述候选字词进行语义理解，得到与所述候选字词对应的所述第二字词类别。 6.根据权利要求5所述的方法，其中，所述对所述候选字词进行语义理解，得到与所述候选字词对应的所述第二字词类别包括：对所述候选字词进行语义理解，得到与所述候选字词对应的标准字词；从树结构中确定与所述标准字词相关联的目标分支结构，其中，所述树结构包括P个结点，所述P个结点对应于P个类别，所述目标分支结构包括Q个结点，所述Q个结点对应于Q个类别， P为大于1的整数， Q 为小于等于P的整数；以及将所述Q个类别中的至少一个类别确定为所述第二字词类别。 7.根据权利要求5所述的方法，其中，所述基于所述字词类别，从所述候选字词中确定目标字词包括：基于所述第一字词类别，从所述候选字词中确定第一目标字词，其中，所述候选字词包括所述第一目标字词和剩余候选字词；权　利　要　求　书 1/3 页 2 CN 115098730 A 2响应于确定所述第一目标字词的数量少于预设数量，基于所述剩余候选字词的所述第二字词类别，从所述剩余候选字词中确定第二目标字词；以及将所述第一目标字词和所述第二目标字词，确定为所述目标字词。 8.根据权利要求1 ‑3中任意一项所述的方法，其中，与所述目标字词对应的所述字词类别包括以下至少一个：名词类别、场景类别、感官特征类别。 9.根据权利要求1 ‑8中任意一项所述的方法，其中，所述基于所述字词类别，从所述候选字词中确定目标字词包括：从所述候选字词中删除字词类别为第三字词类别的候选字词，将剩余的候选字词确定为所述目标字词，其中，所述第三字词类别包括以下至少一项：数量词类别、助词类别、介词类别、修饰词类别。 10.一种深度学习模型的训练的方法，包括：获取样本视频数据；以及利用所述样本视频数据，训练深度学习模型，其中，所述样本视频数据是根据权利要求1 ‑9中任意一项所述的方法获得的。 11.一种获取视频数据的装置，包括：处理模块，用于处理与第一类型视频数据相关联的第一文本数据，得到候选字词和与所述候选字词对应的字词类别；确定模块，用于基于所述字词类别，从所述候选字词中确定目标字词；以及获取模块，用于基于所述目标字词，从第二类型视频数据中获取与所述第一类型视频数据相关联的目标视频数据。 12.根据权利要求1 1所述的装置，其中，所述处理模块包括：转换子模块，用于将所述第一文本数据的文本类型从第一文本类型转换为第二文本类型，得到转换后的第一文本数据；以及处理子模块，用于利用序列标注方式处理所述转换后的第一文本数据，得到所述候选字词和与所述候选字词对应的所述字词类别。 13.根据权利要求12所述的装置，其中，所述获取模块包括：第一获取子模块，用于获取与所述第二类型视频数据相关联的第二文本数据，其中，所述第二文本数据的文本类型为所述第二文本类型；以及第二获取子模块，用于基于所述目标字词和所述第二文本数据，从所述第二类型视频数据中获取所述目标视频数据，其中，与所述目标视频数据对应的第二文本数据与所述目标字词相匹配。 14.根据权利要求11所述的装置，其中，所述字词类别包括第一字词类别；所述处理模块包括：第一分词子模块，用于对所述第一文本数据进行分词处理，得到所述候选字词；以及分类子模块，用于对所述候选字词进行分类，得到与所述候选字词对应的所述第一字词类别。 15.根据权利要求11或14所述的装置，其中，所述字词类别包括第二字词类别；所述处理模块包括：权　利　要　求　书 2/3 页 3 CN 115098730 A 3

专利 获取视频数据的方法、深度学习模型的训练方法和装置

专利获取视频数据的方法、深度学习模型的训练方法和装置