专利视频录制编码参数的调整方法及相关设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210724837.5 (22)申请日 2022.06.23 (71)申请人深圳软牛科技有限公司地址 518000 广东省深圳市宝安区新安街道海旺社区兴业路1100号金利通金融中心大厦2栋13 01-1310 (72)发明人杜春华　江泽龙　 (74)专利代理机构深圳市特讯知识产权代理事务所(普通合伙) 44653 专利代理师孟智广 (51)Int.Cl. H04N 19/42(2014.01) G06F 40/30(2020.01) G10L 15/06(2013.01) G10L 15/22(2006.01)H04N 5/76(2006.01) H04N 19/142(2014.01) H04N 19/179(2014.01) H04N 19/87(2014.01) (54)发明名称视频录制编码参数的调整方法及相关设备 (57)摘要本发明提供了一种视频录制编码参数的调整方法及相关设备，本发明的视频录制编码参数的调整方法利用预先训练好的场景分类模型、语音识别模型和语义识别模型对视频录制起始阶段预设时长的源视频数据中的视频帧数据和音频帧数据进行场景类型的判断，当获得了源视频数据当前所属的场景后，将源视频数据当前所属的场景作为视频录制的场景；再根据确定的场景从视频编码参数数据库的频编码参数集合中，获得视频录制的推荐编码器和推荐编码参数；最后利用推荐编码器和推荐编码参数对预设时长之后录制得到的后续视频数据进行编码。本发明的视频录制编码参数的调整方法实现了无需人工设置即可以实现不同场景类型下视频录制编码参数的自适应。权利要求书3页说明书10页附图2页 CN 115190314 A 2022.10.14 CN 115190314 A 1.一种视频录制编码参数的调整方法，其特征在于，所述视频录制编码参数的调整方法包括：获取视频录制起始阶段预设时长的源视频数据；利用预先训练好的场景分类模型对所述源视频数据中的视频帧数据进行场景检测，获得所述源视频数据所属场景的第一概率分布；利用预先训练好的语音识别模型和语义识别模型对所述源视频数据中的音频帧数据进行文本转换和语义识别，获得所述源视频数据所属场景的第二概率分布；对所述第一概率分布和所述第二概率分布进行权重运算获得所述源视频数据所属场景的合计概率分布；从所述合计概率分布中选出概率最大的场景类型作为所述源视频数据的所属场景；判断视频编码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频编码参数集合；若存在，则从所述视频编码参数集合中获得视频录制的推荐编码器和推荐编码参数；利用所述推荐编码器和所述推荐编码参数对所述预设时长之后录制得到的后续视频数据进行编码。 2.根据权利要求1所述的视频录制编码参数的调整方法，其特征在于，所述利用预先训练好的场景分类模型对所述源视频数据中的视频帧数据进行场景检测，获得所述源视频数据所属场景的第一概率分布包括：利用预先训练好的场景分类模型从所述视频帧数据中随机抽取若干的视频帧；对每一所述视频帧进行分类特征提取；收集提取到的所有所述分类特征，确定每个所述分类特征对应的场景类型；统计得到的所有场景类型并计算每种场景类型所占的比例，得到所述源视频数据所属场景的第一概率分布。 3.根据权利要求1所述的视频录制编码参数的调整方法，其特征在于，所述利用预先训练好的语音识别模型和语义识别模型对所述源视频数据中的音频帧数据进行文本转换和语义识别，获得所述源视频数据所属场景的第二概率分布包括：利用预先训练好的语音识别模型对所述源视频数据中的音频帧数据进行文本转换获得文本数据；利用预先训练好的语义识别模型对所述文本数据进行词组拆分获得若干的关键词；根据预设的推理逻辑对每个所述关键词进行语义推理，得到与每个所述关键词相关的场景类型；统计得到的所有场景类型并计算每种场景类型所占的比例，得到所述源视频数据所属场景的第二概率分布。 4.根据权利要求1所述的视频录制编码参数的调整方法，其特征在于，所述对所述第一概率分布和所述第二概率分布进行权重运算获得所述源视频数据所属场景的合计概率分布包括：对所述第一概率分布中每种场景类型的概率值乘以第一权重系数；对所述第二概率分布中每种场景类型的概率值乘以第二权重系数；以及对乘以所述第一比例系数后所述第一概率分布中和乘以所述第二比例系数后所权　利　要　求　书 1/3 页 2 CN 115190314 A 2述第二概率分布中的同种场景类型的运算后概率值进行相加；汇总计算后得到的所有场景类型的运算后概率值，获得所述源视频数据所属场景的合计概率分布。 5.根据权利要求1所述的视频录制编码参数的调整方法，其特征在于，所述判断视频编码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频编码参数集合之前包括：构建不同场景类型的测试样本视频集；采用不同的编码器和编码参数对不同场景类型的所述测试样本视频集进行编码测试；根据编码后测试样本视频的数据大小和视频质量是否符合预设的要求确定每种场景类型下的推荐编码器和推荐编码参数；将每种场景类型及其对应的所述推荐编码器和所述推荐编码参数组合集合保存到视频编码参数数据库中。 6.根据权利要求5所述的视频录制编码参数的调整方法，其特征在于，所述视频质量通过计算编码后测试样本视频图像的峰值信噪比和结构相似度来判定。 7.根据权利要求1 ‑6任一项所述的视频录制编码参数的调整方法，其特征在于，所述判断视频编码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频编码参数集合之后还包括：若不存在，继续以用户设置的编码器和编码参数对所述预设时长之后录制得到的后续视频数据进行编码。 8.一种视频录制编码参数的调整装置，其特征在于，所述视频录制编码参数的调整装置包括：获取模块，用于获取视频录制起始阶段预设时长的源视频数据；第一概率分布计算模块，用于利用预先训练好的场景分类模型对所述源视频数据中的视频帧数据进行场景检测，获得所述源视频数据所属场景的第一概率分布；第二概率分布计算模块，用于利用预先训练好的语音识别模型和语义识别模型对所述源视频数据中的音频帧数据进行文本转换和语义识别，获得所述源视频数据所属场景的第二概率分布；权重运算模块，用于对所述第一概率分布和所述第二概率分布进行权重运算获得所述源视频数据所属场景的合计概率分布；选择模块，用于从所述合计概率分布中选出概率最大的场景类型作为所述源视频数据的所属场景；判断模块，用于判断视频编码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频编码参数集合；解析模块，用于若存在，则从所述视频编码参数集合中获得视频录制的推荐编码器和推荐编码参数；编码模块，用于利用所述推荐编码器和所述推荐编码参数对所述预设时长之后录制得到的后续视频数据进行编码。 9.一种视频录制编码参数的调整设备，其特征在于，所述视频录制编码参数的调整设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个权　利　要　求　书 2/3 页 3 CN 115190314 A 3

专利 视频录制编码参数的调整方法及相关设备

专利视频录制编码参数的调整方法及相关设备