说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210724837.5 (22)申请日 2022.06.23 (71)申请人 深圳软牛科技有限公司 地址 518000 广东省深圳市宝安区新 安街 道海旺社区兴业路1100号金利通金融 中心大厦2栋13 01-1310 (72)发明人 杜春华 江泽龙  (74)专利代理 机构 深圳市特讯知识产权代理事 务所(普通 合伙) 44653 专利代理师 孟智广 (51)Int.Cl. H04N 19/42(2014.01) G06F 40/30(2020.01) G10L 15/06(2013.01) G10L 15/22(2006.01)H04N 5/76(2006.01) H04N 19/142(2014.01) H04N 19/179(2014.01) H04N 19/87(2014.01) (54)发明名称 视频录制编码参数的调整方法及相关 设备 (57)摘要 本发明提供了一种视频录制编码参数的调 整方法及相关设备, 本发明的视频录制编码参数 的调整方法利用预先训练好的场景分类模型、 语 音识别模型和语义识别模型对视频录制起始阶 段预设时长的源视频数据中的视频帧数据和音 频帧数据进行场景类型的判断, 当获得了源视频 数据当前所属的场景后, 将源视频数据当前所属 的场景作为视频录制的场景; 再根据确定的场景 从视频编码参数数据库的频编码参数集合中, 获 得视频录制的推荐编码器和推荐编码参数; 最后 利用推荐编码器和推荐编码参数对预设时长之 后录制得到的后续视频数据进行编码。 本发明的 视频录制编码参数的调整方法实现了无需人工 设置即可以实现不同场景类型下视频录制编码 参数的自适应 。 权利要求书3页 说明书10页 附图2页 CN 115190314 A 2022.10.14 CN 115190314 A 1.一种视频录制编码参数的调整方法, 其特征在于, 所述视频录制编码参数的调整方 法包括: 获取视频录制起始阶段 预设时长的源视频 数据; 利用预先训练好的场景分类模型对所述源视频数据中的视频帧数据进行场景检测, 获 得所述源视频 数据所属场景的第一 概率分布; 利用预先训练好的语音识别模型和语义识别模型对所述源视频数据中的音频帧数据 进行文本转换和语义识别, 获得 所述源视频 数据所属场景的第二 概率分布; 对所述第一概率分布和所述第二概率分布进行权重运算获得所述源视频数据所属场 景的合计概 率分布; 从所述合计概率分布中选出概 率最大的场景类型作为所述源视频 数据的所属场景; 判断视频编码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频 编码参数集 合; 若存在, 则从所述视频编码参数集 合中获得视频录制的推荐编码器和推荐编码参数; 利用所述推荐编码器和所述推荐编码参数对所述预设时长之后录制得到的后续视频 数据进行编码。 2.根据权利要求1所述的视频录制编码参数的调 整方法, 其特征在于, 所述利用预先训 练好的场景分类模型对所述源视频数据中的视频帧数据进 行场景检测, 获得所述源视频数 据所属场景的第一 概率分布包括: 利用预先训练好的场景分类模型从所述视频帧数据中随机抽取若干的视频帧; 对每一所述视频帧进行分类特 征提取; 收集提取到的所有所述分类特 征, 确定每 个所述分类特 征对应的场景类型; 统计得到的所有场景类型并计算每种场景类型所占的比例, 得到所述源视频数据 所属 场景的第一 概率分布。 3.根据权利要求1所述的视频录制编码参数的调 整方法, 其特征在于, 所述利用预先训 练好的语音识别模型和语义识别模型对所述源视频数据中的音频帧数据进行文本转换和 语义识别, 获得 所述源视频 数据所属场景的第二 概率分布包括: 利用预先训练好的语音识别模型对所述源视频数据中的音频帧数据进行文本转换获 得文本数据; 利用预先训练好的语义识别模型对所述文本数据进行词组拆分获得若干的关键词; 根据预设的推理逻辑对每个所述关键词 进行语义推理, 得到与每个所述关键词相关的 场景类型; 统计得到的所有场景类型并计算每种场景类型所占的比例, 得到所述源视频数据 所属 场景的第二 概率分布。 4.根据权利要求1所述的视频录制编码参数的调 整方法, 其特征在于, 所述对所述第 一 概率分布和所述第二概率分布进行权重运算获得所述源视频数据所属场景的合计概率分 布包括: 对所述第一 概率分布中每种场景类型的概 率值乘以第一权 重系数; 对所述第二 概率分布中每种场景类型的概 率值乘以第二权 重系数; 以及对乘以所述第一比例系数后所述第一概率分布中和乘以所述第二比例系数后所权 利 要 求 书 1/3 页 2 CN 115190314 A 2述第二概率分布中的同种场景类型的运 算后概率值进行相加; 汇总计算后得到的所有场景类型的运算后概率值, 获得所述源视频数据 所属场景的合 计概率分布。 5.根据权利要求1所述的视频录制编码参数的调 整方法, 其特征在于, 所述判断视频编 码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频编码参数集合之 前包括: 构建不同场景类型的测试样本 视频集; 采用不同的编码器和编码参数对不同场景类型的所述测试样本 视频集进行编码测试; 根据编码后测试样本视频的数据大小和视频质量是否符合预设的要求确定每种场景 类型下的推荐编码器和推荐编码参数; 将每种场景类型及其对应的所述推荐编码器和所述推荐编码参数组合集合保存到视 频编码参数 数据库中。 6.根据权利要求5所述的视频录制编码参数的调 整方法, 其特征在于, 所述视频质量通 过计算编码后测试样本 视频图像的峰值信噪比和结构相似度来判定 。 7.根据权利要求1 ‑6任一项所述的视频录制编码参数的调整方法, 其特征在于, 所述判 断视频编码参数数据库中是否存在包括有包含所述源视频数据的所属场景的视频编码参 数集合之后还 包括: 若不存在, 继续以用户设置的编码器和编码参数对所述预设时长之后录制得到的后续 视频数据进行编码。 8.一种视频录制编码参数的调整装置, 其特征在于, 所述视频录制编码参数的调整装 置包括: 获取模块, 用于获取视频录制起始阶段 预设时长的源视频 数据; 第一概率分布计算模块, 用于利用预先训练好的场景分类模型对所述源视频数据中的 视频帧数据进行场景检测, 获得 所述源视频 数据所属场景的第一 概率分布; 第二概率分布计算模块, 用于利用预先训练好的语音识别模型和语义识别模型对所述 源视频数据中的音频帧数据进 行文本转换和语义识别, 获得所述源视频数据所属场景的第 二概率分布; 权重运算模块, 用于对所述第 一概率分布和所述第 二概率分布进行权重运算获得所述 源视频数据所属场景的合计概 率分布; 选择模块, 用于从所述合计概率分布中选出概率最大的场景类型作为所述源视频数据 的所属场景; 判断模块, 用于判断视频编码参数数据库中是否存在包括有包含所述源视频数据的所 属场景的视频编码参数集 合; 解析模块, 用于若存在, 则从所述视频编码参数集合中获得视频录制的推荐编码器和 推荐编码参数; 编码模块, 用于利用所述推荐编码器和所述推荐编码参数对所述预设时长之后录制得 到的后续视频 数据进行编码。 9.一种视频录制编码参数的调整设备, 其特征在于, 所述视频录制编码参数的调整设 备包括: 存储器和至少一个处理器, 所述存储器中存储有指 令, 所述存储器和所述至少一个权 利 要 求 书 2/3 页 3 CN 115190314 A 3

.PDF文档 专利 视频录制编码参数的调整方法及相关设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频录制编码参数的调整方法及相关设备 第 1 页 专利 视频录制编码参数的调整方法及相关设备 第 2 页 专利 视频录制编码参数的调整方法及相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。