说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210337196.8 (22)申请日 2022.03.31 (71)申请人 慧之安信息技 术股份有限公司 地址 100000 北京市海淀区昆明湖南路51 号A座二层217号 (72)发明人 兰雨晴 唐霆岳 余丹 邢智涣  王丹星 黄永琢  (74)专利代理 机构 北京广技专利代理事务所 (特殊普通 合伙) 11842 专利代理师 张国香 (51)Int.Cl. H04N 21/8549(2011.01) H04N 21/84(2011.01) H04N 5/232(2006.01) H04N 5/247(2006.01)H04N 5/265(2006.01) (54)发明名称 基于深度学习的自动化视频摘要生成方法 (57)摘要 本发明提供了基于深度学习的自动化视频 摘要生成方法, 其对同一环境场合的不同方位区 域进行同步拍摄, 得到若干环境场合子视频; 对 环境场合子视频进行识别处理, 得到关于环境场 合子视频出现的不同对象 的语义标签, 继而在环 境场合子视频的预设画面中形成视频内容摘要; 最后按照每个环境场合子视频的拍摄方位, 将所 有环境场合子视频进行画面拼接, 从而得到相应 的环境全景场合视频, 这样可对不同摄像头拍摄 的环境场合子视频进行同步识别分析, 对环境场 合子视频中的对象进行标定, 并生成相匹配的视 频内容摘要, 从而对视频进行全面和准确的筛选 识别, 提高对视频识别处理的自动化和 智能化程 度。 权利要求书3页 说明书7页 附图1页 CN 114710713 A 2022.07.05 CN 114710713 A 1.基于深度学习的自动化视频摘要生成方法, 其特 征在于, 其包括如下步骤: 步骤S1, 通过若干摄像头分别对 同一环境场合的不同方位区域进行同步拍摄, 从而采 集得到若干环境场合子视频; 根据所述环境场合子视频的拍摄方位, 将所有环境场合子视 频分组保存至区块链中; 步骤S2, 根据来自视频处理终端的视频获取请求, 从所述区块链中提取相应的环境场 合子视频, 并传送到所述视频 处理终端; 再对所述环境场合子视频进 行识别处理, 从而得到 关于所述环境场合子 视频出现的不同对象的语义标签; 步骤S3, 根据所述语义标签, 在所述环境场合子视频的预设画面中形成视频内容摘要; 再对所述环境场合子 视频进行 数据压缩处 理; 步骤S4, 按照 每个环境场合子视频的拍摄方位, 将所有环境场 合子视频进行画面拼接, 从而得到相应的环境全景场合视频。 2.如权利要求1所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于: 在所述步骤S1中, 通过若干摄像头分别对同一环境场合的不同方位区域进行同步拍 摄, 从而采集得到若干环境场合子 视频具体包括: 将若干摄像头的摄像方向分别对准同一环境场 合沿周向方向的不同方位 区域, 同时调 整每个摄像头的拍摄视场角, 使得所有摄像头的整体拍摄视场角能够完全覆盖所述环境场 合的整体周向方位区域; 再指示所有摄 像头以相同焦距进行同步拍摄, 从而采集得到若干环境场合子 视频。 3.如权利要求2所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于: 在所述步骤S1中, 根据所述环境场合子视频的拍摄方位, 将所有环境场合子视频分组 保存至区块链中具体包括: 获取每个摄像头的拍摄方位信 息, 将所述拍摄方位信 息作为视频索引 信息添加至相应 的环境场合子 视频中; 再将所有环境场合子 视频分组保存至区块链中。 4.如权利要求3所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于: 在所述步骤S2中, 根据来自视频处理终端的视频获取请求, 从所述区块链中提取相应 的环境场合子 视频, 并传送到所述视频处 理终端具体包括: 从来自视频处理终端的视频获取请求中提取相应的视频拍摄时间范围条件, 再从所述 区块链中提取得到与所述视频拍摄时间范围相匹配的环境场合子视频; 再提取得到的所有 环境场合子 视频同步传送到所述视频处 理终端。 5.如权利要求 4所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于: 在所述步骤S2中, 对所述环境场合子视频进行识别处理, 从而得到关于所述环境场合 子视频出现的不同对象的语义标签具体包括: 按照所述环境场 合子视频的视频流 时间轴顺序, 将所述环境场 合子视频分解为若干环 境场合图片帧; 对每个环境场 合图片帧进行识别处理, 从而得到所述环境场 合图片帧初选的不同对象 的身份属性信息和动作属性信息; 根据所述身份属性信 息和所述动作属性信 息, 生成关于所述对象的身份属性语义标签 和动作属性语义标签。 6.如权利要求5所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于:权 利 要 求 书 1/3 页 2 CN 114710713 A 2在所述步骤S3中, 根据所述语义标签, 在所述环境场合子视频的预设画面中形成视频 内容摘要具体包括: 根据所述身份属性语义标签和所述动作属性语义标签, 生成关于所述对象的身份状态 和动作状态的文字摘要; 在所述对象出现的环境场 合图片帧中选定预定的摘要添加 画面区域, 其中所述摘要添 加画面区域与所述对象在所述环境场合图片帧中的出现画面区域 不重叠; 将所述文字摘要添加到所述摘要添加 画面区域后, 将所述文字摘要进行自字体放大显 示。 7.如权利要求6所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于: 在所述步骤S3中, 对所述环境场合子 视频进行 数据压缩处 理具体包括: 按照所述环境场 合子视频的视频流 时间轴顺序, 将所有环境场 合图片帧依次重新组合 后得到环境场合子 视频, 再对所述环境场合子 视频进行保真压缩处 理。 8.如权利要求7 所述的基于深度学习的自动化视频摘要生成方法, 其特 征在于: 在所述步骤S3中, 对所述环境场合子 视频进行保真压缩处 理具体包括: 步骤S301, 利用下面公式(1), 根据所述环境场合子视频筛选出所述视频的保真压缩像 素值, 在上述公式(1)中, l表示所述环境场合子视频的保真压缩像素值; La(i,j)表示所述环 境场合子视频第a帧图像的第i行第 j列像素点的像素值; m表示所述环境场合子视频的每一 帧图像的每一行像素点个数; n表示所述环境场合子视频 的每一帧图像的每一列像素点个 数; 表示将i的值从1取值到n, 将j的值从1取值到m得到括号内的最小值; G表 示所述环境场合子视频的总帧数; 表示将a的值从1取值到G得到括号内的最小 值; ; 步骤S302, 利用下面公式(2), 根据所述保真压缩像素值对所述环境场合子视频进行保 真压缩处 理, 在上述公式(2)中, 表示对所述环境场合子视频进行保真压缩后的第a帧图像的像素 数据(数据为像素矩阵形式); 表示将i的值从1取值到n, 将j的值从1取值到m代入 到括号内进行 所有计算; 步骤S303, 利用下面公式(3), 根据压缩后的所述环境场合子视频数据判断所述压缩是 否为有效压缩, 并控制压缩后的数据是否需要 进行还原, 在上述公式(3)中, Y表示数据的还原控制值; H()表示 求取括号内数据的数据量; 若Y=1, 表示进行保真压缩后的所述环境场合子 视频需要 进行还原;权 利 要 求 书 2/3 页 3 CN 114710713 A 3

.PDF文档 专利 基于深度学习的自动化视频摘要生成方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度学习的自动化视频摘要生成方法 第 1 页 专利 基于深度学习的自动化视频摘要生成方法 第 2 页 专利 基于深度学习的自动化视频摘要生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:22:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。