说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210604891.6 (22)申请日 2022.05.30 (71)申请人 新华智云科技有限公司 地址 310012 浙江省杭州市西湖区文一西 路460号文娱中心43 0室 (72)发明人 甘江威 方露露 杨丛聿  (74)专利代理 机构 杭州裕阳联合专利代理有限 公司 33289 专利代理师 杨琪宇 (51)Int.Cl. G06F 16/41(2019.01) G06F 16/483(2019.01) G06F 16/487(2019.01) G06F 16/36(2019.01) G06F 16/953(2019.01) (54)发明名称 一种基于AI算法的媒体文件多模检索方法 和系统 (57)摘要 本发明公开了一种基于AI算法的媒体文件 多模检索方法和系统, 所述方法包括: 对音视频 信息采用现有对应AI算法获取音视频中的文本 信息; 获取文本信息中的基础数据, 根据所述基 础数据构建一级标签; 根据所述一级标签构建一 阶索引, 并将所述一阶索引存储于关系型数据库 中; 通过所述AI算 法获取每一音视频的meta信息 和内容信息, 构建二级标签; 根据所述二级标签 构建二阶索引, 通过查询所述二阶索引对所述音 视频进行查询定位。 所述方法和系统利用ES搜索 引擎进行搜索加速, 并采用二阶索引+二阶搜索 的方式对搜索命中的记录进行精确定位和详细 解析, 从而可以大幅提高搜索命中准确率。 权利要求书1页 说明书5页 附图3页 CN 115017339 A 2022.09.06 CN 115017339 A 1.一种基于AI 算法的媒体文件多模检索方法, 其特 征在于, 所述方法包括: 对音视频信息采用现有对应AI 算法获取音视频中的标签信息; 获取音视频信息中的基础数据和mate信息, 根据所述基础数据和mate信息构 建一级标 签; 根据所述 一级标签构建一阶索引, 并将所述 一阶索引存 储于非关系型 数据库中; 通过所述AI算法识别每一音视频内容信息, 并提取 所述标签信息构建二级标签; 根据所述二级标签构建二阶索引, 通过查询所述二阶索引对所述音视频进行查询定 位。 2.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 所述 方法包括通过AI算法获取包括音视频数据中的标签ID, 并获取文件自身的文件ID, 并将所 述文件ID和标签ID构建联合索引, 并将所述文件ID和标签ID构建联合索引以及标签ID作为 唯一索引存 储于非关系型 数据库中。 3.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 所述 方法还包括: 将通过所述A I算法获取的标签信息后, 根据标签信息的类型进 行分区, 获取每 一分区标签的文件ID和标签ID作为对应分区的联合索引。 4.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 所述 一阶索引包括文件的基础信息和文件meta信息, 所述二阶索引包括音视频内容信息, 其中 所述音视频内容信息包括: 机构、 地点、 人物和场景, 将所述基础信息中的文件ID和标签ID 和对应的文件内容信息组装成结构化索引。 5.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 所述 方法包括: 通过关键词 查找并命中一阶索引中的文件ID和标签ID, 并根据所述文件ID和标 签ID获取二阶索引中的内容信息, 并根据所述内容信息对文件进行全量索引查询, 获取最 终查询到的文件。 6.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 所述 一阶索引的构建方法包括: 利用ASR算法和OCR算法识别对应音视频信息中的文本信息, 并 对识别的文本信息中的基础数据和meta数据进 行分词处理, 得到用于构建一阶索引的关键 词标签信息 。 7.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 所述 一阶索引构建方法包括: 利用NLP和视频标签构建知识图谱, 并将所述知识图谱作为一阶索 引结构, 去除一阶段索引中的时间信息 。 8.根据权利要求1所述的一种基于AI算法的媒体文件多模检索方法, 其特征在于, 根据 所述标签类型进行分区的方法包括: 根据不同的文件类型生成对应的分区关键词, 所述分 区关键词将对应文档中识别的基础信息、 meta信息和内容信息进行分区存 储。 9.一种基于AI算法的媒体文件多模检索系统, 其特征在于, 所述系统执行权利要求1 ‑8 中任意一项所述的一种基于AI 算法的媒体文件多模检索方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序可被处理器执行权利要求1 ‑8中任意一项所述一种AI算法的媒体文件 多模检索方法。权 利 要 求 书 1/1 页 2 CN 115017339 A 2一种基于AI算法的媒体文件多模检索方 法和系统 技术领域 [0001]本发明涉及媒体文件检索方法和系统, 特别涉及一种基于AI算法的媒体文件多模 检索方法和系统 背景技术 [0002]现有检索方法和系统通常采用基于ES搜索引擎, 只能够对于文本(一般理解是标 题, 说明等文字性内容; 网页也是文字性内容)支持模糊搜索, 关键词搜索, 按时间、 相关度 等排序能力, 其中上述检索方法和系统存在的技术问题包括: 1、 只能对简单 的文字信息搜 索; 但对于 现在的图片(照 片), 视频媒体为主的社 交, 娱乐平台, 却无法对图片, 视频等媒资 内容进行搜索; 2、 目前的平台的搜索能力, 也无法提供对于长时间视频、 长时间音频的片段 命中详情。 发明内容 [0003]本发明其中一个发明目的在于提供一种基于AI算法的媒体文件多模检索方法和 系统, 所述方法和系统以现有的A I算法为基础, 对媒体音视频文件进 行多维度分析, 并使用 异构数据库对 全维度信息进行持久化, 从而可以提高对媒体文件的检索维度和能力。 [0004]本发明另一个发明目的在于提供一种基于AI算法的媒体文件多模检索方法和系 统, 所述方法和系统利用ES 搜索引擎进 行搜索加速, 并采用二阶索引+二阶搜索的方式对搜 索命中的记录进行精确定位和详细解析, 从而可以大幅提高搜索命中准确率。 [0005]本发明另一个发明目的在于提供一种基于AI算法的媒体文件多模检索方法和系 统, 所述方法和系统利用二阶索引的方式, 利用现有A I算法构建视频不同片段的标签组, 或 构建图片的标签组, 通过二阶索引将可以准确定位到 视频的具体片段和图片位置 。 [0006]为了实现至少一个上述发明 目的, 本发明进一步提供一种基于AI算法的媒体文件 多模检索方法, 所述方法包括: [0007]对音视频信息采用现有对应AI 算法获取音视频中的标签信息; [0008]获取音视频信息中的基础数据和mat e信息, 根据所述基础数据和mat e信息构建一 级标签; [0009]根据所述 一级标签构建一阶索引, 并将所述 一阶索引存 储于非关系型 数据库中; [0010]通过所述AI算法识别每一音视频内容信息, 并提取 所述标签信息构建二级标签; [0011]根据所述二级标签构建二阶索引, 通过查询所述二阶索引对所述音视频进行查询 定位。 [0012]根据本发明其中一个较佳实施例, 所述方法包括通过AI算法获取包括音视频数据 中的文件ID和标签ID, 并将所述文件ID和标签ID构建联合索引, 并将所述文件ID和标签ID 构建联合索引以及标签ID作为唯一索引存 储于非关系型 数据库中。 [0013]根据本发明另一个较佳实施例, 所述方法还包括: 将通过所述AI算法获取的标签 后, 根据标签的类型进行分区, 获取每一分区标签的文件ID和标签ID作为对应分区的联合说 明 书 1/5 页 3 CN 115017339 A 3

.PDF文档 专利 一种基于AI算法的媒体文件多模检索方法和系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于AI算法的媒体文件多模检索方法和系统 第 1 页 专利 一种基于AI算法的媒体文件多模检索方法和系统 第 2 页 专利 一种基于AI算法的媒体文件多模检索方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。