说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210845701.X (22)申请日 2022.07.19 (71)申请人 杭州天翼智慧城市科技有限公司 地址 311121 浙江省杭州市余杭区仓前街 道绿汀路1号1幢3 39室 (72)发明人 单培红 卢会春 任敏杰 陈建军  (74)专利代理 机构 北京润平知识产权代理有限 公司 11283 专利代理师 郑磊 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/216(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 10/06(2012.01) G06Q 50/26(2012.01) G10L 15/26(2006.01) (54)发明名称 基于词向量语义分析的执法视频评价方法 及装置 (57)摘要 本发明实施例提供一种基于词向量语义分 析的执法视频评价方法及装置, 属于视频数据处 理领域。 所述方法包括: 对获取的视频数据中的 音频信息进行提取、 转化, 得到音频文本; 根据构 建的特征词库对音频文本进行特征词识别分类, 得到异常音频文本, 并对异常音频文本进行处 理; 将处理后的异常音 频文本输入至训练好的短 文本分类器中进行短文本识别分类, 得到非规范 音频文本; 构建由多个非规范音频文本构成的异 常文本集合。 基于特征词库在进行语义分析, 能 提高分析结果的准确性, 降低了分类的复杂度。 本发明在词粒度和语句粒度上分别对音频文本 进行语义分析, 提高了识别的准确度和可靠性。 权利要求书2页 说明书6页 附图5页 CN 115238707 A 2022.10.25 CN 115238707 A 1.一种基于词向量语义分析的执法视频评价方法, 其特 征在于, 所述方法包括: 对获取的视频 数据中的音频信息进行提取、 转 化, 得到音频文本; 根据构建的特征词库对音频文本进行特征词识别分类, 得到异常音频文本, 并对异常 音频文本进行处 理; 将处理后的异常音频文本输入至训练好的短文本分类器中进行短文本识别分类, 得到 非规范音频文本; 构建由多个非规范音频文本构成的异常文本集 合。 2.根据权利要求1所述的方法, 其特 征在于, 对音频文本进行 特征词识别分类, 包括: 对音频文本进行 预处理, 得到特 征文本, 所述预处 理包括分语句处 理和分词处 理; 根据特征词库统计特征文本中的有效词数量、 正面特征词数量和负面特征词数量, 所 述特征词库包括 正面词库和负面词库; 根据有效词数量、 正 面特征词数量和负面特 征词数量计算出音频文本的异常度量 值; 判断异常度量 值是否超过设定的词阈值, 若超过, 则确定该音频文本为异常音频文本 。 3.根据权利要求1所述的方法, 其特征在于, 对异常音频文本进行处理, 包括: 构建由多 个异常音频文本构成的异常候选集。 4.根据权利要求2所述的方法, 其特征在于, 该方法还包括: 进行短文本分类器训练, 包 括: 获取来自不同音频文本中的多个 语句; 对获取的语句进行标注和分类, 得到具有分类标签的标签语句, 所述标签语句的分类 标签包括 正面标签和负面标签; 基于Word2Vec模型将标签 语句转换为具有序列的特 征向量作为训练样本; 构建基于卷积神经网络的短文本分类 器; 利用所述训练样本对短文本分类 器进行训练, 得到训练好的短文本分类 器。 5.根据权利要求4所述的方法, 其特征在于, 将异常音频文本输入至训练好的短文本分 类器中进行短文本识别分类, 得到非规范音频文本, 包括: 将异常文本候选集中的音频文本进行语句处 理, 构建句子集 合Si={s1, s2...sn}; 将句子集 合Si中的任意句子转 化为词向量; 将词向量输入至训练好的短文本分类 器中预测该词向量对应的句子的分类标签; 计算句子集 合Si中分类标签为负面标签的句子数量; 判断分类标签为负面标签的句子数量是否超过设定的句阈值, 若超过, 则确定该音频 文本为非规范音频文本 。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 利用异常文本集 合中的非规范音频文本构建反馈数据集; 将所述反馈数据集作为短文本分类 器的迭代训练样本 。 7.根据权利要求1所述的方法, 其特征在于, 所述方法还包括: 对所述特征词库进行更 新处理, 所述更新处 理包括动态添加 和删除。 8.一种基于词向量语义分析的执法视频评价装置, 用于实现权利要求1 ‑7中任一项所 述的基于词向量语义分析的执法视频评价方法, 其特 征在于, 所述装置包括: 处理模块, 对获取的视频 数据中的音频信息进行提取、 转 化, 得到音频文本;权 利 要 求 书 1/2 页 2 CN 115238707 A 2特征词识别分类模块, 用于根据构建的特征词库对音频文本进行特征词识别分类, 得 到异常音频文本, 并对异常音频文本进行处 理; 短文本识别分类模块, 用于将处理后的异常音频文本输入至训练好的短文本分类器中 进行短文本识别分类, 得到非规范音频文本; 异常文本集 合构建模块, 用于构建由多个非规范音频文本构成的异常文本集 合。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求 1‑7中任 一项所述的基于词向量语义分析的执法视频评价方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现权利要求1 ‑7中任一项所述的基于词向量语义分析的执法视频评价方法。权 利 要 求 书 2/2 页 3 CN 115238707 A 3

.PDF文档 专利 基于词向量语义分析的执法视频评价方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于词向量语义分析的执法视频评价方法及装置 第 1 页 专利 基于词向量语义分析的执法视频评价方法及装置 第 2 页 专利 基于词向量语义分析的执法视频评价方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。