专利基于词向量语义分析的执法视频评价方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210845701.X (22)申请日 2022.07.19 (71)申请人杭州天翼智慧城市科技有限公司地址 311121 浙江省杭州市余杭区仓前街道绿汀路1号1幢3 39室 (72)发明人单培红　卢会春　任敏杰　陈建军　 (74)专利代理机构北京润平知识产权代理有限公司 11283 专利代理师郑磊 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/216(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 10/06(2012.01) G06Q 50/26(2012.01) G10L 15/26(2006.01) (54)发明名称基于词向量语义分析的执法视频评价方法及装置 (57)摘要本发明实施例提供一种基于词向量语义分析的执法视频评价方法及装置，属于视频数据处理领域。所述方法包括：对获取的视频数据中的音频信息进行提取、转化，得到音频文本；根据构建的特征词库对音频文本进行特征词识别分类，得到异常音频文本，并对异常音频文本进行处理；将处理后的异常音频文本输入至训练好的短文本分类器中进行短文本识别分类，得到非规范音频文本；构建由多个非规范音频文本构成的异常文本集合。基于特征词库在进行语义分析，能提高分析结果的准确性，降低了分类的复杂度。本发明在词粒度和语句粒度上分别对音频文本进行语义分析，提高了识别的准确度和可靠性。权利要求书2页说明书6页附图5页 CN 115238707 A 2022.10.25 CN 115238707 A 1.一种基于词向量语义分析的执法视频评价方法，其特征在于，所述方法包括：对获取的视频数据中的音频信息进行提取、转化，得到音频文本；根据构建的特征词库对音频文本进行特征词识别分类，得到异常音频文本，并对异常音频文本进行处理；将处理后的异常音频文本输入至训练好的短文本分类器中进行短文本识别分类，得到非规范音频文本；构建由多个非规范音频文本构成的异常文本集合。 2.根据权利要求1所述的方法，其特征在于，对音频文本进行特征词识别分类，包括：对音频文本进行预处理，得到特征文本，所述预处理包括分语句处理和分词处理；根据特征词库统计特征文本中的有效词数量、正面特征词数量和负面特征词数量，所述特征词库包括正面词库和负面词库；根据有效词数量、正面特征词数量和负面特征词数量计算出音频文本的异常度量值；判断异常度量值是否超过设定的词阈值，若超过，则确定该音频文本为异常音频文本。 3.根据权利要求1所述的方法，其特征在于，对异常音频文本进行处理，包括：构建由多个异常音频文本构成的异常候选集。 4.根据权利要求2所述的方法，其特征在于，该方法还包括：进行短文本分类器训练，包括：获取来自不同音频文本中的多个语句；对获取的语句进行标注和分类，得到具有分类标签的标签语句，所述标签语句的分类标签包括正面标签和负面标签；基于Word2Vec模型将标签语句转换为具有序列的特征向量作为训练样本；构建基于卷积神经网络的短文本分类器；利用所述训练样本对短文本分类器进行训练，得到训练好的短文本分类器。 5.根据权利要求4所述的方法，其特征在于，将异常音频文本输入至训练好的短文本分类器中进行短文本识别分类，得到非规范音频文本，包括：将异常文本候选集中的音频文本进行语句处理，构建句子集合Si＝{s1， s2...sn}；将句子集合Si中的任意句子转化为词向量；将词向量输入至训练好的短文本分类器中预测该词向量对应的句子的分类标签；计算句子集合Si中分类标签为负面标签的句子数量；判断分类标签为负面标签的句子数量是否超过设定的句阈值，若超过，则确定该音频文本为非规范音频文本。 6.根据权利要求1所述的方法，其特征在于，所述方法还包括：利用异常文本集合中的非规范音频文本构建反馈数据集；将所述反馈数据集作为短文本分类器的迭代训练样本。 7.根据权利要求1所述的方法，其特征在于，所述方法还包括：对所述特征词库进行更新处理，所述更新处理包括动态添加和删除。 8.一种基于词向量语义分析的执法视频评价装置，用于实现权利要求1 ‑7中任一项所述的基于词向量语义分析的执法视频评价方法，其特征在于，所述装置包括：处理模块，对获取的视频数据中的音频信息进行提取、转化，得到音频文本；权　利　要　求　书 1/2 页 2 CN 115238707 A 2特征词识别分类模块，用于根据构建的特征词库对音频文本进行特征词识别分类，得到异常音频文本，并对异常音频文本进行处理；短文本识别分类模块，用于将处理后的异常音频文本输入至训练好的短文本分类器中进行短文本识别分类，得到非规范音频文本；异常文本集合构建模块，用于构建由多个非规范音频文本构成的异常文本集合。 9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求 1‑7中任一项所述的基于词向量语义分析的执法视频评价方法。 10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1 ‑7中任一项所述的基于词向量语义分析的执法视频评价方法。权　利　要　求　书 2/2 页 3 CN 115238707 A 3

专利 基于词向量语义分析的执法视频评价方法及装置

专利基于词向量语义分析的执法视频评价方法及装置