说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210585289.2 (22)申请日 2022.05.27 (71)申请人 中国人民财产保险股份有限公司 地址 100022 北京市朝阳区建国门外大街2 号院2号楼 (72)发明人 赵伟 关海峰 潘兴安 孙杰平  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 刘敏 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/242(2020.01) G06F 40/30(2020.01) (54)发明名称 用户反馈数据的分析方法、 装置及计算机设 备 (57)摘要 本申请公开了一种用户反馈数据的分析方 法、 装置及计算机设备, 涉及自然语言 处理技术, 可解决用户反馈数据分析工作量大、 效率低, 不 能更深度挖掘的技术问题。 包括: 对样本反馈数 据进行预处理, 提取样本反馈数据的反馈关键 词; 基于反馈关键词确定样本 反馈数据的话题特 征以及情感特征; 将样本反馈数据作为输入特 征, 且将反馈关键词、 话题特征 以及情感特征中 的至少一种作为特征标签, 训练反馈数据分析模 型, 以使反馈数据分析模型满足预设训练标准; 获取目标用户的用户反馈数据, 并将用户反馈数 据输入训练完成的反馈数据分析模 型中, 得到用 户反馈数据的分析结果, 分析结果包括情感识别 结果、 话题识别结果以及关键词提取结果中的至 少一种。 权利要求书2页 说明书11页 附图4页 CN 115114916 A 2022.09.27 CN 115114916 A 1.一种用户反馈数据的分析 方法, 其特 征在于, 包括: 对样本反馈数据进行 预处理, 提取所述样本反馈数据的反馈关键词; 基于所述反馈关键词确定所述样本反馈数据的话题特 征以及情感特 征; 将所述样本反馈数据作为输入特征, 且将所述反馈关键词、 所述话题特征以及所述情 感特征中的至少一种作为特征标签, 训练反馈数据分析模型, 以使所述反馈数据分析模型 满足预设训练标准; 获取目标用户的用户反馈数据, 并将所述用户反馈数据输入训练完成的反馈数据分析 模型中, 得到所述用户反馈数据的分析结果, 所述分析结果包括情感识别结果、 话题识别结 果以及关键词提取 结果中的至少一种。 2.根据权利要求1所述的方法, 其特征在于, 所述对样本反馈数据进行预处理, 提取所 述样本反馈数据的反馈关键词, 包括: 利用预设分词工具对所述样本反馈数据进行分词处理, 得到包含至少一个第 一词语的 第一词序列; 根据所述第 一词语的目标词性确定与预设停用词性匹配的第 二词语, 以便从所述第 一 词序列中剔除所述第二词语, 得到第二词序列; 计算所述第二词序列中的任一第一词语与预设关键词词典中任一预设关键词的语义 相似度, 在所述第二词序列中提取对应所述语义相似度大于预设阈值的第一词语, 作为反 馈关键词。 3.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 基于TF‑IDF算法计算所述第二词序列中所述第一词语对应所述样本反馈数据的权重 值; 将所述权 重值大于预设权 重阈值的第一词语确定为所述样本反馈数据的反馈关键词; 判定所述反馈关键词是否存储于所述预设关键词词典中, 若否, 则将所述反馈关键词 更新至所述预设 关键词词典。 4.根据权利要求2所述的方法, 其特征在于, 所述基于所述反馈关键词确定所述样本反 馈数据的话题特 征以及情感特 征, 包括: 提取所述反馈关键词的第 一属性特征, 并计算所述第 一属性特征与 预设话题对应第 二 属性特征之间的第一特 征相似度; 将对应所述第一特征相似度大于第一预设相似度阈值的预设话题确定为所述反馈关 键词所属的目标话题, 根据所述目标话题生成所述样本反馈数据的话题特 征; 在所述反馈关键词和/或所述第 二词序列中提取所述样本反馈数据对应情 感的第三属 性特征, 计算所述第三属性特征与预设情感类别对应第四属性特征之间的第二特征相似 度; 将对应所述第二特征相似度大于第二预设相似度阈值的预设情感类别确定为所述样 本反馈数据所属的目标情感类别, 生成所述目标情感类别对应的情感特 征。 5.根据权利要求4所述的方法, 其特征在于, 所述提取所述反馈关键词的第一属性特 征, 并计算所述第一属性特 征与预设话题对应第二属性特 征之间的第一特 征相似度, 包括: 提取所述反馈关键词对应的多维数组, 其中, 所述多维数组中每一维度用于表示所述 反馈关键词的一个特 征属性;权 利 要 求 书 1/2 页 2 CN 115114916 A 2计算所述反馈关键词对应多维数组与预设话题对应多维数据之间的第 一特征相似度, 所述第一特 征相似度用于 评估所述反馈关键词与任一所述预设话题之间的特 征相关性。 6.根据权利要求4所述的方法, 其特征在于, 所述在所述反馈关键词和/或所述第二词 序列中提取 所述样本反馈数据对应情感的第三属性特 征, 包括: 在所述反馈关键词和/或所述第 二词序列中提取与预设情感词典中任一预设情感特征 词匹配的目标情感特 征词; 确定所述目标情感特征词在所述样本反馈数据中的字符位置, 基于所述字符位置向前 查找所述目标情感特 征词在所述样本反馈数据中的程度副词和/或否 定词; 若存在所述程度副词和/或否定词, 则按照所述程度副词和/或否定词对应的分值计算 规则计算所述目标情感特 征词的第一情感分值; 加和所有所述目标情感特征词的第 一情感分值, 得到所述样本反馈数据对应情感的第 三属性特 征。 7.根据权利要求1至6中任一项所述的方法, 其特征在于, 所述将所述样本反馈数据作 为输入特征, 且将所述反馈关键词、 所述话题特征以及所述情感特征中的至少一种作为特 征标签, 训练反馈数据分析模型, 以使所述反馈数据分析模型满足预设训练标准, 包括: 利用配置特征标签的样本反馈数据训练反馈数据分析模型, 其中, 所述特征标签包括 所述反馈关键词、 所述 话题特征以及所述情感特 征中的至少一种; 若确定所述反馈数据分析模型输出结果的正确率大于第 一预设阈值, 则判定所述反馈 数据分析模型符合预设训练标准; 若确定所述反馈数据分析模型输出结果的正确率小于或等于所述第 一预设阈值, 则利 用所述样本反馈数据重复训练所述反馈数据分析模型, 以使 所述反馈数据分析模型符合所 述预设训练标准。 8.一种用户反馈数据的分析装置, 其特 征在于, 包括: 提取模块, 用于对样本反馈数据进行 预处理, 提取所述样本反馈数据的反馈关键词; 第一确定模块, 用于基于所述反馈关键词确定所述样本反馈数据的话题特征以及情感 特征; 训练模块, 用于将所述样本反馈数据作为输入特征, 且将所述反馈关键词、 所述话题特 征以及所述情感特征中的至少一种作为特征标签, 训练反馈数据分析模型, 以使所述反馈 数据分析模型满足预设训练标准; 输入模块, 用于获取目标用户的用户反馈数据, 并将所述用户反馈数据输入训练完成 的反馈数据分析模型中, 得到所述用户反馈数据的分析结果, 所述分析结果包括情感识别 结果、 话题 识别结果以及关键词提取 结果中的至少一种。 9.一种存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理器执行 时实现权利要求1至7中任一项所述的用户反馈数据的分析 方法。 10.一种计算机设备, 包括存储介质、 处理器及存储在存储介质上并可在处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一 项所述的用户反馈数据的分析 方法。权 利 要 求 书 2/2 页 3 CN 115114916 A 3

.PDF文档 专利 用户反馈数据的分析方法、装置及计算机设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户反馈数据的分析方法、装置及计算机设备 第 1 页 专利 用户反馈数据的分析方法、装置及计算机设备 第 2 页 专利 用户反馈数据的分析方法、装置及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。