说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111643213.2 (22)申请日 2021.12.2 9 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 任华 王铮 汪少敏 杨迪  马兆铭  (74)专利代理 机构 中国贸促会专利商标事务所 有限公司 1 1038 代理人 方亮 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01) (54)发明名称 关键信息识别方法、 装置以及存 储介质 (57)摘要 本公开提供了一种关键信息识别方法、 装置 以及存储介质, 其中的方法包括: 对于关键信息 设置对应的权重系数值以及权重系数阈值; 如果 至少一个权重系数值大于权重系数阈值, 则将与 大于权重系数阈值的权重系数值对应的关键信 息作为识别目标关键信息, 并根据识别目标关键 信息对待识别文本进行分类处理; 如果全部权重 系数值都小于或等于权重系数阈值, 则计算关键 信息之间的关联因子信息; 基于关联因子信息计 算与待识别文本相对的关联识别权重值, 根据关 联识别权重值对待识别文本进行分类处理。 本公 开的方法、 装置以及存储介质, 可 以通过累计相 关性提升关键信息识别效果, 提升识别的准确 率。 权利要求书3页 说明书7页 附图4页 CN 114297383 A 2022.04.08 CN 114297383 A 1.一种关键信息识别方法, 包括: 获取待识别文本中的关键信息, 确定与关键信息相对应的分类信息; 对于所述关键信息设置对应的权 重系数值以及权 重系数阈值; 如果至少一个权重系数值大于所述权重系数阈值, 则将与大于所述权重系数阈值的权 重系数值对应的关键信息作为识别目标关键信息, 并根据所述识别目标关键信息对所述待 识别文本进行分类处 理; 如果全部权重系数值都小于或等于所述权重系数阈值, 则计算所述关键信 息之间的关 联因子信息; 基于所述关联因子信 息计算与所述待识别文本相对的关联识别 权重值, 根据 所述关联 识别权重值对所述待识别文本进行分类处 理。 2.如权利要求1所述的方法, 所述计算所述关键信息之间的关联因子信息包括: 基于所述分类信息对 全部关键信息进行分组 处理, 生成至少一个关键信息组; 计算所述关键信息组中的各个组关键信息之间的关联因子 。 3.如权利要求2所述的方法, 所述计算所述关键信息组中的各个组关键信息之间的关 联因子包括: 基于识别样本计算所述组关联信息之间的置信度和支持度; 根据所述置信度和所述支持度确定所述关联因子 。 4.如权利要求2所述的方法, 所述基于所述关联因子信息计算与所述待识别文本相对 的关联识别权 重值包括: 将所述关键信息组中的各个组关键信息的权重系数值与对应的关联因子的乘积作为 关联权重值; 将所述关键信息组的全部关联权 重值之和, 作为所述关联识别权 重值。 5.如权利要求4所述的方法, 所述根据所述关联识别权重值对所述待识别文本进行分 类处理包括: 获取各个关键信息组的关联识别权 重值; 根据全部关联识别权重值中的最大关联识别权重值, 对所述待识别文本进行分类处 理。 6.如权利要求1所述的方法, 所述根据所述识别目标关键信息对所述待识别文本进行 分类处理包括: 如果所述识别目标关键信息的数量为1个, 则根据此识别目标关键信息对所述待识别 文本进行分类处 理。 7.如权利要求1所述的方法, 所述根据所述识别目标关键信息对所述待识别文本进行 分类处理包括: 如果所述识别目标关键信 息的数量为两个, 则根据较大的权重系数值对应的识别目标 关键信息对所述待识别文本进行分类处 理。 8.如权利要求1所述的方法, 所述根据所述识别目标关键信息对所述待识别文本进行 分类处理包括: 如果所述识别目标关键信 息的数量大于两个, 则基于分类信 息对全部目标关键信 息进 行分组处理;权 利 要 求 书 1/3 页 2 CN 114297383 A 2计算各个识别目标关键信息组中的全部识别目标关键信息的权 重系数值的平均值; 根据与最大平均值对应的识别目标关键信 息组的分类信 息, 对所述待识别文本进行分 类处理。 9.一种关键信息识别装置, 包括: 分类确定模块, 用于获取待识别文本中的关键信息, 确定与所述关键信息相对应的分 类信息; 权重确定模块, 用于对于所述关键信息设置对应的权 重系数值以及权 重系数阈值 第一识别处理模块, 用于如果至少一个权重系数值大于所述权重系数阈值, 则将与大 于所述权重系数阈值的权重系数值对应的关键信息作为识别目标关键信息, 并根据所述识 别目标关键信息对所述待识别文本进行分类处 理; 第二识别处理模块, 用于如果全部权重系数值都小于或等于所述权重系数阈值, 则计 算所述关键信息之 间的关联 因子信息; 基于所述关联 因子信息计算与所述待识别文本相对 的关联识别权 重值, 根据所述关联识别权 重值对所述待识别文本进行分类处 理。 10.如权利要求9所述的装置, 其中, 所述第二识别处 理模块, 包括: 关联因子计算单元, 用于基于所述分类信息对全部关键信息进行分组处理, 生成至少 一个关键信息组; 计算所述关键信息组中的各个组关键信息之间的关联因子 。 11.如权利要求10所述的装置, 其中, 所述关联因子计算单元, 用于基于识别样本计算所述组关联信 息之间的置信度和支持 度; 根据所述置信度和所述支持度确定所述关联因子 。 12.如权利要求10所述的装置, 其中, 所述第二识别处 理模块, 包括: 关联权重计算单元, 用于将所述关键信 息组中的各个组关键信 息的权重系数值与对应 的关联因子的乘积作为关联权重值; 将所述关键信息组的全部关联权重值之和, 作为所述 关联识别权 重值。 13.如权利要求12所述的装置, 其中, 所述第二识别处 理模块, 包括: 分类处理模块, 用于获取各个关键信息组的关联识别权重值; 根据全部关联识别权重 值中的最大关联识别权 重值, 对所述待识别文本进行分类处 理。 14.如权利要求9所述的装置, 其中, 所述第一识别处理模块, 用于如果所述识别目标关键信 息的数量为1个, 则根据此识别 目标关键信息对所述待识别文本进行分类处 理。 15.如权利要求9所述的装置, 其中, 所述第一识别处理模块, 用于如果所述识别目标关键信息的数量为两个, 则根据较大 的权重系数值对应的识别目标关键信息对所述待识别文本进行分类处 理。 16.如权利要求9所述的装置, 其中, 所述第一识别处理模块, 用于如果所述识别目标关键信息的数量大于两个, 则基于分 类信息对全部目标关键信息进 行分组处理; 计算各个识别目标关键信息组中的全部识别目 标关键信息的权重系数值的平均值; 根据与最大平均值对应的识别目标关键信息组的分类权 利 要 求 书 2/3 页 3 CN 114297383 A 3

.PDF文档 专利 关键信息识别方法、装置以及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 关键信息识别方法、装置以及存储介质 第 1 页 专利 关键信息识别方法、装置以及存储介质 第 2 页 专利 关键信息识别方法、装置以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。