说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210666300.8 (22)申请日 2022.06.13 (71)申请人 重庆回形针信息技 术有限公司 地址 400020 重庆市江北区海尔路8 86号第 一幢3层 (72)发明人 龚量亮  (74)专利代理 机构 重庆强大凯创专利代理事务 所(普通合伙) 50217 专利代理师 黄书凯 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/194(2020.01) G06F 40/30(2020.01) (54)发明名称 一种内容 提取系统、 方法及存 储介质 (57)摘要 本发明涉及电子文档数据处理技术领域, 具 体涉及一种 内容提取系统、 方法及存储介质, 所 述系统包括服务器, 所述服务器包括: 存储模块: 用于存储故障经验数据库和通过故障经验数据 库训练好的语义分析模型, 数据收集模块: 用于 获取待处理的会议内容记录数据; 数据处理模 块: 用于通过语义分析模型进行逐句语义分析, 并根据语义分析的结果对会议内容记录数据的 每个句段标注对应的标签, 得到标注文本信息; 内容提取模块: 用于根据标签对 标注文本信息进 行内容提取, 并输入到预设模板中整理为失效模 式文本信息, 并与会议内容记录数据关联存储到 存储模块。 本发 明可以降低在问题实际处理的记 录、 整理过程中所要花费大量的人力成本和时间 成本。 权利要求书2页 说明书6页 附图1页 CN 115048481 A 2022.09.13 CN 115048481 A 1.一种内容 提取系统, 其特 征在于: 包括 服务器, 所述 服务器包括: 存储模块: 用于存储故障经验数据库和通过故障经验数据库训练好的语义分析模型, 所述故障经验数据库包括关联存储的失效模式文本信息和会议内容记录数据, 所述 失效模 式文本信息包括失效模式现象、 失效模式原因和解决措施; 数据收集模块: 用于获取待处 理的会议内容记录数据; 数据处理模块: 用于通过语义分析模型对待处理 的会议内容记录数据进行逐句语义分 析, 并根据语义分析 的结果对会议内容记录数据的每个句段标注对应的标签, 得到标注文 本信息, 所述标签包括失效模式现象、 失效模式原因和解决措施; 内容提取模块: 用于根据标签对标注文本信息进行内容提取, 并输入到预设模板中整 理为失效模式文本信息, 还用于将失效模式文本信息和会议内容记录数据关联存储到存储 模块。 2.根据权利要求1所述的一种内容 提取系统, 其特 征在于: 所述 服务器还包括: 数据预处理模块: 用于对会议内容记录数据进行数据清洗, 所述数据清洗包括表情包 删除、 短句合并。 3.根据权利要求1所述的一种内容提取系统, 其特征在于: 所述数据处理模块还包括以 下子模块: 高频词处理子模块: 用于对会议内容记录数据中的关键词进行统计分析得到高频词, 并使用不同颜色对各高频词进行高亮标注; 高频词索引子模块: 用于通过高频词以及映射的语义信 息在故障经验数据库中查找相 匹配的失效模式文本信息, 得到索引信息, 并将索引信息与对应高频词相关联。 4.根据权利要求3所述的一种内容提取系统, 其特征在于: 还包括审核终端, 所述审核 终端与服 务器通信连接, 所述 服务器还包括: 相似度计算模块: 用于将通过内容提取模块得到的失效模式文本信 息与故障经验数据 库存储的失效模式文本信息进行相似度计算; 审核模块: 用于在相似度达到预设的相似度阈值时, 将通过内容提取模块得到的失效 模式文本信息发送至审核终端 进行审核, 若审核通过则存 储到存储模块中。 5.一种内容 提取方法, 其特 征在于, 包括以下步骤: 存储步骤: 在存储模块中存储故障经验数据库和通过故障经验数据库训练好的语义分 析模型, 所述故障经验数据库包括关联存储的失效模式文本信息和会议内容记录数据, 所 述失效模式文本信息包括失效模式现象、 失效模式原因和解决措施; 数据收集 步骤: 获取待处 理的会议内容记录数据; 数据处理模块: 通过语义分析模型对待处理的会议内容记录数据进行逐句语义分析, 并根据语义分析的结果对会议内容记录数据的每个句段标注对应的标签, 得到标注文本信 息, 所述标签包括失效模式现象、 失效模式原因和解决措施; 内容提取步骤: 根据标签对标注文本信息进行内容提取, 并输入到预设模板中整理为 失效模式文本信息, 再将失效模式文本信息和会议内容记录数据关联存 储到存储模块。 6.根据权利要求5所述的一种内容 提取方法, 其特 征在于, 还 包括以下步骤: 数据预处理步骤: 对会议内容记录数据进行数据清洗, 所述数据清洗包括表情包删除、 短句合并。权 利 要 求 书 1/2 页 2 CN 115048481 A 27.根据权利要求5所述的一种内容提取方法, 其特征在于: 所述数据处理步骤还包括以 下子步骤: 高频词处理子步骤: 对会议内容记录数据中的关键词进行统计分析得到高频词, 并使 用不同颜色对各高频词进行高亮标注; 高频词索引子步骤: 通过高频词以及映射的语义信 息在故障经验数据库中查找相匹配 的失效模式文本信息, 得到索引信息, 并将索引信息与对应高频词相关联。 8.根据权利要求7 所述的一种内容 提取方法, 其特 征在于: 还 包括以下步骤: 相似度计算步骤: 将通过内容提取步骤得到的失效模式文本信 息与故障经验数据库存 储的失效模式文本信息进行相似度计算; 审核步骤: 在相似度达到预设的相似度阈值时, 将通过内容提取步骤得到的失效模式 文本信息发送至审核终端 进行审核, 若审核通过则存 储到存储模块中。 9.一种计算机可读存储介质, 其特征在于: 所述计算机可读存储介质中包括内容提取 程序, 所述内容提取程序被处理器执行时, 实现如权利要求5至8 中任一项所述的一种内容 提取方法的步骤。权 利 要 求 书 2/2 页 3 CN 115048481 A 3

.PDF文档 专利 一种内容提取系统、方法及存储介质

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种内容提取系统、方法及存储介质 第 1 页 专利 一种内容提取系统、方法及存储介质 第 2 页 专利 一种内容提取系统、方法及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。