说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210571038.9 (22)申请日 2022.05.24 (71)申请人 山东理工大 学 地址 255086 山东省淄博市高新 技术产业 开发区高创园A座313室 (72)发明人 邢林林 让冉 张龙波 蔡红珍  张婷婷 李洋 苏展鹏  (74)专利代理 机构 淄博市众朗知识产权代理事 务所(特殊普通 合伙) 37316 专利代理师 程强强 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06F 16/951(2019.01) G06F 16/215(2019.01)G06F 16/906(2019.01) G06F 16/35(2019.01) G06F 16/904(2019.01) (54)发明名称 基于语义分析的检验检测服 务方法 (57)摘要 基于语义分析的检验检测服务方法, 属于检 验检测技术领域。 S1收集网络中与检验检测领域 相关的新闻文本及网络数据, 并储存在构建的检 验检测数据库中; S2将获得的检验检测领域相关 的新闻文本及网络数据进行清洗处理, 获得模型 训练所需要的数据信息; S3通过模型训练并实现 检验检测领域语句中实体的识别功能, 利用模型 为用户所查询内容进行服务推荐; S4利用训练好 的模型进行数据预测, 并将预测数据存储至检验 检测数据库; S5根据用户想获取的数据关系信 息, 将数据结果返回至可视化平台。 本基于语义 分析的检验检测服务方法通过数据采集层, 本发 明进行定期采集更新数据, 扩充检验检测资源 库, 保证检索更加全面、 准确。 权利要求书1页 说明书6页 CN 114925697 A 2022.08.19 CN 114925697 A 1.基于语义分析的检验检测服 务方法, 其特 征在于: 包括如下步骤: S1爬取收集网络 中与检验检测领域相关的新闻文本及网络数据, 并储存在构建的检验 检测数据库中; S2将获得的检验检测领域相关的新闻文本及网络数据进行清洗处理, 删除重复、 缺失、 错误数据, 获得模型训练所需要的数据信息, 并将其数据构造成符合模型训练输入的格式; S3将检验检测领域的数据信息进行建模, 通过模型训练并实现检验检测领域语句中实 体的识别功能, 将识别的实体通过前期训练的关系抽取模型进行关系 预测, 利用模型为用 户所查询内容进行服 务推荐; S4利用训练好的模型进行数据预测, 并将预测数据存储至检验检测数据库, 为进下一 步模型提供输入数据; S5根据用户想获取的数据关系信息, 以及通过训练得到的模型, 将数据结果返回至可 视化平台, 为用户提供查询结果。 2.根据权利要求1所述的基于语义分析的检验检测服务方法, 其特征在于: 所述方法还 包括, 利用数据收集获得企业合作新闻文本数据, 从该文本数据中标注提取企业实体信息, 将获得的数据进行数据 清理, 删除缺 失值数据、 重复值数据以得到高质量数据, 并存入检验 检测数据库。 3.根据权利要求2所述的基于语义分析的检验检测服务方法, 其特征在于: 所述的企业 实体信息包括组织机构、 组织标准、 组织设备以及企业之间的合作数据。 4.根据权利要求1或2所述的基于语义分析的检验检测服务方法, 其特征在于: 所述的 检验检测数据库包括company_info表存储检测机构属性信息、 company_info_2表存储检测 机构能力 信息、 true_data表包 含检测机构与被 检测机构交 互关系属性信息表。 5.根据权利要求1所述的基于语义分析的检验检测服务方法, 其特征在于: 所述的模型 包括检验检测领域命名实体识别模型、 基于BERT的新兴检验检测命名实体识别、 基于语义 信息的新兴检验检测服务关系抽取模型以及基于异构信息网络的检验检测服务推荐算法, 其中检验检测命名实体识别模型包括 NER‑BERT模型和NER ‑LM模型。 6.根据权利要求5所述的基于语义分析的检验检测服务方法, 其特征在于: 所述的检验 检测领域命名实体识别模型通过神经网络模型Bi ‑LSTM‑CRF捕获上下文的语义关系, 提升 命名实体识别效果。 7.根据权利要求1所述的基于语义分析的检验检测服务方法, 其特征在于: 所述的方法 还包括, 将新闻文本及网络数据进行实体识别和分类, 区分出用户输入查询信 息中的检验检测 机构实体或业 务实体; 根据提取出的检验检测机构实体或业务实体, 帮助用户进行精准搜索抽取模型进行关 系抽取, 识别其中存在的业 务关系, 以指导用户需求的精准匹配; 依托提取出的检验检测机构或者业务实体信息作为HIN模型的输入, 为用户匹配需求 查询结果。 8.根据权利要求1所述的基于语义分析的检验检测服务方法, 其特征在于: 所述方法还 包括, 构建检验检测服 务供需匹配可视化平台。权 利 要 求 书 1/1 页 2 CN 114925697 A 2基于语义分析的检验检测服务方 法 技术领域 [0001]基于语义分析的检验检测服 务方法, 属于检验检测技 术领域。 背景技术 [0002]检验检测作为高技术服务业、 生产性服务业、 科技服务业的重要业态, 具有覆盖范 围广、 技术含量高、 创新能力强、 发展潜力大、 辐射带动作用突出等特点, 是国家质量基础设 施的重要组成部 分, 在供给侧结构性改革、 优化产业结构、 产品质量提质增效等方面 发挥着 重要作用。 国家明确 提出要提升新兴产业检验检测能力, 要在一些重点领域支持一批技术 有特长、 服务有特色的专业化检验检测机构发展, 不断满足市场多样化、 个性化的需求。 但 从全国范围看, 检验、 检测、 认证、 校准服务对新材料、 新能源、 节能减排和环境保护等新兴 产业重点领域涉及的重要装备、 产品和关键零部件设计开发、 生产制造、 运维服务全过程 “一站式”支撑能力明显不足、 差距巨大。 主要表现在服务资源分散、 协同能力不足, 服务模 式混乱、 标准 规范缺失, 市场壁 垒较多、 集中度不高, 集成化、 整合能力低等方面。 [0003]随着移动互联网的发展, 互联所产生的数据也在爆发式地增长。 知识图谱为高效 的组织和管理互联网上海量、 异构、 动态的大数据提供了一种有效的方式。 首先检验检测作 为新兴领域, 缺乏检验检测领域专业、 全面的数据集, 导致无法构建该领域的知识图谱。 其 次想要构建检验检测领域的数据库, 数据来源广泛, 存在数据质量良莠不齐、 来自不同数据 源的知识重复、 知识间的关联不够明确等问题, 导 致构建过程中面临着很大的困难。 发明内容 [0004]本发明要解决的技术问题是: 克服现有技术的不足, 提供一种针对新兴产业检验 检测服务种类复杂、 用户检索词和检验检测专业术语存在较大差异, 检验检测服务匹配准 确度不高等问题, 参照已有的检验检测服务分类体系, 收集和整合新兴产业的全产业链、 全 生命周期的检验检测服 务资源库的基于语义分析的检验检测服 务方法。 [0005]本发明解决其技术问题所采用的技术方案是: 该基于语义分析的检验检测服务方 法, 其特征在于: 包括如下步骤: [0006]S1爬取收集网络中与检验检测领域相关的新闻文本及网络数据, 并储存在构建的 检验检测数据库中; [0007]S2将获得的检验检测领域相关的新闻文本及网络数据进行清洗处理, 删除重复、 缺失、 错误数据, 获得模型训练所需要的数据信息, 并将其数据构 造成符合模型训练输入的 格式; [0008]S3将检验检测领域的数据信息进行建模, 通过模型训练并实现检验检测领域语句 中实体的识别功能, 将识别的实体通过前期训练的关系抽取模型进行关系 预测, 利用模型 为用户所查询内容进行服 务推荐; [0009]S4利用训练好的模型进行数据预测, 并将预测数据存储至检验检测数据库, 为进 下一步模型提供输入数据;说 明 书 1/6 页 3 CN 114925697 A 3

.PDF文档 专利 基于语义分析的检验检测服务方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于语义分析的检验检测服务方法 第 1 页 专利 基于语义分析的检验检测服务方法 第 2 页 专利 基于语义分析的检验检测服务方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:16上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。