说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210748762.4 (22)申请日 2022.06.29 (71)申请人 南京航空航天大 学 地址 210001 江苏省南京市秦淮区御道街 29号 (72)发明人 冷晟 钱浩 虞钧棚 叶文华  马万太 王聪 陈富星  (74)专利代理 机构 南京钟山专利代理有限公司 32252 专利代理师 牛婧 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/28(2019.01) G06F 16/901(2019.01) G06F 40/295(2020.01)G06Q 10/00(2012.01) G06Q 10/08(2012.01) G06Q 50/04(2012.01) (54)发明名称 一种基于产品制造过程多领域信息的知识 图谱构建方法 (57)摘要 本发明公开了一种基于产品制造过程多领 域信息的知识图谱构建方法, 包括: 根据机械产 品生产阶段的特点及kBOM特征信息建立原始资 料数据库; 结合专家知识及kBOM中的节点信息, 建立面向产品质量的各业务域的本体模型, 构建 产品各业务域对应的知 识图谱模式层; 提取原始 资料数据库中结构化和非结构化数据中与产品 质量相关的数据, 构建产品各业务域对应的知识 图谱数据层; 确定具体实体之间的关系, 得到由 实体与关系组成的三元组, 得到机械产品各业务 域对应的子图谱; 将子图谱进行整合得到面向产 品质量的多业务域下的知识图谱。 本发明构建的 知识图谱, 可帮助企业完成产品质量问题的多领 域溯因, 提高产品故障定位效率和故障归零能 力。 权利要求书3页 说明书6页 附图3页 CN 115062164 A 2022.09.16 CN 115062164 A 1.一种基于产品制造过程多领域信息的知识图谱构建方法, 其特征在于, 包括如下步 骤: 步骤一: 根据机械产品制造生产 各阶段的特点以及产品结构清单kBOM特征信息来获取 制造企业Data  lake中相关的数据, 建立原 始资料数据库; 步骤二: 根据机械产品全生命周期涉及的各业务域的专家知识以及kBOM中的节点信 息, 建立面向产品质量的各业务域的本体模型, 从而构建产品各业务域对应的知识图谱模 式层; 步骤三: 根据各业务域对应的知识图谱模式层, 提取原始资料数据库中结构化和非结 构化数据中与产品质量相关的数据, 构建产品各业 务域对应的知识图谱数据层; 步骤四: 根据 结构化和非结构化数据的提取与质量相关数据方法的特点以及各业务域 对应的知识图谱模式层, 确定具体实体之间的关系, 得到由实体与关系组成的三元组, 再将 三元组存 储到图数据库中, 得到 机械产品各业 务域对应的子图谱; 步骤五: 对各个业务域的子 图谱进行整合, 得到面向产品质量的多业务域下的知识图 谱。 2.根据权利要求1所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于, 所述原始资料数据库的数据资料包括: 企业数据库文件、 规范性手册、 设计说明书、 故障 维修手册、 工艺文件、 工艺手册。 3.根据权利要求1所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 所述产品结构清单kBOM的获取 过程具体为: (a)获取机 械产品制造生产各阶段对应的物料清单BOM; (b)分析各阶段的物料清单BOM, 在制造物料清单MBOM中将制造物料清单MBOM未包含的 零部件信息进行补全; (c)人工对比产品工艺、 制造生产各阶段的多种物料清单BOM, 对制造物料清单MBOM中 的工艺合件、 虚拟件进行 人工识别、 标注。 4.根据权利要求1所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤二包括如下子步骤: 步骤21: 结合专家知识与机械产品全生命周期特征, 将机械产品业务域分为设计领域、 工艺领域、 制造领域、 装配领域、 维保领域五个部分; 步骤22: 结合产品各业务域特征、 专家知识以及kBOM节点信息, 归纳整理出各业务域多 元数据, 构建各业 务域的本体模型, 所述本体模型包括实体 类与关系; 步骤23: 根据 步骤22构建的各业务域的实体类与关系, 使用Prot égé软件建立和展示各 业务域的本体模型; 步骤24: 基于 机械产品各业 务域的本体模型, 确定其各业 务域对应的知识图谱 模式层。 5.根据权利要求4所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤22 中多元数据: 由设计领域数据、 工艺领域数据、 制造领域数据、 装配领域数据、 维 保领域数据组成; 所述设计领域数据包含尺寸精度要求数据、 表面要求数据、 配合要求数 据、 性能设计要求数据; 所述工艺领域数据包含工艺过程信息数据、 工艺质量要求数据、 适 用条件数据; 所述制造领域数据包含制造过程信息数据、 制造资源状态数据、 质检信息数 据; 所述装配领域数据包含装配过程信息数据、 装配资源信息数据、 装配质量信息数据、 质权 利 要 求 书 1/3 页 2 CN 115062164 A 2检与性能测试信息数据; 所述 维保领域数据包含故障对象数据、 故障现象数据、 故障原因数 据、 故障处 理数据。 6.根据权利要求4所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤22中的实体类包括: 零件类、 设备类、 装 备类、 工艺类、 制造类、 装配类、 维保类、 特征 类。 7.根据权利要求4所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤22中关系包括: 概念在语义中的上下位关系Part ‑of, 领域对象与类的关系 Instance ‑of, 领域某一概念是另一概念 的属性Attribute ‑to, 领域概念之间的所属关系 Affiliation‑to, 领域概念之间的因果关系Cause ‑to。 8.根据权利要求1所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤三包括如下子步骤: 步骤31: 对原始资料数据库中的资料根据业务域特征进行分类、 整理并人工筛除与产 品质量无关的原 始资料; 步骤32: 对于资料中的结构化数据, 采用D2R将关系型数据库中的数据通过关系映射, 转换为RDF三元组表达格式; 步骤33: 对于资料中的非结构化数据, 构建基于kBOM节点的面向不同业务域的数据字 典, 依据字典 中节点信息, 利用brat软件对非结构化文本进行实体标注, 并通过python程序 将标注完的文本数据转变成带分词标签BIO的数据集, 同时将数据集划分为训练集、 测试集 和验证集, 用于训练BiLSTM+CRF实体识别模型; 采用训练好的BiLSTM+CRF实体识别模型抽 取非结构化数据中的实体。 9.根据权利要求1所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤四包括如下子步骤: 步骤41: 根据结构化数据抽取与质量相关数据的方法, 在抽取结构化数据中数据时, 被 抽取数据之 间的关系已按照关系数据库已存在的关系进行定义, 被抽取数据及其之 间的关 系以RDF三元组形式进行表达, 并以N ‑Triple格式存 储; 步骤42: 从非结构数据中抽取的实体之间的关系根据各业务域对应的模式层定义的实 体类之间的关系进行定义, 并通过python编程, 将实体、 关系以三元组形式<实体, 关系, 实 体>表达, 并存 储到csv格式文件中; 步骤43: csv格式文件和N ‑Triple格式文件分别按照不 同的命令语句将三元组导入到 Neo4j图数据库中, 得到各业 务域对应的子图谱。 10.根据权利要求1所述基于产品制造过程多领域信息的知识图谱构建方法, 其特征在 于: 步骤五包括如下子步骤: 步骤51: 将各业 务域对应的子图谱分别映射到低维空间, 得到对应的知识 表示; 步骤52: 基于步骤51的知识表示, 根据人工标注的实体对齐标注数据集, 获得实体对间 的对应关系; 步骤53: 遍历子图谱中每一个实体, 与另一个待对齐子图谱中实体构成实体对; 步骤54: 按照双线性匹配算法对实体对打分, 将打分结果升序排列, 统一分值最低的实 体对中两实体的名称, 从而实现各业 务域的三元组中实体名称的统一, 完成实体对齐; 步骤55: 各业务域对应的子图谱完成实体对齐后, 若出现实体属性丢失, 根据 各业务域权 利 要 求 书 2/3 页 3 CN 115062164 A 3

.PDF文档 专利 一种基于产品制造过程多领域信息的知识图谱构建方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于产品制造过程多领域信息的知识图谱构建方法 第 1 页 专利 一种基于产品制造过程多领域信息的知识图谱构建方法 第 2 页 专利 一种基于产品制造过程多领域信息的知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。