(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111635262.1
(22)申请日 2021.12.2 9
(71)申请人 北京航空航天大 学
地址 100191 北京市海淀区学院路37号
(72)发明人 刘继红 魏旭航 舒俊铭 李林
(74)专利代理 机构 北京慧泉知识产权代理有限
公司 11232
代理人 王顺荣 唐爱华
(51)Int.Cl.
G06N 5/02(2006.01)
G06F 40/295(2020.01)
G06F 40/253(2020.01)
G06F 40/211(2020.01)
G06F 40/216(2020.01)
G06K 9/62(2022.01)G06F 16/36(2019.01)
G06F 16/2458(2019.01)
G06N 3/04(2006.01)
(54)发明名称
基于多源数据挖掘的复杂设计知识网络构
建方法
(57)摘要
本发明提出一种基于多源数据挖掘的复杂
设计知识网络构建方法, 首先考虑网络顶层模型
的设计, 针对制造企业内部和外部系统多源数据
一致性差、 可用性弱、 共享率低等问题, 使用依存
句法分析从多源 数据中抽取实体及关系, 构建出
知识网络顶层模 型。 在实现知识网络顶层节点与
设计知识匹配 之前, 需要对设计知识进行组织和
整理, 根据多域数据特点划分为不同设计知 识项
构建设计知识表示模型。 在此基础上, 将顶层模
型与设计知识进行链接匹配, 建立起一个领域内
的复杂设计知识网络。 本发明设计知识 “统一表
达‑高效组织 ‑规范化”体系, 利用多域数据对设
计过程提供启发和帮助, 为设计人员寻找设计知
识及线索, 实现知识驱动设计技术, 提升制造企
业的产品创新能力。
权利要求书2页 说明书7页 附图2页
CN 114399047 A
2022.04.26
CN 114399047 A
1.一种基于多源数据 挖掘的复杂设计知识网络构建方法, 包 含如下步骤:
步骤一: 知识网络顶层模型构建;
步骤二: 设计知识 表示模型构建;
步骤三: 设计知识网络顶层节点与设计知识项匹配。
2.根据权利要求1所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 步骤一中的知识网络顶层模型构建, 具体为: 知识抽取是构建知识网络的基础, 在知识
网络顶层构建的过程中, 输入制造企业的需求域、 设计域、 制 造域、 试验域和运维域相关的
文本, 基于双向长短期记忆网络 ‑条件随机场Bi ‑LSTM‑CRF模型实现命名实体识别, 再基于
依存语义模型抽取三元组; 根据实体和实体之间相应的关系进行链接形成知识图谱, 并在
知识网络中嵌入实体详细信息进行 更新, 将这个更新的知识网络称为知识网络顶层结构。
3.根据权利要求2所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 基于Bi ‑LSTM‑CRF模型的命名实体识别是从文本中识别出命名实体; Bi ‑LSTM‑CRF模型
通过双向长 短期记忆网络Bi ‑LSTM获取观测序列特征, 再应用条件随机场CRF对 该序列标记
建模, 学习已标记后的序列特 征, 识别出文本中的命名实体。
4.根据权利要求2所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 基于依存语义的三元组抽取是依存句法分析是在实体识别结果的基础上, 通过分析文
本中词语之间的相互依存关系来揭示其语法结构, 在句 子中以核心动词支配其他成分, 本
质上就是在实体识别的基础上获得词 与词之间的关系; 依存关系类别 如表1所示; 应用依存
语义范式Dependency Semantic Normal Forms, DSNF的无监督模型分析结合实体识别和依
存关系, 实现三元组的抽取;
表1依存关系类别
。
5.根据权利要求1所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 步骤二中设计知识表示模型构建, 具体为: 为实现设计知识的统一表达, 将设计知识项
分为规则、 文档、 模型和数据 表四类, 构建设计知识项模型, 将设计知识项进 行整理和存储,
同时面向设计任务实现设计知识的组织和表示。
6.根据权利要求1或5所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征
在于: 还包括知识项通用模 型, 具体分为知识项、 元知识、 元属性; 知识项 KI作为知识表达中
最基本的单元和知识建模的依据, 它独立描述某个事实、 信息、 概念或原理; 元知识MK从ID、权 利 要 求 书 1/2 页
2
CN 114399047 A
2名称、 关键词及资源信息方面对一条知识项展开描述, 多个元知识组成一条完整的知识项;
元属性MP是 元知识的属性表达单位, 对元知识按照字段的形式进行描述; 知识项表达式为:
KI=(MK1,MK2,...,MKn‑1,MKn) (1)
其中MK1,MK2,...,MKn‑1,MKn为元知识 表示集, 元知识 表达式为:
MK=(MP1,MP2,...,MPn‑1,MPn) (2)
其中MP1,MP2,...,MPn‑1,MPn为元属性 集, 元属性表达式为:
MP=[k1:v1,k2:v2,...,kn‑1:vn‑1,kn:vn] (3)
其中k1:v1,k2:v2,...,kn‑1:vn‑1,kn:vn为键值对集, 用来描述元属性的内容。
7.根据权利要求5所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 设计知识项模型, 通过对设计知识项进 行建模以减少冗杂的设计知识将其清楚地表达,
保证设计知识的全面性、 准确性、 唯一性; 设计知识项作为设计知识建模的基本单元, 设计
知识项用来进行设计知识的组织和存储; 将设计知识按照异构形式划分, 分为以下四类:
(1)、 规则; (2)、 文档; (3)、 模型; (4)、 数据表; 具体如下:
规则分为命题式规则和产生式规则; 命题式规则是一种非真即假的陈述性规则, 产生
式规则是通过逻辑推理或专 家指导出来的, 适用于不确定性度量;
文档中以文本形式存 储大量文字;
模型中存 储着设计模型;
数据表库中存 储着设计相关的数据表信息;
根据构建的知识项通用模型, 分别对这四类设计知识进行建模, 构建 设计知识项模型。
8.根据权利要求1所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 步骤三中设计知识网络顶层节点与设计知识项匹配, 具体为: 将设计知识库与知识网络
顶层节点进行关联映射, 实现设计知识匹配, 构建完整的复杂设计知识网络模型; 采用
word2vec模型将实体信息与设计知识库进 行相似度计算, 将相似度高的设计知识链接到实
体信息上; word2vec将非结构化、 不可计算的文本转化为结构化、 可计算的向量, 通过词嵌
入的方法使原来的词从旧的空间映射到新的空间, 从而使语义相似的词语在新的空间的距
离更加相近; 再利用spaCy进行语义相 似度的计算, 先将句子的词向量求平均, 获取句子的
语义表示, 然后计算两个句 子的语义表示的余弦相似度; 通过相似度的计算将最为匹配的
设计知识与实体节点进行关联映射, 完成复杂设计知识网络模型的构建。
9.根据权利要求1所述的基于多源数据挖掘的复杂设计知识网络构建方法, 其特征在
于: 该复杂设计知识网络构建方法, 以盾构机设计任务书、 螺旋输送机机构设计说明书、 螺
旋输送机 设计流程、 螺旋输送机故障树、 盾构 机故障处理数据、 盾构 机用户需求信息作为数
据源来构建复杂设计知识网络 。权 利 要 求 书 2/2 页
3
CN 114399047 A
3
专利 基于多源数据挖掘的复杂设计知识网络构建方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:43:59上传分享