说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210790201.0 (22)申请日 2022.07.06 (71)申请人 中国电子科技 集团公司第十五研究 所 地址 100083 北京市海淀区北四环中路21 1 号 (72)发明人 岳一峰 张昊 李若晨 任祥辉  谢世超  (74)专利代理 机构 北京惟专知识产权代理事务 所(普通合伙) 16074 专利代理师 赵星 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种面向开源情报的武器装备知识图谱构 建方法、 系统、 装置及存 储介质 (57)摘要 本申请公开了基面向开源情报的武器装备 知识图谱构建方法, 通过从开源资源获取军事文 本数据, 对所述军事文本数据进行预处理, 得到 标准化的军事文本数据, 将标准化的军事文本数 据进行标注处理, 得到训练集(待训练的武器装 备实体识别数据集、 待训练的武器装 备属性提取 数据集及待训练的武器装备实体链接数据集), 通过对模型的训练改善模型, 并基于改善后的模 型对武器装 备进行识别和属性提取, 最后构建知 识图谱, 解决了目前开源军事信息因散乱、 质量 参差不齐、 数据量大等原因造成的对军事开源信 息利用率 不高、 查询费时费力、 不方便的问题。 权利要求书3页 说明书16页 附图4页 CN 115408532 A 2022.11.29 CN 115408532 A 1.一种面向开源情 报的武器装备知识图谱构建方法, 其特 征在于, 所述方法包括: 获取军事文本数据, 对所述军事文本数据进行 预处理, 得到标准 化的军事文本数据; 根据所述标准化的军事文本数据确定待训练 的军事文本数据, 对所述待训练 的军事文 本数据进行标注处理, 分别得到待训练的武器装备实体识别数据集、 待训练的武器装备属 性提取数据集及待训练的武器装备实体链接数据集; 将所述待训练武器装备实体识别数据集输入至对应的模型进行训练处理, 得到训练后 的实体识别模型; 将所述待训练的武器装备属性提取数据集输入至对应的模型进 行训练处 理, 得到训练后的关系抽取模型; 将所述待训练的武器装备实体链接数据集输入至对应的 模型进行训练 处理, 得到训练后的实体链接模型; 基于所述实体识别模型与所述关系抽取模型对所述标准化的军事文本数据分别进行 武器装备识别 及武器装备属性提取操作, 得到武器装备实体数据集及 对应的武器装备属性 数据集; 基于实体链接模型, 将所述武器装备实体数据集与武器装备知识图谱中已有的实体进 行实体链接, 得到目标候选实体数据集, 根据所述 目标候选实体数据集及所述武器装备属 性数据集确定武器装备 的目标属 性数据集, 将所述 目标属性数据集存入数据库, 得到武器 装备知识图谱。 2.如权利要求1所述的面向开源情报的武器装备知识图谱构建方法, 其特征在于, 所述 基于所述实体识别模型与所述关系抽取模型对所述标准化的军事文本数据分别进行武器 装备识别 及武器装备属性提取操作, 得到武器装备实体数据集及对应的武器装备属性数据 集的步骤 包括: 通过Bert预训练语言模型获得输入的所述标准化的军事文本数据的语义表示数据集, 通过CRF层输出概率最大 的实体标签序列, 基于所述实体标签序列确定武器装备实体数据 集; 基于所述关系抽取模型对所述标准化的军事文本数据进行武器装备属 性提取操作, 得 到武器装备属性数据集。 3.如权利要求2所述的面向开源情报的武器装备知识图谱构建方法, 其特征在于, 所述 将所述待训练的武器装备属性提取数据集输入至对应的模型进行训练处理, 得到训练后的 关系抽取模型的步骤 包括: 通过Bert  Embeddin g将所述待训练的武器装备属性提取数据 集转换成属性向量序列, 将所述属性向量序列输入DGCN N中进行编码, 得到编码后的属性向量序列; 将所述码后的向量序列输入Self ‑Attention后, 将输出结果与先验特征进行拼接, 得 到拼接后的属性 向量序列, 将所述拼接后的属性 向量序列输入CNN和Dense层, 预测武器装 备的首、 尾位置, 得到中间关系抽取模型; 根据所述中间关系抽取模型输入任一所述武器装备进行训练得到所述训练后的关系 抽取模型。 4.如权利要求3所述的面向开源情报的武器装备知识图谱构建方法, 其特征在于, 所述 根据所述中间关系抽取模型输入任一所述武器装备进行训练得到所述训练后的关系抽取 模型的步骤方包括: 采样任一所述武器装备, 将编码后的属性向量序列对应所述任一所述武器装备的子属 性向量序列输入至LSTM中, 得到所述任一所述武器装备的属性编码向量序列;权 利 要 求 书 1/3 页 2 CN 115408532 A 2将编码后的属性向量序列输入另一层Self ‑Attention 中, 将输出结果与所述任一所述 武器装备的属性编码向量序列进行拼接, 得到目标属性向量序列; 将所述目标属性向量序列输入CNN和 Dense, 预测所述武器装备的首、 尾位置, 从而得到 训练后的关系抽取模型。 5.如权利要求1所述的面向开源情报的武器装备知识图谱构建方法, 其特征在于, 所述 基于实体链接模型, 将所述武器装备实体数据集与武器装备知识图谱中已有的实体进 行实 体链接, 得到目标候选实体数据集的步骤 包括: 根据所述标准化的军事文本数据基于百度 百科和维基百科爬取, 得到候选实体链接数 据集, 所述 候选实体链接数据集; 对所述候选实体链接数据集和其对应的实体指称进行拼接处理, 得到拼接后的候选实 体链接数据集, 所述 候选实体和所述实体指称之间以分隔符隔开; 将所述拼接后的候选实体链接数据集输入每个BERT预训练模型中, 所述拼接后的候选 实体链接数据集经过Dropout层进入一个二分类Dence层后, 将输出结果拼接后输入Dence 层, 得到多次拼接后的候选实体链接数据集; 所述多次拼接后的候选实体链接数据集输入Softmax, 将得分最高的候选实体数据集 作为目标候选实体数据集。 6.如权利要求1所述的面向开源情报的武器装备知识图谱构建方法, 其特征在于, 所述 方法还包括: 基于所述目标候选实体数据集的实体名称在知识图谱数据库中进行查找, 并返回第 一 查询结果; 若所述第一查询结果为NIL, 则目标候选实体数据集及对应的所述目标属性数据集存 入知识图谱数据库。 7.如权利要求1所述的面向开源情报的武器装备知识图谱构建方法, 其特征在于, 所述 方法还包括: 基于目标属性数据集的属性名称在知识图谱数据库中进行查找, 并返回第二查询结 果, 若所述第二查询结果为无, 将该属性存入至所述知识图谱对应实体的属性数据库中; 否 则, 将该属 性与对应实体的属 性进行合并处理, 并存入至所述知识图谱对应实体的属 性数 据库中。 8.一种面向开源情 报的武器装备知识图谱构建系统, 其特 征在于, 所述系统包括: 获取模块, 用于获取军事文本数据, 对所述军事文本数据进行预处理, 得到标准化的军 事文本数据; 标注模块, 用于根据所述标准化的军事文本数据确定待训练的军事文本数据, 对所述 待训练的军事文本数据进行标注处理, 分别得到待训练的武器装备实体识别数据集、 待训 练的武器装备属性 提取数据集及待训练的武器装备实体链接数据集; 计算模块, 用于将所述待训练武器装备实体识别数据集输入至对应的模型进行训练处 理, 得到训练后的实体识别模型; 将所述待训练的武器装备属 性提取数据集输入至对应的 模型进行训练处理, 得到训练后的关系抽取模型; 将所述待训练的武器装备实体链接数据 集输入至对应的模型进行训练处理, 得到训练后的实体链接模型; 基于所述实体识别模型 与所述关系抽取模型对所述标准化的军事文本数据分别进行武器装备识别及武器装备属权 利 要 求 书 2/3 页 3 CN 115408532 A 3

.PDF文档 专利 一种面向开源情报的武器装备知识图谱构建方法、系统、装置及存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向开源情报的武器装备知识图谱构建方法、系统、装置及存储介质 第 1 页 专利 一种面向开源情报的武器装备知识图谱构建方法、系统、装置及存储介质 第 2 页 专利 一种面向开源情报的武器装备知识图谱构建方法、系统、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。