说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210895172.4 (22)申请日 2022.07.26 (71)申请人 上海航空工业(集团)有限公司 地址 200232 上海市徐汇区云锦路5号 申请人 商飞软件 有限公司 (72)发明人 刘艳 常欣荻  (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 张文娥 (51)Int.Cl. G06F 16/383(2019.01) G06F 16/58(2019.01) G06F 16/29(2019.01) G06F 16/81(2019.01) G06F 16/36(2019.01) (54)发明名称 一种非结构化数据地图的构建方法及装置 (57)摘要 本申请涉及民机制造数据技术领域, 尤其涉 及一种非结构化数据地图的构建方法及装置, 扫 描民机数据存储系统中的非结构化文件, 获取结 构化元数据模型; 提取所述元数据的关联关系, 并构建图数据模 型; 基于所述图数据模型的映射 关系生成非结构化数据对象, 并确定所述非结构 化数据对象之间的连接关系; 基于生成的所述非 结构化数据对象以及确定的所述非结构化数据 对象之间的连接关系构建非结构化数据地图, 从 而能够提高数据查询性能和可视化效果, 达到推 进企业非结构化数据治理, 实现企业非结构化数 据资产可管理、 可追溯, 保障各业务系统间数据 的有效共享与服 务的目的。 权利要求书2页 说明书7页 附图2页 CN 115238103 A 2022.10.25 CN 115238103 A 1.一种非结构化数据地图的构建方法, 其特征在于, 应用于民机数据存储系统, 包括以 下步骤: 扫描所述民机数据存储系统中的非结构化文件, 获取结构化元数据模型; 其中, 所述结 构化元数据模型包含所述 非结构化文件的元数据, 所述元数据包括所述 非结构化文件的名 称、 所述非结构化文件的主题、 所述非结构化文件的类型中的一种或多种; 提取所述元数据的关联关系, 并构建图数据模型; 基于所述图数据模型的映射关系生成非结构化数据对象, 并确定所述非结构化数据对 象之间的连接关系; 基于生成的所述非结构化数据对象以及确定的所述非结构化数据对象之间的连接关 系构建非结构化数据地图。 2.根据权利要求1所述一种非结构化数据地图的构建方法, 其特征在于, 所述扫描所述 民机数据存 储系统中的非结构化文件, 获取 结构化元 数据模型, 包括以下步骤: 利用大数据解析工具扫描非结构化文件, 采集所述非结构化文件的元 数据; 对所述元数据进行解析形成多条父子结构关系键值对和所述非结构化文件的基本信 息; 基于所述多条父子结构关系键值对和所述非结构化文件的基本信息形成结构化元数 据模型。 3.根据权利要求2所述一种非结构化数据地图的构建方法, 其特征在于, 所述提取所述 元数据的关联关系, 并构建图数据模型, 包括以下步骤: 利用知识图谱工具以所述元数据、 以及所述多条父子结构关系键值对和所述非结构化 文件的基本信息为 起点, 形成父子溯源的图数据; 基于所述图数据构建所述元 数据之间的映射关系; 基于所述元 数据之间的映射关系构建图数据模型。 4.根据权利要求2所述一种非结构化数据地图的构建方法, 其特征在于, 所述非结构化 文件的基本信息包括非结构化文件的抽取时间、 非结构化文件的索引位置、 非结构化文件 的创建人、 非结构化文件的权限中的一种或多种。 5.根据权利要求4所述一种非结构化数据地图的构建方法, 其特征在于, 所述基于生成 的所述非结构化数据对 象以及确定的所述非结构化数据对 象之间的连接关系构建非结构 化数据地图之后, 还 包括以下步骤: 采用图数据库对构建的所述非结构化数据地图进行存 储。 6.根据权利要求5所述一种非结构化数据地图的构建方法, 其特征在于, 所述利用大数 据解析工具扫描非结构化文件, 采集所述非结构化文件的元 数据, 包括以下步骤: 利用大数据解析工具的不同处理程序, 针对不同类型的非结构化文件进行相适配处 理, 以将不同型的非结构化文件转换为结构化文档数据; 基于转换的所述结构化文档数据采集所述非结构化文件的元 数据。 7.根据权利要求6所述一种非结构化数据地图的构建方法, 其特征在于, 所述民机数据 存储系统中的非结构化文件 包括pdf文档、 w ord文档、 图片中的一种或多种类型。 8.一种非结构化数据地图的构建装置, 其特 征在于, 包括: 扫描模块, 用于扫描非结构化文件, 获取结构化元数据模型; 其中, 所述结构化元数据权 利 要 求 书 1/2 页 2 CN 115238103 A 2模型包含所述非结构化文件的元数据, 所述元数据包括所述非结构化文件的名称、 所述非 结构化文件的主题、 所述非结构化文件的类型中的一种或多种; 提取模块, 用于提取 所述元数据的关联关系, 并构建图数据模型; 确定模块, 用于基于所述图数据模型的映射关系生成非结构化数据对象, 并确定所述 非结构化数据对象之间的连接关系; 构建模块, 用于基于生成的所述非结构化数据对象以及确定的所述非结构化数据对象 之间的连接关系构建非结构化数据地图。 9.一种电子设备, 其特征在于, 包括: 处理器、 存储器和总线, 所述存储器存储有所述处 理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储器之间通过总线 通信, 所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的非结构化数 据地图的构建方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质上存储有计算机程 序, 该计算机程序被处理器运行时执行如权利要求1至7任一所述的非结构化数据地图的构 建方法的步骤。权 利 要 求 书 2/2 页 3 CN 115238103 A 3

.PDF文档 专利 一种非结构化数据地图的构建方法及装置

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种非结构化数据地图的构建方法及装置 第 1 页 专利 一种非结构化数据地图的构建方法及装置 第 2 页 专利 一种非结构化数据地图的构建方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。