说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202111615497.4 (22)申请日 2021.12.27 (65)同一申请的已公布的文献号 申请公布号 CN 114237829 A (43)申请公布日 2022.03.25 (73)专利权人 南方电网物资有限公司 地址 510000 广东省广州市南沙区环市大 道西225号 (72)发明人 李通 陈杰华 杨瑞波 林景锋  胥经纬 袁诗雪 毛磊  (74)专利代理 机构 北京鑫瑞森知识产权代理有 限公司 1 1961 专利代理师 王立普 (51)Int.Cl. G06F 9/455(2006.01)G06F 16/901(2019.01) G06F 16/903(2019.01) G06F 21/60(2013.01) G06V 20/62(2022.01) (56)对比文件 CN 113434674 A,2021.09.24 CN 113821602 A,2021.12.21 审查员 王佳 (54)发明名称 一种电力设备的数据采集与处 理方法 (57)摘要 本发明涉及数据处理技术, 揭露了一种电力 设备的数据采集与处理方法, 包括: 获取监控数 据文件, 并识别监控数据文件的文件类型及监控 关键字序列; 利用数据清洗容器对监控数据文件 进行数据清洗, 得到干净文件; 获取监控关键字 序列中的最高级关键字, 并在历史监控文件图谱 中查询最高级关键字所处于的子文件图谱; 将监 控关键字序列中各个监控关键字在子文件图谱 区域中进行层次聚类操作, 得到文件关系树图; 利用监控关键字序列中各个监控关键字在文件 关系树图中的位置信息标记所述干净文件, 得到 标记文件, 并将所述标记文件进行存储。 本发明 可以提高电力设备监控数据存 储时的效率。 权利要求书2页 说明书10页 附图4页 CN 114237829 B 2022.08.26 CN 114237829 B 1.一种电力设备的数据采集与处 理方法, 其特 征在于, 所述方法包括: 获取数据接收接口中的监控数据文件, 并识别所述监控数据文件的文件类型及监控关 键字序列; 获取所述文件类型对应的数据清洗容器, 并利用所述数据清洗容器对所述监控数据文 件进行数据清洗, 得到 干净文件; 根据预设的监控关键字等级表, 获取所述监控关键字序列中的最高级关键字, 并在预 构建的历史监控文件图谱中查询所述最高级关键字所处于的子文件图谱, 其包括: 判断所 述历史监控文件图谱中是否含有 所述最高级关键字; 当所述历史监控文件图谱中不含有 所 述最高级关键字时, 根据余弦相似度算法, 获取所述历史监控文件图谱的各个节点中与所 述最高级关键字的语义关联度最大 的节点, 作为并列节点, 并将所述并列节点的父节点下 的图谱网络作为子文件图谱; 当所述历史监控文件图谱中含有所述最高级关键字时, 将所述历史监控文件图谱中所 述最高级关键 字对应的节点下的图谱网络作为子文件图谱; 将所述监控关键字序列中各个监控关键字在所述子文件图谱区域中进行层次聚类操 作, 得到文件关系树图; 获取所述监控关键字序列中各个监控关键字在所述文件关系树图中的位置信 息, 得到 位置信息集 合; 利用所述位置信息集合标记所述干净文件, 得到标记文件, 并将所述标记文件进行存 储。 2.如权利要求1所述的电力设备的数据采集与处理方法, 其特征在于, 所述识别所述监 控数据文件的文件类型及监控关键 字序列, 包括: 获取所述监控数据文件的文件流, 并解析所述文件流中的目标参数字段, 得到所述监 控数据文件的文件 扩展名; 根据所述文件 扩展名, 获取 所述监控数据文件的文件类型; 判断所述文件类型 是否为图片类型; 当所述文件类型为图片类型时, 利用光学识别算法识别所述监控数据文件的文件内 容, 得到文本文档, 并查询所述文本文档中的目标字段内容, 得到所述监控数据文件的监控 关键字序列; 当所述文件类型不是图片类型时, 查询所述监控数据文件中的目标字段内容, 得到所 述监控数据文件的监控关键 字序列。 3.如权利要求1所述的电力设备的数据采集与处理方法, 其特征在于, 所述获取所述文 件类型对应的数据清洗容器之前, 所述方法还 包括: 根据预构建的容器脚本, 获得镜像容器框架; 获取数据库的操作系统依赖包, 并利用所述操作系统依赖包对所述镜像容器框架进行 操作环境配置, 得到基础容器; 根据预设的数据清洗策略表, 获取各个文件类型对应的数据清洗函数包, 并将各个所 述数据清洗函数包封装至不同的所述基础容器中, 得到各个目标文件类型对应的数据 清洗 容器。 4.如权利要求3所述的电力设备的数据采集与处理方法, 其特征在于, 所述利用所述数权 利 要 求 书 1/2 页 2 CN 114237829 B 2据清洗容器对所述 监控数据文件进行 数据清洗, 得到 干净文件, 包括: 利用所述数据清洗容器对所述 监控数据文件进行格式化处 理, 得到格式化文档; 查询所述格式化文档的缺失值与异常值, 并利用所述数据清洗容器中的数据清洗函数 包对所述缺失值与所述异常值进行清洗, 得到 干净文件。 5.如权利要求1所述的电力设备的数据采集与处理方法, 其特征在于, 所述将所述标记 文件进行存 储, 包括: 利用预构建的纠删码对所述标记文件进行编码加密, 得到加密数据; 将所述加密数据进行分块, 并分布式存 储于数据库的各个存 储空间中。 6.如权利要求1所述的电力设备的数据采集与处理方法, 其特征在于, 所述将所述标记 文件进行存 储之后, 所述方法还 包括: 利用埋点分析方法, 监控所述标记文件的存 储过程; 当所述标记文件存储成功后, 获取所述标记文件的存储地址, 并根据 所述存储地址, 在 预设的可视化区域中构建浏览超链接; 当所述标记文件 存储不成功时, 显示预构建的存 储失败提 示信息。权 利 要 求 书 2/2 页 3 CN 114237829 B 3

.PDF文档 专利 一种电力设备的数据采集与处理方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种电力设备的数据采集与处理方法 第 1 页 专利 一种电力设备的数据采集与处理方法 第 2 页 专利 一种电力设备的数据采集与处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:14:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。