说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210696876.9 (22)申请日 2022.06.20 (71)申请人 国网甘肃省电力公司电力科 学研究 院 地址 730070 甘肃省兰州市安宁区万 新北 路249号(兰州电力学校院内) (72)发明人 赵金雄 马志程 狄磊 白万荣  马宏忠 赵红  (74)专利代理 机构 北京精金石知识产权代理有 限公司 1 1470 专利代理师 刘俊玲 (51)Int.Cl. G06F 16/951(2019.01) G06F 16/9532(2019.01) G06F 16/958(2019.01)G06F 16/215(2019.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/205(2020.01) G06F 40/295(2020.01) (54)发明名称 一种科技信息服务平台构建方法及科技信 息服务平台 (57)摘要 本发明提供了一种科技信息服务平台构建 方法及科技信息服务平台, 涉及数据处理技术领 域, 具体步骤包括: 数据预处理: 进行数据清洗、 数据整理, 获取含有 标的物及标的物分类特征的 关键数据; 标的物提取: 利用知识抽取模 型, 从所 述关键数据中提取标的物; 文本特征提取: 提取 所述标的物的文本特征, 为所述文本特征中的词 语按照分类结果影 响程度赋予权重; 分类树自动 定位: 建立分类树模型, 在知识搜索引擎中输入 所述文本 特征, 获取所述标的物在分类树模型上 的定位。 本发 明提供的构建方法实现外网数据的 自动采集, 并针对外网数据进行进行数据预处 理、 标的物提取和文本特征提取, 且实现企业项 目数据的自动解析, 提供高质量多类型的决策支 持服务。 权利要求书2页 说明书6页 附图3页 CN 115098755 A 2022.09.23 CN 115098755 A 1.一种科技信息服 务平台构建方法, 其特 征在于: 所述科技信息服 务平台进行对数据的采集和解析, 具体步骤 包括: 步骤一、 数据采集; 步骤二、 数据预处理: 进行数据清洗、 数据整理, 获取含有标的物及标的物分类特征的 关键数据; 步骤三、 标的物提取: 从所述关键数据中提取标的物 的文本特征, 进行语料分析, 为所 述文本特 征中的词语按照分类结果影响程度赋予权 重; 步骤四、 建立数据库, 分类树自动定位: 建立数据库并构建分类树模型, 在知识搜索引 擎中输入所述文本特 征, 获取所述标的物在分类树模型 上的定位。 2.如权利要求1所述的一种科技信 息服务平台构建方法, 其特征在于: 所述数据采集的 来源至少包括 新闻资讯网站和论文资源网站。 3.如权利要求2所述的一种科技信 息服务平台构建方法, 其特征在于: 所述新闻资讯网 站中数据采集的方法为: 将待 数据采集的网页放入调 度器, 并发送爬虫请求; 下载器访问所 述网页中的网络数据, 并交付响应至引擎。 4.如权利要求2所述的一种科技信 息服务平台构建方法, 其特征在于: 所述论文资源 网 站中数据采集的方法为: 根据关键词搜索, 设置筛选项, 获取并解析论文资源网站页面数 据; 提取页面内容并保存。 5.如权利要求1所述的一种科技信 息服务平台构建方法, 其特征在于: 所述数据清洗及 数据整理至少包括: 删除空格符、 换 行符和冗余数据; 统一文本格式。 6.如权利要求1所述的一种科技信息服 务平台构建方法, 其特 征在于: 提取所述标的物的文本特征的方法为: 使用N ‑Gram和TF ‑IDF算法对文本特征进行提 取。 7.一种科技信息服 务平台, 其特 征在于: 包括展现层、 业 务逻辑层和数据层; 所述展现层用于用户交互; 所述业务逻辑层包括核心业务模块和业务支撑模块, 所述 数据层用于访问和管理数据库; 外部数据经 所述业务支撑模块进行 数据处理后录入所述数据层; 所述业务逻辑层通过业务支撑模块调用所述数据层, 并进行数据预处理、 标的物提取 和文本特征提取, 获取所述标的物的定位, 通过所述展现层提供所述核心业务模块中的服 务。 8.如权利要求7所述的一种科技信 息服务平台, 其特征在于: 所述核心业务层为用户提 供系统管理、 知识管理、 科技动态管理和行业科技动态服 务; 所述系统管理用于管理用户访问, 所述知识管理用于提供数据爬虫管理和知识标注的 功能, 所述科技动态管理用于管理动态文档, 所述行业科技动态服务向用户提供科技信息 服务。 9.如权利要求8所述的一种科技信息服 务平台, 其特 征在于: 所述科技动态管理包括企业内部动态管理和外部动态文档管理, 所述企业内部动态库 管理用于上传企业内部文件, 外部动态文档管理用于上传一些未在数据爬取目标网站内的 科技动态作为补充。权 利 要 求 书 1/2 页 2 CN 115098755 A 210.根据权利要求7中所述的一种科技信息服 务平台, 其特 征在于: 所述数据库至少包括关系型 数据库、 全文检索数据库和图形 数据库中的一种。权 利 要 求 书 2/2 页 3 CN 115098755 A 3

.PDF文档 专利 一种科技信息服务平台构建方法及科技信息服务平台

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种科技信息服务平台构建方法及科技信息服务平台 第 1 页 专利 一种科技信息服务平台构建方法及科技信息服务平台 第 2 页 专利 一种科技信息服务平台构建方法及科技信息服务平台 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:55:59上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。