说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210600146.4 (22)申请日 2022.05.27 (71)申请人 北京航空航天大 学 地址 100191 北京市海淀区学院路37号 (72)发明人 龚光红 邹雅芳 宋晓 王江云  苑海涛  (74)专利代理 机构 北京天汇航智知识产权代理 事务所(普通 合伙) 11987 专利代理师 黄川 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/215(2019.01) G06F 40/30(2020.01) G06Q 50/00(2012.01) (54)发明名称 一种融合多源数据的领域专家科研关系网 络构建方法 (57)摘要 一种融合多源数据的领域专家科研关系网 络构建方法, 包括从多源库中获取领域专家多源 数据; 对领域专家多源数据进行清洗、 集成、 转换 等预处理, 得到领域专家多维度的属性数据; 基 于领域专家多维度的属性数据, 分别构建领域专 家多维度语义关系网络; 基于领域专家多维度的 属性数据, 分别构建领域专家多维度影 响关系网 络等步骤, 该方法服务于协同决策问题, 可以融 合多源数据构建多维度、 多层次的领域专家科研 关系网络, 数据更具准确性, 且网络更真实、 准确 地反映领域专 家之间的影响 关系。 权利要求书4页 说明书14页 附图7页 CN 114969368 A 2022.08.30 CN 114969368 A 1.一种融合多源数据的领域专 家科研关系网络构建方法, 其特 征在于, 包括如下步骤: S1: 从多源库中获取 领域专家多源数据; S2: 对领域专家多源数据进行清洗、 集成、 转换的预处理, 去除重复的领域专家数据, 将 专家姓名和论文数据集成对应, 构造领域专 家多维度的属性数据; S3: 基于领域专 家多维度的属性数据, 分别构建领域专 家多维度语义关系网络; S4: 基于领域专 家多维度的属性数据, 分别构建领域专 家多维度影响关系网络 。 2.如权利要求1所述的方法, 其特 征在于: 所述 步骤S1具体包括如下步骤: S101: 根据研究领域在第一数据库中获取 领域专家初始检索列表; S102: 根据初始检索列表在第二数据库中获取 数据, 并扩充检索列表; S103: 根据扩充后的检索列表在第三数据库中获取 数据。 3.如权利要求2所述的方法, 其特征在于: 所述第一、 二、 三数据库分别为公开专家库、 中文数据库和外文数据库。 4.如权利要求1所述的方法, 其特征在于: 所述步骤S2中构造领域专家多维度的属性数 据, 具体为: 学术、 合作和社交三个方面的属性; 其中, 学术属性数据包括论文总数、 第一作者论文数、 期刊数量、 会议数量、 影响因子 和、 H指数中的至少一种; 合作属性数据包括合作者姓名、 合作者工作单位、 合作论文数、 排序靠前数、 排序靠后 数中的至少一种; 社交属性数据包括另一专 家姓名、 另一专 家工作单位、 师生关系中的至少一种。 5.如权利要求1所述的方法, 其特 征在于: 所述 步骤S3中具体包括如下步骤: S301: 根据学术属性数据构建领域专家学术属性语义关系网络: 提取学术属性数据, 将 领域专家作为头实体, 属性名称作为语义关系, 属性值作为尾实体, 形成学术属性语义关系 网络; S302: 根据合作属性数据构建领域专家合作属性语义关系网络: 提取合作属性数据, 将 领域专家作为头实体, 合作信息作为语义关系, 合作者作为尾实体, 形成合作属性语义关系 网络; S303: 根据社交属性数据构建领域专家社交属性语义关系网络: 提取社交属性数据, 将 领域专家作为头实体, 师生关系作为语义关系, 另一专家作为尾实体, 形成社 交属性语义关 系网络。 6.如权利要求5所述的方法, 其特征在于: 所述合作信息包括合作论文数、 排序靠前数、 排序靠后数中的至少一种; 所述师生关系包括博士导师、 硕士导师、 博士生和硕士生这四种 关系中的至少一种。 7.如权利要求1所述的方法, 其特 征在于: 所述 步骤S4中具体包括如下步骤: S401: 考虑时间衰减因素, 构建领域专 家学术属性影响关系网络; S402: 考虑时间衰减因素, 构建领域专 家合作属性影响关系网络; S403: 构建领域专 家社交属性影响关系网络 。 8.如权利要求7 所述的方法, 其特 征在于: 所述 步骤S401具体包括: 学术属性影响关系考虑3个因素: 论文总数, 影响因子和, H指数, 并将衰减时间划分为3 段: 3年以内, 3年至10年之内, 10年以上;权 利 要 求 书 1/4 页 2 CN 114969368 A 2假设共有N位领域专家, 在第t个时间段内第 i个专家的第 k个因素取值为 其中 i=1,2,...,N; k=1,2,3; t=1,2,3; k=1表示论文总数, k=2表示影响因子和, k=3表示H 指数; t=1表示3年以内, t=2 表示3年至10年之内, t=3表示10年以上; 则在第t个时间段内第i位专家与第j位专家的第k个因素取值之差为学术属性直接影 响值 在每个学术属性 直接影响值前加上时间衰减系数, 得到学术属性综合影响值: 其中, e‑τ(t)为时间衰减系数, τ(t)为时间衰减因子, 其在各个时间段的取值 为: 对学术属性综合影响值进行最小最大规范化得到综合影响规范值: 那么, 由第k个因素导 致的第i位专家对第j位专 家的影响强度定义 为: 其中, 0表示无影响, 1表示影响强度较弱, 2表示影响强度一般, 3表示影响强度较大, 4 表示影响强度极大; 不考虑专家对自身的影响, 统一定义 为: 将所有因素导 致的影响加权求和得到专 家在学术属性上的影响强度, 计算公式如下: 其中, 为不失一般性, 取 λ1= λ2= λ3=1/3; 最后, 构成学术属性影响关系网络, 网络节点为领域专家, 网络的边为专家之间的影响 关系, 边权值 为影响强度大小, 表示 为学术属性影响强度矩阵:权 利 要 求 书 2/4 页 3 CN 114969368 A 3

.PDF文档 专利 一种融合多源数据的领域专家科研关系网络构建方法

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合多源数据的领域专家科研关系网络构建方法 第 1 页 专利 一种融合多源数据的领域专家科研关系网络构建方法 第 2 页 专利 一种融合多源数据的领域专家科研关系网络构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。