说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210856262.2 (22)申请日 2022.07.14 (71)申请人 同方知网 (北京) 技 术有限公司 地址 100192 北京市海淀区西小口路6 6号 东升科技园北 领地A2楼 申请人 同方知网数字出版技 术股份有限公 司 (72)发明人 刘军 王似巍 周万青 罗梦灵  杨永秀 吕强 段飞虎 张宏伟  (74)专利代理 机构 北京天奇智新知识产权代理 有限公司 1 1340 专利代理师 陈新胜 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/33(2019.01)G06F 16/31(2019.01) G06F 16/36(2019.01) (54)发明名称 一种基于关键词打 分的评审专 家推荐方法 (57)摘要 本发明公开了一种基于关键词打分的评审 专家推荐方法, 包括: 根据评论专家库中的专家 信息补充专家学术信息并处理; 根据专家的基本 信息及专家学术数据构建专业词汇词典; 根据 专 业词汇词典提取专家备选关键词和项目备选关 键词; 确定专家关键词及项目关键词, 并通过关 键词的匹配, 推荐合适的专家。 该方法首先实用 一套关键词库提取备选关键词保证信息维度的 一致性, 其次补充专家的学术数据, 基于关键词 的专家推荐方法能够综合考虑专家信息的维度 并弥补当前评标专家推荐方法适配度较低的问 题。 权利要求书3页 说明书6页 附图4页 CN 115114426 A 2022.09.27 CN 115114426 A 1.一种基于关键词打 分的评审专 家推荐方法, 其特 征在于, A根据评论专 家库中的专 家信息补充专 家学术信息并处 理; B根据专家的基本信息及专 家学术数据构建专业词汇词典; C根据专业词汇词典提取专 家备选关键词和项目备选关键词; D确定专家关键词及项目关键词, 并通过关键词的匹配, 推荐合 适的专家。 2.如权利要求1所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述A中专 家学术信息的处 理包括: 专 家学术数据补充及预处 理与项目数据预处 理; 所述B具体包括, 对于不常见的领域词汇, 利用新词发现算法进行筛选; 对于给定的专 家数据, 采用基于凝固度及自由度的新词发现算法得到备选专业词汇, 并筛选得到专业词 典; 所述凝固度就是一个字组合片段里面字与字之间的紧密程度; 所述自由度就是一个字 组合片段能独立自由运用的程度。 3.如权利要求2所述的基于关键词打分的评审专家推荐方法, 其特征在于, 词凝固度与 自由度的大小计算包括: 利用N‑gram得到原文本中的所有可能成词的字组合, 并统计词频; 计算凝固度词汇的凝固程度, 凝固度越大, 其组成一个新词的可能性 也就越大: 其中, I(x,y)代表由字x及字y组成的新词凝固度, P(x,y)代表字x及字y联合出现的概 率; P(x)代表字x单独出现的概率, P(y)代表字y单独出现的概率; 计算左右熵, 左右熵值越 大, 说明该词的周边词越丰富, 意味着词的自由程度越大, 其成为一个独立的词的可能性也 就越大 其中, EL代表左熵, ER代表右熵, P(Wi|string)代表给定字符串string的情况下其左右 两边出现字Wi的概率。 4.如权利要求1所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述C具体 包括: 基于T F‑IDF的关键词打分模 型分别对基于专家关键词的打分模型及基于项目关键词 的打分模型进行改进。 5.如权利要求4所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述C1中TF 为词频, 表示词条在文本中出现的频率: 其中nij代表词i在文本j中出现的次数, TFij代表词i在文本j中出现的词频; IDF为逆文 件频率, 表 示关键词的普遍程度, 如果包含某词条的文档越少, 则该词条IDF越大, 则说明该 词条具有很好的类别区分能力; 其中 其中, |D|代表文本总数量, dj代表文本j, IDFi代表词i的逆文档频率; TF ‑IDF倾向于过权 利 要 求 书 1/3 页 2 CN 115114426 A 2滤掉常见的词语, 保留重要的词语, 表达为: TF‑IDF=TF*IDF        (6)。 6.如权利要求4所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述C2具体 包括: 在为专家关键词进 行打分时, 通过专家信息 分配权重的方式对打分模型进 行改进, 具 体为: 根据信息类型配置初始权重, 在初始权重基础上, 针对不同的词进行调整, 调整原则 为: 某字段某关键词在大多数 人的该字段均有出现则在 初始权重基础上适当惩罚; 某字段某关键词仅在某个人的该字段 出现则在 初始权重基础上适当奖励; 表达为如下公式: TF‑IDF=TF*IDF*wk      (7) 其中W′k代表人为根据字段设置的初始权 重, Wk为动态调整后单词k的最终权 重: 7.如权利要求4所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述C3具体 包括: 弱化TF值影响, 强化 IDF值影响: 改进后的TF值即NTF表达为公式9, 其中nij代表词i在文本j中出现的次数: 改进后的IDF值即NIDF表达为 公式10, 其中, |D|代表文本总数量, dj代表文本j, NIDFi代 表词i的逆文档频率: 改进后的TF ‑IDF值表打为: TF‑IDF=NTF*NIDF        (II)。 8.如权利要求1所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述步骤D 具体包括: D1基于关键词权值的专 家推荐; D2基于关键词相似匹配的专 家推荐。 9.如权利要求8所述的基于关键词打分的评审专家推荐方法, 其特征在于, 所述D1具体 包括根据关键词的位置为关键词重新分配权重, 首先根据TF ‑IDF值截取前k个关键词并由 大到小排序, 排序后进行权重再分配, 分配方式如下,其中k代表关键词的数量, i代表关键 词的位置, wi代表位置为 i的关键词的权 重: 在专家推荐时, 根据匹配到的关键词及关键词在项目和专家中的权值, 推荐匹配数量 越多, 且关键词权值越高的专 家; 推荐值具体表达如下: 最后依据关键词 推荐值, 选择前N个专家进行推荐; 其中k表示关键词, kx表示专家关键权 利 要 求 书 2/3 页 3 CN 115114426 A 3

.PDF文档 专利 一种基于关键词打分的评审专家推荐方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于关键词打分的评审专家推荐方法 第 1 页 专利 一种基于关键词打分的评审专家推荐方法 第 2 页 专利 一种基于关键词打分的评审专家推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。