说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210775404.2 (22)申请日 2022.07.01 (71)申请人 杨双远 地址 361000 福建省厦门市思明区思明南 路422号 (72)发明人 杨双远  (74)专利代理 机构 安徽宏铎知识产权代理事务 所(普通合伙) 3425 0 专利代理师 菅秀君 (51)Int.Cl. G06F 40/117(2020.01) G06F 40/284(2020.01) G06N 3/04(2006.01) G06N 5/02(2006.01) G06F 16/33(2019.01)G06F 16/36(2019.01) (54)发明名称 一种人岗需求文本的知识图谱的方法及存 储介质 (57)摘要 一种人岗需求文本的知识图谱的构建方法 及存储介质, 其中方法包括如下步骤: 步骤101、 将BERT与BiLSTM ‑CRF模型相结合, 对人才岗位需 求文本进行BI O词性标注, 根据预设的实体类型, 对所述人才岗位需求文本的相应实体类型进行 标记, 将人才岗位需求文本转换为稠密字向量, 作为BiLS TM层语义抽取任 务的输入, BiLS TM层输 出每个词在所有标签下的得分, 输入到CRF层, 该 层输出作为最终标注结果; 上述方案能够通过采 用正则匹配的方法对实体标注 集进行实体生成, 然后进行基于上下文的实体对齐和基于标点符 号的实体隐藏关系学习。 提取到岗位关键词后, 基于树模型对岗位信息进行三元 组构造, 将岗位 关键词转化为岗位三元组结构化表达式, 并构建 知识图谱。 权利要求书2页 说明书6页 附图2页 CN 115034178 A 2022.09.09 CN 115034178 A 1.一种人岗需求文本的知识图谱的构建方法, 其特 征在于, 包括如下步骤: 步骤101、 将BERT与BiLSTM ‑CRF模型相结合, 对人才岗位需求文本进行BIO词性标注, 根 据预设的实体类型, 对所述人才岗位需求文本的相应实体类型进行标记, 将人才岗位需求 文本转换为稠密字向量, 作为BiLSTM层语义抽取任务的输入, BiLSTM层输出每个词在所有 标签下的得分, 输入到 CRF层, 该层输出作为 最终标注结果; 步骤102、 基于得到的词性标注结果, 按照实体和关系组成规则进行基于正则匹配的实 体生成; 步骤103、 在人才岗位需求文本中针对岗位需求描述的, 存在的缺失主语、 同一关系对 应多个实体的问题以及关系缺失的问题, 进行基于上 下文的实体对齐, 得到岗位关键词; 步骤104、 利用树模型将所述岗位关键词进行分组存储, 先从实体关系集合中提取序 列, 构造关系树, 然后利用树模型的搜索算法提取 出岗位描述 三元组序列, 以RDF 形式存储, 步骤105、 基于RDF 数据, 构造知识图谱。 2.根据权利要求1所述的人 岗需求文本的知识图谱的构建方法, 其特征在于, 还包括步 骤, 基于标点符号的实体隐藏关系学习。 3.根据权利要求1所述的人 岗需求文本的知识图谱的构建方法, 其特征在于, 还包括步 骤, 采用HNSW算法思想进 行基于图方法的向量检索。 具体思路是利用多层图结构, 将节 点随 机划分到不同的层, 0层包含所有节点, 高层节点数呈指数级衰减。 检索时从最上层图任一 点开始查找, 选择进入点最近邻的一些点记录下来, 后续查找 时先计算记录中的点与目标 点的距离, 及时更新记录, 保留前k个点。 这样从上层图到下层图, 逐步靠近距离最近的节 点 达到收敛。 最后通过底层的近邻检索, 完成局部最近邻的查找。 4.根据权利要求1所述的人 岗需求文本的知识图谱的构建方法, 其特征在于, 还包括步 骤, 基于知识图谱实现不同规模企业同一类型岗位需求中的交叉、 合并和补充关系, 其中交 叉关系表示人才 岗位需求中的共同需求, 合并关系则是包含所有需求, 补充关系表示需要 扩充的内容。 5.根据权利要求1所述的人 岗需求文本的知识图谱的构建方法, 其特征在于, 所述预设 的实体类型包括 技能、 程度、 学历和专业四类词性。 6.一种人 岗需求文本的知识图谱的构建存储介质, 其特征在于, 存储有计算机程序, 所 述计算机程序在被运行时执 行包括如下步骤: 步骤101、 将BERT与BiLSTM ‑CRF模型相结合, 对人才岗位需求文本进行BIO词性标注, 根 据预设的实体类型, 对所述人才岗位需求文本的相应实体类型进行标记, 将人才岗位需求 文本转换为稠密字向量, 作为BiLSTM层语义抽取任务的输入, BiLSTM层输出每个词在所有 标签下的得分, 输入到 CRF层, 该层输出作为 最终标注结果; 步骤102、 基于得到的词性标注结果, 按照实体和关系组成规则进行基于正则匹配的实 体生成; 步骤103、 在人才岗位需求文本中针对岗位需求描述的, 存在的缺失主语、 同一关系对 应多个实体的问题以及关系缺失的问题, 进行基于上 下文的实体对齐, 得到岗位关键词; 步骤104、 利用树模型将所述岗位关键词进行分组存储, 先从实体关系集合中提取序 列, 构造关系树, 然后利用树模型的搜索算法提取 出岗位描述 三元组序列, 以RDF 形式存储,权 利 要 求 书 1/2 页 2 CN 115034178 A 2步骤105、 基于RDF 数据, 构造知识图谱。 7.根据权利要求6所述的人 岗需求文本的知识图谱的构建存储介质, 其特征在于, 所述 计算机程序在被运行时还执 行步骤, 基于标点符号的实体隐藏关系学习。 8.根据权利要求6所述的人 岗需求文本的知识图谱的构建存储介质, 其特征在于, 所述 计算机程序在被运行时还执行步骤, 采用HNSW算法思想进行基于图方法 的向量检索。 具体 思路是利用多层图结构, 将节点 随机划分到不同的层, 0层包含所有节点, 高层节点数呈指 数级衰减。 检索时从最上层图任一点开始 查找, 选择进入点最近邻的一些点记录下来, 后续 查找时先计算记录中的点与目标点的距离, 及时更新记录, 保留前k个点。 这样从上层图到 下层图, 逐步靠近距离最近的节点达到收敛。 最后通过底层的近邻检索, 完成局部最近邻的 查找。 9.根据权利要求6所述的人 岗需求文本的知识图谱的存储介质, 其特征在于, 所述计算 机程序在被运行时还执行步骤基于知识图谱实现不同规模企业同一类型岗位需求中的交 叉、 合并和补 充关系, 其中交叉关系表示人才岗位需求中的共同需求, 合并关系则是包含所 有需求, 补充关系表示需要扩充的内容。 10.根据权利要求6所述的人岗需求文本的知识图谱的构建存储介质, 其特征在于, 所 述预设的实体 类型包括 技能、 程度、 学历和专业四类词性。权 利 要 求 书 2/2 页 3 CN 115034178 A 3

.PDF文档 专利 一种人岗需求文本的知识图谱的方法及存储介质

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种人岗需求文本的知识图谱的方法及存储介质 第 1 页 专利 一种人岗需求文本的知识图谱的方法及存储介质 第 2 页 专利 一种人岗需求文本的知识图谱的方法及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。