说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210715356.8 (22)申请日 2022.06.23 (71)申请人 广州大学 地址 510000 广东省广州市大 学城外环西 路230号 (72)发明人 胡勇军 朱柳茜  (74)专利代理 机构 北京睿智保诚专利代理事务 所(普通合伙) 11732 专利代理师 杜娟 (51)Int.Cl. G06F 16/36(2019.01) G06N 5/02(2006.01) G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01) (54)发明名称 一种个性 化定制下的价 值链知识发现方法 (57)摘要 本发明公开了一种个性化定制下的价值链 知识发现方法, 属于信息技术领域。 由以下步骤 组成: 对给定领域文本划定价值主题, 进行价值 锚定种子词抽取; 根据所述价值锚定种子词构建 价值语义拓扑空间; 对所述价值锚定种子词进行 扩充, 得到初始主题锚定词集; 对所述初始主题 锚定词进行更新, 得到优化主题锚定词集; 以所 述优化主题锚定词为约束, 获得价值语义文本的 多簇网状结构表示; 对多个跨领域文本进行锚定 约束, 构建价值链知识图谱。 本发明可 以提高模 型对文本语料在价值链决策目标约束下的表示 学习能力, 并支持价值链跨领域、 多主体文本语 料的关联分析, 以了解各主体 之间的价值主张与 协同程度, 为产业价值链协同提供决策支持方法 与工具。 权利要求书2页 说明书5页 附图2页 CN 115168600 A 2022.10.11 CN 115168600 A 1.一种个性 化定制下的价 值链知识发现方法, 其特 征在于, 包括以下步骤: S1、 对给定领域文本划定价 值主题, 进行价 值锚定种子词抽取; S2、 根据所述 价值锚定种子词构建价 值语义拓扑空间; S3、 对所述 价值锚定种子词进行扩充, 得到初始主题锚定词集; S4、 对所述初始主题锚定词进行 更新, 得到优化主题锚定词集; S5、 以所述优化主题锚定词为约束, 获得价 值语义文本的多簇网状结构表示; S6、 对多个跨领域文本 重复步骤S1 ‑S5进行锚定约束, 构建价 值链知识图谱。 2.根据权利要求1所述的一种个性化定制下的价值链知识发现方法, 其特征在于, 步骤 S1具体为: 对给定领域文本进行分词 得到文本词序列并划定价值主题, 提取所述文本词序 列中的概念名词与描述词 作为初始词, 利用通用文本编 码方法对所述概念名词 与描述词进 行编码处理得到通用语料下的词文本向量, 计算所述价值主题内每个初始词之 间的语义距 离, 在每个主题中找出至少3个与其 他初始词之间语义距离最近的词作为 价值锚定种子词。 3.根据权利要求1所述的一种个性化定制下的价值链知识发现方法, 其特征在于, 步骤 S2具体为: 计算所述价值锚定种子词与所述给定领域文本中其他词的语义距离; 清除掉与 所述价值锚定种子词的语义距离大于第一预设阈值的词, 并通过预设拓扑持续同调参数将 以所述价值锚定种子词为中心的文本度量空间转变成价 值语义拓扑空间。 4.根据权利要求1所述的一种个性化定制下的价值链知识发现方法, 其特征在于, 步骤 S3具体为: 在所述价值语义拓扑空间的一个价值主题中, 将与主题词的语义距离小于第一 预设阈值的价值锚定种子词个数作为所述主题词对所述价值锚定种子词的命中个数, 根据 命中个数计算所述主题词在所述价值主题内的锚定命中概率, 将所述锚定命中概率大于 50%的主题词 作为扩充词扩充到价值锚定种子词中, 获得由价值锚定种子词和扩充词形成 的初始主题锚定词集。 5.根据权利要求1所述的一种个性化定制下的价值链知识发现方法, 其特征在于, 步骤 S4具体为: 在所述价值语义拓扑 空间的一个价值主题中, 选中任一初始主题锚定词, 统计选 中初始主题锚定词 与其他初始主题锚定词的语义距离, 将与选中初始主题锚定词的语义距 离小于第二预设阈值的其他初始主题锚定词个数作为命中个数, 根据命中个数计算每个选 中初始主题锚定词在初始主题锚定词集中的命中概率, 将命中概率最高的前3个初始主题 锚定词作为新的锚定种子词, 以新的锚定种子词作为初始锚定种子词, 重复步骤S3得到优 化主题锚定词集。 6.根据权利要求1所述的一种个性化定制下的价值链知识发现方法, 其特征在于, 步骤 S5具体为: 在所述价值语义拓扑空间中, 计算优化主题锚定词与所述给定领域文本其他词 之间的语义距离, 将与优化主题锚定词语义距离小于第三预设阈值的词归入优化主题锚定 词所属的价值主题, 以给定的个性化定制决策目标为约束对价值主题内语义距离小于第四 阈值的文本内容进行聚合, 并根据时间窗口分析得到所述价值主题的演化规律; 基于所述 个性化定制决策目标对所述价值主题进行 “主体‑描述”链状结构表示, 得到多链聚合的网 状结构主题表示; 将词与词之间的锚定命中关系转换成连接关系, 以所述优化主题锚定词 为约束对价值语义拓扑空间进行拓扑持续同调, 调整语义拓扑空间中词 连接的稠密度, 如 果优化主题锚定词与价值主题内相关词的连接稠密度大于与其他主题内相关词的连接稠 密度, 则在此基础上 形成价值语义文本的多簇网状结构表示。权 利 要 求 书 1/2 页 2 CN 115168600 A 27.根据权利要求1所述的一种个性化定制下的价值链知识发现方法, 其特征在于, 步骤 S6具体为: 在价值语义拓扑 空间中, 利用步骤S1 ‑S5对其他跨领域文本语料进 行锚定语义下 的知识表示, 基于给定决策目标对跨领域文本进行拓扑持续同调, 得到跨领域文本中价值 对齐的语义特征, 并基于给定决策目标的语义特征抽取跨领域、 多主体之 间的关联关系, 得 到由文本为节点、 文本关联关系为连接的价 值链知识图谱。权 利 要 求 书 2/2 页 3 CN 115168600 A 3

.PDF文档 专利 一种个性化定制下的价值链知识发现方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种个性化定制下的价值链知识发现方法 第 1 页 专利 一种个性化定制下的价值链知识发现方法 第 2 页 专利 一种个性化定制下的价值链知识发现方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。