说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210620493.3 (22)申请日 2022.06.02 (71)申请人 江南大学 地址 214100 江苏省无锡市梁 溪区通沙路 898号南楼七层 (72)发明人 谢振平 黄兆欣 李玉林 朱航宇  刘渊 詹千熠  (74)专利代理 机构 无锡华源专利商标事务所 (普通合伙) 32228 专利代理师 过顾佳 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06Q 50/18(2012.01) (54)发明名称 一种专利技 术演化脉络的提取方法 (57)摘要 本发明公开了一种专利技术演化脉络的提 取方法, 涉及文本信息处理技术, 该方法基于自 然语言处理对每个专利文本进行语义分析, 借鉴 联想记忆机制将专利文本中的主从权利要求引 用关系转变为上下位语义关联关系, 同时联合共 现关系构造时间维度和空间维度上的词语节点 之间的全局联想网络, 此外引入TextRank方法计 算全局联想网络中的词语节点的节 点权重, 通过 节点权重和边联想强度提取得到的专利技术演 化脉络。 提取到的专利技术演化脉络可以清晰地 指示专利技术的演化发展 过程, 分析不同时间的 技术研究热点, 并且为知识 推荐提供个性化的服 务, 提供的信息更丰富且又有价值, 对个性化知 识推荐具有显著的价 值意义。 权利要求书4页 说明书11页 附图7页 CN 114880477 A 2022.08.09 CN 114880477 A 1.一种专利技 术演化脉络的提取 方法, 其特 征在于, 所述方法包括: 构建专利样本集, 所述专利样本集中包括若干专利文本; 基于自然语言处理对每个专利文本进行语义分析, 构建得到所述专利文本的局部联想 网络, 所述局部联想网络指示所述专利文本中包括的词语节点之 间的语义联想 关系以及联 想强度; 对所有专利文本的局部联想网络按照专利文本的申请日的先后顺序合并得到所有专 利文本的全局联想网络, 所述全局联想网络指示所述专利样本集中所有专利文本包含的所 有语义联想关系及其联想强度, 以及同一个词语节点随着时间顺序的继承演化关系; 基于词语节点之间在时间维度和空间维度的相互影响、 利用时空维度Text Rank模型计 算得到所述全局联想网络中的各个词语节点的节点权 重; 基于各个词语节点的节点权重以及每两个词语节点之间的联想强度, 确定通过所述全 局联想网络指示的语义联想关系和继承演化关系形成的词语节点之间的各条联想演化路 径的路径联想强度, 并根据路径联想强度确定词语节点之间的最优联想演化路径, 由不同 词语节点之间的最优联想演化路径提取 得到专利技 术演化脉络 。 2.根据权利要求1所述的方法, 其特征在于, 构建得到所述专利文本的局部联想网络, 包括对于所述专利文本: 确定所述专利文本 中所有存在直接语义联想关系的词语节点对, 以及确定所述专利文 本中所有通过各自的中介线索词存在间接语义联想 关系的词语节点对, 所述直接语义联想 关系指示由词语节点对中的一个词语节点直接语义联想得到另一个词语节点, 所述间接语 义联想关系指示由词语节点对中的一个词语节点通过对应的中介线索词间接语义联想得 到另一个词语节点; 对得到的所有存在直接语义联想关系的词语节点对进行合并去重, 并根据词语节点对 中两个词语节点的相对位置索引确定所述词语节点对之 间的语义联想 关系的联想强度, 构 建得到所述专利文本的局部联想网络, 所述局部联想网络中包括若干个互不相同的词语节 点, 且每个词语节点与至少一个其他词语节点存在语义联想关系, 每两个词语节点之间的 语义联想关系具有相应的联想强度。 3.根据权利要求2 所述的方法, 其特征在于, 对于所述专利文本中任意的词语节点wmn和 词语节点 wmn': 当词语节点wmn和词语节点wmn'位于所述专利文本的同一个段落内的同一个句子中时, 确定词语节点wmn和词语节点wmn'构成一对存在直接语义联想关系的词语节点对, 且所述直 接语义联想关系指示由相对位置在前的词语节点wmn直接语义联想得到相对位置在后的词 语节点wmn'; 和/或, 当词语节点wmn位于上位段落Pm内的句子Smj中、 词语节点wmn'位于下位段落Pm'内 的句子Sm'j'中, 所述下位段落Pm'引用所述上位段落Pm, 且句子Smj中和句子Sm'j'中存在同一 个中介线索词wt时, 确定词语节点wmn和词语节点wmn'通过中介线索词wt构成一对存在间接 语义联想关系的词语节点对, 且所述间接语 义联想关系指示由相对位置在前的词语节点wmn 通过中介线索词wt间接语义联想得到相对位置在后的词语节点wmn', 其中中介线索词wt与词 语节点wmn和词语节点 wmn'不同。 4.根据权利要求3所述的方法, 其特征在于, 由词语节点a语义联想得到词语节点b的语权 利 要 求 书 1/4 页 2 CN 114880477 A 2义联想关系的联想强度为: 其中, Rd(a,b)表示词语节点a和词语节点b之间的直接语义联想关系的强度, Rs(a,b)表 示词语节点a和词语节点b之间的间接语义联想关系的强度; 当词语节点a和词语节点b之间仅存在间接语义联想关系时, Rd(a,b)=0; 当词语节点a 和词语节点b之间存在至少一组直接语义联想关系时, 每组直接语义联想关系的强度Rd(a, b)=Ia‑Ib, Ia是所述直接语义联想关系中的词语节点a的相对位置索引, Ib是所述直接语义 联想关系中的词语节点b的相对位置索引; 当词语节点a和词语节点b之间仅存在直接语义联想关系时, Rs(a,b)=0; 当词语节点a 和词语节点b之间存在至少一组间接语义联想关系时, 每组间接语义联想关系的强度 是所述间接语义联想关系中的词语节点a的相对位置 索引, 是所述间接语义联想关系中的词语节点b的相对位置索引, 是与词语节点a位于 同一个段落内的同一个句子中的中介线索词c的相对位置索引, 是与词语节点b位于同一 个段落内的同一个句子中的中介线索词c的相对位置索引。 5.根据权利要求1所述的方法, 其特征在于, 所述专利样本集中的所有专利文本的申请 日覆盖若干个连续的时间段, 所述 合并得到所有专利文本的全局联想网络, 包括: 对申请日位于同一个时间段内的所有专利文本的局部联想网络中的相同的词语节点 进行合并去重, 得到各个时间段 的段内联想网络, 所述段内联想网络指示申请日位于同一 个时间段内的所有专利文本包 含的所有语义联想关系及对应的联想强度; 确定每一个时间段的段内联想网络中的词语节点继承演化相邻的前一个时间段的段 内联想网络中的相同的词语节点, 得到每相 邻两个时间段之间的相同的词语节点的继承演 化关系, 合并得到所述全局联想网络 。 6.根据权利要求5所述的方法, 其特征在于, 所述全局联想网络中的时间段t 的段内联 想网络中的词语节点Vi的节点权 重St(Vit)为: 其中, d为阻尼系数且d<1, 反映词语节点Vit在空间维度受到的影 响, 是时间段t的段内联想网络中指向词语节点Vi的词语节点Vj的节点权重, 是词 语节点Vj指向词语节点Vi的权重, 表示词语节点Vj在时间段t内指向其他词语节 点的权重之和;权 利 要 求 书 2/4 页 3 CN 114880477 A 3

.PDF文档 专利 一种专利技术演化脉络的提取方法

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种专利技术演化脉络的提取方法 第 1 页 专利 一种专利技术演化脉络的提取方法 第 2 页 专利 一种专利技术演化脉络的提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:06:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。