(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111668252.8
(22)申请日 2021.12.31
(71)申请人 智慧芽信息科技 (苏州) 有限公司
地址 215000 江苏省苏州市工业园区金鸡
湖大道88号人工智能产业园G3-701、
G3-801、 G3-901、 G3-1001单元
(72)发明人 夏宇彬 王超超 王为磊 屠昶旸
张济徽
(74)专利代理 机构 北京林达刘知识产权代理事
务所(普通 合伙) 11277
代理人 刘新宇
(51)Int.Cl.
G06F 16/33(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种文献功效展示方法及装置、 电子 设备和
存储介质
(57)摘要
本公开涉及一种文 献功效展示方法及 装置、
电子设备和存储介质, 所述方法包括: 抽取文献
文本中表 示功效的关键词, 所述 关键词包括功效
属性, 所述功效属性表示产生功效的主体的属
性; 基于已有功效属性, 将所述功效属性进行标
准化, 得到标准化功效属性; 根据标准化功效属
性, 对所述文献文本的功效进行展示。 本公开实
施例, 一方面, 通过功效属性的标准化, 实现对文
本文献的归类管理; 另一方面, 通过标准化功效
属性对文献文本的功效进行展示, 简要概括该文
献具体在哪一方面(即标准化功效属性)取得了
技术效果, 以方便文 献所有人在各种场合展示和
推广文献所包含的技术、 文 献阅览人员用最短的
时间了解该文献的技 术方案的研究方向。
权利要求书3页 说明书18页 附图8页
CN 114357112 A
2022.04.15
CN 114357112 A
1.一种文献功效展示方法, 其特 征在于, 包括:
抽取文献文本中表示功效的关键词, 所述关键词包括功效属性, 所述功效属性表示产
生功效的主体的属性;
基于已有功效属性, 将所述功效属性进行 标准化, 得到标准 化功效属性;
根据标准 化功效属性, 对所述文献文本的功效进行展示。
2.根据权利要求1所述的方法, 其特征在于, 所述关键词还包括: 功效主体和功效值, 其
中, 所述功效主体表示产生功效的主体, 所述功效值表示所述属性产生的功效;
所述根据标准 化功效属性, 对所述文献文本的功效进行展示, 包括:
展示关键词组, 所述关键词组包括所述功效主体和所述功效值中的至少一个以及所述
标准化功效属性的组合。
3.根据权利要求1或2所述的方法, 其特征在于, 所述根据 标准化功效属性, 对所述文献
文本的功效进行展示, 包括:
在以下至少其中之一中, 根据 标准化功效属性, 对所述文献文本的功效进行展示: 功效
矩阵、 文献列表页面、 文献详情页面。
4.根据权利要求3所述的方法, 其特征在于, 所述功效矩阵的一个维度 是所述文献文本
的技术分类, 另一个维度是 所述标准 化功效属性或所述关键词组;
所述功效矩阵中的节点示出在所述节点对应的技术分类具有所述节点对应的标准化
功效属性或关键词组的文献文本的数量。
5.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法还 包括:
响应于所述标准化功效属性、 所述关键词组或所述节点被触发, 展示所述标准化功效
属性、 所述关键词组或所述节点对应的文献文本的列表。
6.根据权利要求1所述的方法, 其特征在于, 所述基于已有功效属性, 将所述功效属性
进行标准化, 得到标准 化功效属性, 包括:
将所述功效属性与已有功效属性相匹配, 得到匹配结果;
根据所述匹配结果, 确定所述功效属性的标准 化功效属性。
7.根据权利要求6所述的方法, 其特征在于, 所述将所述功效属性与已有功效属性相匹
配, 得到匹配结果, 包括:
将所述功效属性与已有功效属性进行第一匹配操作, 在第一匹配操作成功时, 得到第
一匹配操作成功的功效属性对应的第一匹配结果;
将第一匹配操作未成功的功效属性与已有功效属性的同义词 进行第二匹配操作, 在第
二匹配操作成功时, 得到第二匹配操作成功的功效属性对应的第二匹配结果;
将第二匹配操作未成功的功效属性的后 缀与所述已有功效属性进行第 三匹配操作, 在
第三匹配操作成功时, 得到第三匹配操作成功的功效属性对应的第三匹配结果;
将第三匹配操作未成功的功效属性转换为的词向量, 与 所述已有功效属性的词向量进
行第四匹配操作, 在第四匹配操作成功 时, 得到第四匹配操作成功的功效属 性对应的第四
匹配结果;
其中, 所述第二匹配结果包括已有功效属性, 所述已有功效属性的同义词与所述功效
属性匹配成功;
所述第四匹配结果包括已有功效属性, 所述已有功效属性的词向量与 所述功效属性的权 利 要 求 书 1/3 页
2
CN 114357112 A
2词向量匹配成功;
所述根据所述匹配结果, 确定所述功效属性的标准 化功效属性, 包括:
在所述功效属性的第一匹配操作、 第二匹配操作、 第三匹配操作或第 四匹配操作成功
时, 根据第一匹配结果、 第二匹配结果、 第三匹配结果或第四匹配结果确定标准化功效属
性;
在所述功效属性的第一匹配操作、 第二匹配操作、 第三匹配操作和第 四匹配操作均不
成功时, 将标准 化功效属性设置为 其它。
8.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括:
获取所述文献文本的至少一个短句, 所述短句包括所述文献文本 中相邻点号之间的内
容;
根据同一短句中的关键词、 以及同一段落中的关键词, 确定同一段落中的关键词组;
删除确定的所述文献文本的关键词组中重复的关键词组。
9.根据权利要求8所述的方法, 其特征在于, 所述根据同一短句中的关键词、 以及同一
段落中的关键词, 确定同一段落中的关键词组, 包括:
在同一段落中, 将每个功效属性的标准化功效属性及在所述功效属性之前、 与所述功
效属性距离最近的功效主体作为第一词组;
在同一短句中, 将每个功效值及在所述功效值之前、 与所述功效值距离最近的功效属
性的标准 化功效属性作为第二词组;
将同一段落中包含同一标准化功效属性的一第 一词组和一第 二词组, 合并为一第 三词
组;
将所述第一词组、 所述第二词组、 所述第三词组中的至少一种, 作为所述关键词组。
10.根据权利要求1所述的方法, 其特征在于, 所述已有功效属性包括通用功效属性和
高频功效属性;
其中, 所述 通用功效属性包括 根据TRIZ理论的通用工程 参数得到的功效属性;
所述高频功效属性包括将已有文献中抽取的功效属性按出现频率从高到低得到的预
设数量的功效属性。
11.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
通过第二网络模型, 抽取 所述文献文本中的功效段落;
所述抽取文献文本中表示功效的关键词, 包括:
将所述功效段落输入训练好的第一网络模型, 得到所述关键词。
12.根据权利要求1 1所述的方法, 其特 征在于, 所述方法还 包括:
根据文献文本样本、 以及针对所述文献文本样本中表示功效的关键词的标注, 训练第
一网络模 型, 得到所述训练好的第一网络模型, 所述标注指示关键词为功效主体、 功效属性
或功效值;
其中, 功效主体, 表示产生功效的主体;
功效属性, 表示所述主体的属性;
功效值, 表示所述属性产生的功效。
13.根据权利要求11或12所述的方法, 其特征在于, 所述第一网络模型包括Bert ‑CRF、
LSTM‑CRF或CRF模型。权 利 要 求 书 2/3 页
3
CN 114357112 A
3
专利 一种文献功效展示方法及装置、电子设备和存储介质
文档预览
中文文档
30 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 00:18:47上传分享