说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210603759.3 (22)申请日 2022.05.30 (71)申请人 平安资产管理有限责任公司 地址 200120 上海市浦东 新区中国(上海) 自由贸易试验区陆家嘴环路1333号 29-31楼 (72)发明人 董基宇 (74)专利代理 机构 北京英特普罗知识产权代理 有限公司 1 1015 专利代理师 邵煜程 (51)Int.Cl. G06F 8/10(2018.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 一种分类需求文档的方法、 装置、 计算机设 备及存储介质 (57)摘要 本发明公开了一种分类需求文档的方法、 装 置、 计算机设备及存储介质, 所述方法包括: 获取 待分类的需求文档, 并提取需求文档中的关键词 以得到第一 关键词集合; 根据预设的需求场景字 典为第一关键词集合中的关键词添加场景要素 标签; 当在第一关键词集合中包含目标安全需求 场景所对应的全部场景要素标签时, 将添加有目 标安全需求场景的场景要素标签的关键词形成 第二关键词集合; 判断第二关键词集合中任意两 个关键词之间的文本距离是否均小于预设距离, 若是, 则将需求文档发送至与目标安全需求场景 对应的处理平台进行安全需求处理; 本发明通过 为需求文档中的关键词添加标签来分类需求文 档。 权利要求书2页 说明书9页 附图2页 CN 114879938 A 2022.08.09 CN 114879938 A 1.一种分类需求文档的方法, 其特 征在于, 所述方法包括: 获取待分类的需求文档, 并提取 所述需求文档中的关键词以得到第一关键词集 合; 根据预设的需求场景字典为所述第一关键词集合中的关键词添加场景要素标签; 其 中, 所述需求场景字典包含多个安全需求场景、 以及每个安全需要场景所对应的多个场景 要素标签; 当在所述第 一关键词集合中包含目标安全需求场景所对应的全部场景要素标签时, 将 添加有所述目标安全需求场景的场景要素 标签的关键词形成第二关键词集 合; 判断所述第 二关键词集合中任意两个关键词之间的文本距离是否均小于预设距离, 若 是, 则将所述需求文档发送至与所述目标安全需求场景对应的处理平台进行安全需求处 理。 2.根据权利要求1所述的分类需求文档的方法, 其特征在于, 所述根据 预设的需求场景 字典为所述第一关键词集 合中的关键词添加场景要素 标签, 具体包括: 针对所述第 一关键词集合中的目标关键词, 分别计算所述目标关键词与各个场景要素 标签的语义相似度; 确定出最大语义相似度, 并当所述最大语义相似度大于预设相似度阈值时, 将所述最 大语义相似度对应的场景要素 标签添加给 所述目标关键词。 3.根据权利要求2所述的分类需求文档的方法, 其特征在于, 所述针对所述第 一关键词 集合中的目标关键词, 分别计算所述 目标关键词与各个场景要素标签的语义相似度, 具体 包括: 计算所述目标关键词与目标场景要素 标签的余弦距离; 计算所述目标关键词与所述目标场景要素 标签的编辑距离; 将所述余弦距离和所述编辑距离的加权平均值作为所述目标关键词和所述目标场景 要素标签的语义相似度。 4.根据权利要求2所述的分类需求文档的方法, 其特征在于, 在所述获取待分类的需求 文档, 并提取 所述需求文档中的关键词以得到第一关键词集 合之前, 所述方法还 包括: 获取训练样本并提取 所述训练样本中的关键词以形成第三关键词集 合; 获取用于为关键词添加目标场景要素 标签的目标 标注函数; 使用所述目标标注函数计算所述第三关键词集合中的关键词与所述目标场景要素标 签的语义相似度, 并为语义相似度大于预设相似度阈值的关键词的标注结果设置为正标 注; 获取对所述训练样本经 过人工标注得到的标准样本; 将所述标准样本中添加有所述目标场景要素标签的关键词与所述训练样本中为正标 注的关键词进行对比, 以计算出 所述目标 标注函数对所述训练样本的标注准确率; 判断所述标注准确率是否达到预设准确率阈值, 若否, 则修正所述目标标注函数的参 数直至基于修 正后的目标 标注函数计算出的标注准确率达 到预设准确率阈值。 5.根据权利要求4所述的分类需求文档的方法, 其特征在于, 所述针对所述第 一关键词 集合中的目标关键词, 分别计算所述 目标关键词与各个场景要素标签的语义相似度, 具体 包括: 使用各个标注函数分别计算所述目标关键词与 各个场景要素标签的语义相似度, 并根权 利 要 求 书 1/2 页 2 CN 114879938 A 2据计算出的语义相似度确定出目标关键词针对各个标注函数的标注结果。 6.根据权利要求5所述的分类需求文档的方法, 其特征在于, 所述当所述最大语义相似 度大于预设相似度阈值时, 将所述最大语义相似度对应的场景要 素标签添加给所述目标关 键词, 具体包括: 当所述目标关键词仅存在一个为正标注的标注结果 时, 为所述目标关键词添加与生成 正标注的标注函数对应的场景要素 标签; 当所述目标关键词存在多个为正标注的标注结果 时, 从生成正标注的标注函数中确定 出使得所述目标关键词的语义相似度最大的标注函数, 并将确定出的标注函数所对应的场 景要素标签添加给 所述目标关键词。 7.根据权利要求1所述的分类需求文档的方法, 其特征在于, 按照如下方式计算所述第 二关键词集 合中任意两个关键词之间的文本距离: 将所述第二关键词集合中的关键词在所述需求文档中的列位置作为所述关键词的横 坐标x, 以及 在所述需求文档中的行位置作为所述关键词的纵坐标y; 获取所述第二关键词集合 中一个关键词的坐标(x1, y1)以及另一个关键词的坐标(x2, y2), 并按照文本距离公式: 计算两个关键词之间的文 本距离。 8.一种分类需求文档的装置, 其特 征在于, 所述装置包括: 提取模块, 用于获取待分类的需求文档, 并提取所述需求文档 中的关键词以得到第一 关键词集 合; 添加模块, 用于根据 预设的需求场景字典为所述第 一关键词集合中的关键词添加场景 要素标签; 其中, 所述需求场景字典包含多个安全需求场景、 以及每个安全需要场景所对应 的多个场景要素 标签; 形成模块, 用于当在所述第 一关键词集合中包含目标安全需求场景所对应的全部场景 要素标签时, 将添加有所述目标安全需求场景的场景要素标签的关键词形成第二关键词集 合; 判断模块, 用于判断所述第 二关键词集合中任意两个关键词之间的文本距离是否均小 于预设距离, 若是, 则将所述需求文档发送至与所述 目标安全需求场景对应的处理平台进 行安全需求处 理。 9.一种计算机设备, 所述计算机设备包括: 存储器、 处理器以及存储在所述存储器上并 可在所述处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实 现权利要求1至7中任一项所述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114879938 A 3
专利 一种分类需求文档的方法、装置、计算机设备及存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 14:07:02
上传分享
举报
下载
原文档
(565.3 KB)
分享
友情链接
ISO 8538 1999 Aerospace — Nuts, hexagonal, self-locking, with counterbore and captive washer, with MJ threads, classifications 1 100 MPa (at ambient temperature.pdf
ISO 10058-3 2008 Chemical analysis of magnesite and dolomite refractory products (alternative to the X-ray fluorescence method) — Part 3 Flame atomic absorption spectrophotometry.pdf
ISO 5455 1979 Technical drawings — Scales.pdf
ISO IEC TR 15413 2001 Information technology — Font services — Abstract service def.pdf
ISO 21849 2022 Aircraft and space — Industrial data — Product identification and traceability.pdf
ISO 23132 2020 Road vehicles Extended Vehicle (ExVe) time critical applications General requirements definitions and classification methodology of time-constrained situations related to Road and ExV.pdf
ISO-TS 20428 2024 Genomics Informatics Data elements and their metadata for describing structured clinical genomic sequence information in electronic health records.pdf
ISO 1598 1990 Plastics - Cellulose acetate — Determination of insoluble particles.pdf
ISO 25178-604 2013 Geometrical product specifications (GPS) — Surface texture Areal — Part 604 Nominal characteristics of non-contact (cohe.pdf
ISO 22241-1 2019 Diesel engines — NOx reduction agent AUS 32 — Part 1 Quality requirements.pdf
GB-T 20159.2-2008 环境条件分类 环境条件分类与环境试验之间的关系及转换指南 运输.pdf
GB-T 6370-2012 表面活性剂 阴离子表面活性剂 水中溶解度的测定.pdf
GB-T 28954-2012 汽车发动机 旋装式机油滤清器 连接尺寸.pdf
GB-T 39281-2020 气体保护电弧焊用高强钢实心焊丝.pdf
GB-T 40017-2021 信息技术 系统间远程通信和信息交换 社区节能控制异构网络融合与可扩展性.pdf
GB-T 43458-2023 二手货出口贸易.pdf
GB-T 690-2008 化学试剂 苯.pdf
GB-T 968-2007 丝锥螺纹公差.pdf
GB-T 42462-2023 化妆品色谱分析结果确认准则.pdf
GB-T 43523-2023 信息与文献 应急准备和响应.pdf
1
/
3
14
评价文档
赞助1.5元 点击下载(565.3 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。