说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210616914.5 (22)申请日 2022.06.01 (71)申请人 国家计算机网络与信息安全管理中 心 地址 100000 北京市朝阳区裕民路甲3号 (72)发明人 宁珊 石瑾 李鹏 高圣翔 计哲 万辛 刘发强 孙旭东 倪善金 齐帅 许高尚 王拓 (74)专利代理 机构 天津玺名律师事务所 12 263 专利代理师 杨琳 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 16/35(2019.01) G06N 20/00(2019.01) (54)发明名称 一种包含历史深度语义特定文本的识别方 法及系统 (57)摘要 本发明涉及一种包含历史深度语义特定文 本的识别方法及系统, 所述一种包含历史深度语 义特定文本的识别方法包括: 利用历史深度语义 特定文本数据进行初始处理得到历史深度语义 特定文本初始数据; 利用所述历史深度语义特定 文本初始数据得到历史深度语义特定文本识别 结果, 通过大数据分析特定文本进行模型训练, 并对特定内容的语义特征进行分析筛除, 进而进 行分类、 识别及定性, 提升了对于特定文本的识 别准确率, 避免误差的产生。 权利要求书1页 说明书4页 附图1页 CN 115238703 A 2022.10.25 CN 115238703 A 1.一种包 含历史深度语义特定文本的识别方法, 其特 征在于, 包括: 利用历史深度语义特定文本数据进行初始处 理得到历史深度语义特定文本初始数据; 利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果。 2.根据权利要求1所述的一种 包含历史深度语义特定文本的识别方法, 其特征在于, 所 述利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据包 括: 利用所述历史深度语义特定文本数据根据基础字词进行分词处理得到历史深度语义 特定文本分词数据; 判断所述历史深度语义特定文本分词数据中是否存在歧义结果, 若是, 则对所述历史 深度语义特定文本 分词数据进 行标注得到历史深度语义特定文本标注数据, 否则输出历史 深度语义特定文本分词数据作为历史深度语义特定文本标注数据; 利用所述历史深度语义特定文本标注数据基于NER得到历史深度语义特定文本专名识 别数据; 利用所述历史深度语义特定文本专名识别数据进行去除停用词处理得到历史深度语 义特定文本初始数据; 其中, 所述基础字词为存在实际含义的词语。 3.根据权利要求1所述的一种 包含历史深度语义特定文本的识别方法, 其特征在于, 利 用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果包括: 将所述历史深度语义特定文本初始数据带入预先训练的历史深度语义特定文本识别 模型得到历史深度语义特定文本识别结果。 4.根据权利要求3所述的一种 包含历史深度语义特定文本的识别方法, 其特征在于, 所 述历史深度语义特定文本识别模型的训练包括: 利用所述历史深度语义特定文本初始数据作为训练集; 以训练集为输入, 以训练集中各历史深度语义特定文本初始数据对应的识别结果为输 出, 基于Transformers进行训练得到历史深度语义特定文本识别模型。 5.一种基于N LP的深度语义理解识别系统, 其特 征在于, 包括: 处理模块, 用于利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定 文本初始数据; 识别模块, 用于利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本 识别结果。权 利 要 求 书 1/1 页 2 CN 115238703 A 2一种包含历史深度语 义特定文本的识别方 法及系统 技术领域 [0001]本发明涉及特定本文识别领域, 具体涉及 一种包含历史深度语义特定文本的识别 方法及系统。 背景技术 [0002]现阶段采用前沿深度学习算法, 基于历史积累的特定内容样本库, 互联 网、 文件等 文本中的特定内容信息识别引擎。 识别引擎经过多个项目实战优化迭代, 已成为国内首屈 一指的集高效、 精 准和智能的文本内容识别引擎。 使用NLP技术进 行自然语义理解, 但在NLP 领域, 深度语义相似度的计算一直是个难题。 传统方法虽然可以有效分析出文本语义语境 内容, 但是 无法对其实际表达的特定内容进行准确定性。 发明内容 [0003]针对现有技术的不足, 本发明提供了一种包含历史深度语义特定文本的识别方 法, 通过对特定文本的预处理, 再进行识别模型 的训练, 大幅提升了模型的识别准确 性, 对 于深度语义识别效率有显著提升 。 [0004]为实现上述目的, 本发明提供了一种包含历史深度语义特定文本的识别方法, 包 括: [0005]利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始 数据; [0006]利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果。 [0007]优选的, 所述利用历史深度语义特定文本数据进行初始处理得到历史深度语义特 定文本初始数据包括: [0008]利用所述历史深度语义特定文本数据根据基础字词进行分词处理得到历史深度 语义特定文本分词数据; [0009]判断所述历史深度语义特定文本分词数据 中是否存在歧义结果, 若是, 则对所述 历史深度语义特定文本 分词数据进行标注得到历史深度语义特定文本标注数据, 否则输出 历史深度语义特定文本分词数据作为历史深度语义特定文本标注数据; [0010]利用所述历史深度语义特定文本标注数据基于NE R得到历史深度语义特定文本专 名识别数据; [0011]利用所述历史深度语义特定文本专名识别数据进行去除停用词处理得到历史深 度语义特定文本初始数据; [0012]其中, 所述基础字词为存在实际含义的词语。 。 [0013]优选的, 利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识 别结果包括: [0014]利用所述历史深度语义特定文本初始数据带入预先训练的历史深度语义特定文 本识别模型 得到历史深度语义特定文本识别结果。说 明 书 1/4 页 3 CN 115238703 A 3
专利 一种包含历史深度语义特定文本的识别方法及系统
文档预览
中文文档
7 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 14:07:05
上传分享
举报
下载
原文档
(321.8 KB)
分享
友情链接
ISO-IEC-IEEE 29119-1 2022 Software and systems engineering - Software testing - Part 1 General concepts.pdf
ISO 22435 2024 Gas cylinders — Cylinder valves with integrated pressure regula.pdf
ISO 22662 2024 Milk and milk products — Determination of lactose content by.pdf
ISO 12224-1 2024 Solder wire solid and flux-cored Specification and test methods Part 1 Classification and performance requirements.pdf
ISO 21308-1 2018 Road vehicles Product data exchange between chassis and bodywork manufacturers (BEP) Part 1 General principles.pdf
ISO 603-9 2024 Bonded abrasive products — Dimensions — Part 9 Grinding wheels.pdf
ISO 7076-6 2016 Fire protection — Foam fire extinguishing systems — Part 6 Vehicle mounted compressed air foam systems.pdf
ISO IEC 26550 2015 Software and systems engineering — Reference model for product line engineering and management.pdf
ISO 13879 1999 Petroleum and natural gas industries — Content and drafting of a functional specification.pdf
ISO 13799 2020 Ships and marine technology Ship s mooring and towing fittings Recessed bitts (casting type).pdf
GB-T 20658-2006 原油和液体石油产品 粘稠烃的体积计量.pdf
GB-T 24136-2009 橡胶或塑料涂覆织物 耐液体性能的测定.pdf
GB-T 4167-2024 砝码.pdf
GB-T 41146-2021 绝缘液体取样方法.pdf
GB-T 21355-2022 无损检测 基于存储磷光成像板的工业计算机射线照相检测 系统分类.pdf
GB-T 17127.2-1997 农业轮式拖拉机和机具 三点悬挂挂接器 第2部分 A型框架式挂接器.pdf
GB-T 44452-2024 工业过程测量控制和自动化 系统和部件的生命周期管理.pdf
GB-T 12204-2010 金属切削 基本术语.pdf
GB-T 23129-2008 家用咖啡机性能测试方法.pdf
GB 9448-1999 焊接与切割安全.pdf
1
/
3
7
评价文档
赞助1.5元 点击下载(321.8 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。