说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210616914.5 (22)申请日 2022.06.01 (71)申请人 国家计算机网络与信息安全管理中 心 地址 100000 北京市朝阳区裕民路甲3号 (72)发明人 宁珊 石瑾 李鹏 高圣翔 计哲  万辛 刘发强 孙旭东 倪善金  齐帅 许高尚 王拓  (74)专利代理 机构 天津玺名律师事务所 12 263 专利代理师 杨琳 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 16/35(2019.01) G06N 20/00(2019.01) (54)发明名称 一种包含历史深度语义特定文本的识别方 法及系统 (57)摘要 本发明涉及一种包含历史深度语义特定文 本的识别方法及系统, 所述一种包含历史深度语 义特定文本的识别方法包括: 利用历史深度语义 特定文本数据进行初始处理得到历史深度语义 特定文本初始数据; 利用所述历史深度语义特定 文本初始数据得到历史深度语义特定文本识别 结果, 通过大数据分析特定文本进行模型训练, 并对特定内容的语义特征进行分析筛除, 进而进 行分类、 识别及定性, 提升了对于特定文本的识 别准确率, 避免误差的产生。 权利要求书1页 说明书4页 附图1页 CN 115238703 A 2022.10.25 CN 115238703 A 1.一种包 含历史深度语义特定文本的识别方法, 其特 征在于, 包括: 利用历史深度语义特定文本数据进行初始处 理得到历史深度语义特定文本初始数据; 利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果。 2.根据权利要求1所述的一种 包含历史深度语义特定文本的识别方法, 其特征在于, 所 述利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据包 括: 利用所述历史深度语义特定文本数据根据基础字词进行分词处理得到历史深度语义 特定文本分词数据; 判断所述历史深度语义特定文本分词数据中是否存在歧义结果, 若是, 则对所述历史 深度语义特定文本 分词数据进 行标注得到历史深度语义特定文本标注数据, 否则输出历史 深度语义特定文本分词数据作为历史深度语义特定文本标注数据; 利用所述历史深度语义特定文本标注数据基于NER得到历史深度语义特定文本专名识 别数据; 利用所述历史深度语义特定文本专名识别数据进行去除停用词处理得到历史深度语 义特定文本初始数据; 其中, 所述基础字词为存在实际含义的词语。 3.根据权利要求1所述的一种 包含历史深度语义特定文本的识别方法, 其特征在于, 利 用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果包括: 将所述历史深度语义特定文本初始数据带入预先训练的历史深度语义特定文本识别 模型得到历史深度语义特定文本识别结果。 4.根据权利要求3所述的一种 包含历史深度语义特定文本的识别方法, 其特征在于, 所 述历史深度语义特定文本识别模型的训练包括: 利用所述历史深度语义特定文本初始数据作为训练集; 以训练集为输入, 以训练集中各历史深度语义特定文本初始数据对应的识别结果为输 出, 基于Transformers进行训练得到历史深度语义特定文本识别模型。 5.一种基于N LP的深度语义理解识别系统, 其特 征在于, 包括: 处理模块, 用于利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定 文本初始数据; 识别模块, 用于利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本 识别结果。权 利 要 求 书 1/1 页 2 CN 115238703 A 2一种包含历史深度语 义特定文本的识别方 法及系统 技术领域 [0001]本发明涉及特定本文识别领域, 具体涉及 一种包含历史深度语义特定文本的识别 方法及系统。 背景技术 [0002]现阶段采用前沿深度学习算法, 基于历史积累的特定内容样本库, 互联 网、 文件等 文本中的特定内容信息识别引擎。 识别引擎经过多个项目实战优化迭代, 已成为国内首屈 一指的集高效、 精 准和智能的文本内容识别引擎。 使用NLP技术进 行自然语义理解, 但在NLP 领域, 深度语义相似度的计算一直是个难题。 传统方法虽然可以有效分析出文本语义语境 内容, 但是 无法对其实际表达的特定内容进行准确定性。 发明内容 [0003]针对现有技术的不足, 本发明提供了一种包含历史深度语义特定文本的识别方 法, 通过对特定文本的预处理, 再进行识别模型 的训练, 大幅提升了模型的识别准确 性, 对 于深度语义识别效率有显著提升 。 [0004]为实现上述目的, 本发明提供了一种包含历史深度语义特定文本的识别方法, 包 括: [0005]利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始 数据; [0006]利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果。 [0007]优选的, 所述利用历史深度语义特定文本数据进行初始处理得到历史深度语义特 定文本初始数据包括: [0008]利用所述历史深度语义特定文本数据根据基础字词进行分词处理得到历史深度 语义特定文本分词数据; [0009]判断所述历史深度语义特定文本分词数据 中是否存在歧义结果, 若是, 则对所述 历史深度语义特定文本 分词数据进行标注得到历史深度语义特定文本标注数据, 否则输出 历史深度语义特定文本分词数据作为历史深度语义特定文本标注数据; [0010]利用所述历史深度语义特定文本标注数据基于NE R得到历史深度语义特定文本专 名识别数据; [0011]利用所述历史深度语义特定文本专名识别数据进行去除停用词处理得到历史深 度语义特定文本初始数据; [0012]其中, 所述基础字词为存在实际含义的词语。 。 [0013]优选的, 利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识 别结果包括: [0014]利用所述历史深度语义特定文本初始数据带入预先训练的历史深度语义特定文 本识别模型 得到历史深度语义特定文本识别结果。说 明 书 1/4 页 3 CN 115238703 A 3

.PDF文档 专利 一种包含历史深度语义特定文本的识别方法及系统

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种包含历史深度语义特定文本的识别方法及系统 第 1 页 专利 一种包含历史深度语义特定文本的识别方法及系统 第 2 页 专利 一种包含历史深度语义特定文本的识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。