说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111666177.1 (22)申请日 2021.12.31 (71)申请人 富联智能工坊 (郑州) 有限公司 地址 451162 河南省郑州市航空港区华夏 大道与东海路交叉口7号楼 (72)发明人 陈文钦 詹念怡 刘静静 刘炜博 (74)专利代理 机构 深圳市赛恩倍吉知识产权代 理有限公司 4 4334 专利代理师 孙哲 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/289(2020.01) G06F 40/295(2020.01) G06N 3/04(2006.01) (54)发明名称 三元组预测模型的训练方法、 介质、 生成装 置及服务器 (57)摘要 本申请提出一种三元组预测模型的训练方 法, 包括对三元组训练文本进行切割, 形成至少 两个文本段, 确定文本段中的每一三元组的完整 性, 完整的三元组包括一一对应的实际实体词、 实际关系词, 将完整的文本段输入 预设关系抽取 模型, 以抽取 实际关系词并形成实际关系词预测 模型, 以便后续用户使用包含有该关系词预测模 型的检索数据库进行信息查询, 提高非结构化文 本的信息获取效率。 本申请提出一种包含三元组 预测模型的训练方法的介质和三元组预测模型 的生成装置。 本申请还提供一种包含关系词预测 模型的服 务器。 权利要求书2页 说明书17页 附图9页 CN 114510578 A 2022.05.17 CN 114510578 A 1.一种三元组预测模型的训练方法, 其中, 包括 步骤: 对三元组训练文本进行切割, 形成至少两个文本段; 确定所述文本段中的每一三元组的完整性, 其中, 完整的所述三元组包括一一对应的 实际实体词、 实际关系词; 将三元组完整的所述文本段输入预设关系抽取模型, 以抽取所述实际关系词并形成关 系词预测模型。 2.如权利要求1所述的三元组预测模型的训练方法, 其中, 还 包括步骤: 获取第一切割长度值; 基于所述第一切割长度值, 确定所述训练文本的长度不小于所述第一切割长度值; 基于确定所述训练文本的长度不小于所述第一切割长度值, 判定所述训练文本可切 割。 3.如权利要求2所述的三元组预测模型的训练方法, 其中, 两个所述文本段为第 一文本 段和第二文本段, 所述确定所述文本段中的每一 三元组的完整性的步骤 包括: 检测所述第一文本段中的每一 三元组是否 完整; 若完整, 则判定所述第一文本段中的每一 三元组完整; 若所述第一文本段中具有不完整的三元组, 则基于所述第一切割长度值, 生成第二切 割长度值; 基于所述第二切割长度值, 执行所述对三元组训练文本进行切割, 形成至少两个文本 段的步骤。 4.如权利要求1所述的三元组预测模型的训练方法, 其中, 还 包括步骤: 将第一测试集输入所述预测关系模型, 所述第 一测试集包括关系词测试文本和关系词 测试数量; 基于所述预测关系模型, 检测所述第一测试集中的关系词实际数量; 基于所述关系词测试 数量和所述实际数量, 判断所述预测关系模型的准确率; 若所述准确率在第一预设范围, 将所述预测关系模型确定为 最终关系模型。 5.如权利要求1所述的三元组预测模型的训练方法, 其中, 还 包括步骤: 分析所述文本段中三元组的实际关系词数量; 基于所述实际关系词数量扩充对应数量的所述文本段; 基于与所述实 际关系词数量对应的所述文本段、 预设实体抽取模型, 抽取实 际实体词 并形成实体预测模型。 6.如权利要求5所述的三元组预测模型的训练方法, 其中, 还 包括步骤: 将第二测试集输入所述实体关系模型, 所述第 二测试集包括实体词测试文本和实体词 测试数量; 基于所述预测实体模型, 检测所述第二测试集中的实体词实际数量; 基于所述实体词测试 数量和所述实际数量, 判断所述预测实体模型的准确率; 若所述准确率在第二预设范围, 将所述预测实体模型确定为 最终实体模型。 7.如权利要求6所述的三元组预测模型的训练方法, 其中, 还 包括步骤: 将所述最终实体模型和所述 最终关系模型生成三元组预测模型。 8.如权利要求5所述的三元组预测模型的训练方法, 其中, 所述实体预测模型包括:权 利 要 求 书 1/2 页 2 CN 114510578 A 2BERT预训练模型、 CNN预训练模型、 BiLSTM预训练模型、 CRF预训练模型, 所述基于与所述关 系词数量对应的所述文本段、 预设实体抽取模型, 抽取所述实际实体词并形成实体预测模 型的步骤 包括: 基于所述BERT预训练模型, 将所述文本段转化为CNN预训练模型及所述BiLSTM预训练 模型均可识别的语言文本; 基于所述CN N预训练模型, 识别所述语言文本中预计实际关系词; 基于所述Bi LSTM预训练模型, 识别所述语言文本中预计实体词; 将所述预计关系词和所述预计实体词形成预计三元组; 确定所述预计三元组中的所述预计关系词与所述关系词预测模型中的所述实际关系 词相同; 基于所述预计三元组中的所述预计关系词与所述关系词预测模型中的所述实际关系 词相同, 所述CRF预训练模型将所述预计三元组中的所述预计实际实体词约束为所述实际 实体词并形成所述实体预测模型。 9.如权利要求8所述的三元组预测模型的训练方法, 其中, 所述预计三元组均为多个, 所述基于与所述关系词 数量对应的所述文本段、 预设实体抽取模型, 抽取所述实体词 形成 实体预测模型的步骤 还包括: 基于所述预计三元组, 判断所述预计三元组中的所述预计实体词及对应的所述预计关 系的识别率是否大于第一预设值; 确定所述预计三元组中的所述预计实体词及对应的所述预计关系的识别率大于第一 预设值, CRF预训练模型则将所述预计三元组中的所述预计实体约束为所述实际实体词并 形成所述实体预测模型。 10.如权利要求1所述的三元组预测模型的训练方法, 其中, 还 包括步骤: 接收由非结构化文本转换的待标注文本; 接收基于待标注文本 完成的标注文本, 并形成所述 三元组训练文本 。 11.一种介质, 其中, 所述介质用于存储计算机程序, 所述计算机程序在被处理器执行, 以实现如权利要求1 ‑10中任意 一项所述的三元组预测模型的训练方法。 12.一种三元组预测模型的生成装置, 其中, 包括存储器、 处理器和通讯接口, 所述存储 器通过所述通讯接口与所述处 理器通信连接; 以及 所述存储器中存储有计算机程序, 所述计算机程序由所述处理器加载并执行如权利要 求1至10中任意 一项所述的三元组预测模型的训练方法。 13.一种服务器, 其中, 包括存储器, 用于存储检索数据库, 所述检索数据库包括权利要 求5‑9任意一项所述实体预测模型和所述关系词预测模型。权 利 要 求 书 2/2 页 3 CN 114510578 A 3
专利 三元组预测模型的训练方法、介质、生成装置及服务器
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 00:19:22
上传分享
举报
下载
原文档
(1.3 MB)
分享
友情链接
GB-T 21062.3-2007 政务信息资源交换体系 第3部分:数据接口规范.pdf
GB-T 35347-2017 机动车安全技术检测站.pdf
T-GCHA 1.1—2018 定制家居产品 人造板定制衣柜 第1部分:术语和定义.pdf
DB34-T 4686-2024 挥发性有机物走航监测技术规范 安徽省.pdf
T-SAASS 127—2023 单粒精播花生种子生产与加工技术规程.pdf
GB-T 5048-2017 防潮包装.pdf
GB-T 32831-2016 高能激光光束质量评价与测试方法.pdf
DB4205-T 63-2019 磷石膏及其综合利用产品质量标准 宜昌市.pdf
TOGAF 业务架构.pdf
GB-T 25329-2010 企业节能规划编制通则.pdf
tc260 人工智能安全标准化白皮书 2019.pdf
GA-T 1547-2019 信息安全技术 移动智能终端用户数据存储安全技术要求和测试评价方法.pdf
GB-T 14926.22-2001 实验动物 小鼠肝炎病毒检测方法.pdf
长江证券 软件与服务行业研究-信创系列深度之GPU 破晓而生踏浪前行.pdf
GB-T 18314-2009全球定位系统(GPS)测量规范.pdf
国内外数据治理模型对比分析.pdf
GB 29384-2012 乙酰甲胺磷原药.pdf
GB-T 30732-2014 煤的工业分析方法 仪器法.pdf
GB-T 30127-2013 纺织品 远红外性能的检测和评价.pdf
GB-T 25767-2010 滚动轴承 圆锥滚子.pdf
1
/
3
29
评价文档
赞助1.5元 点击下载(1.3 MB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。