说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210608453.7 (22)申请日 2022.05.31 (71)申请人 深圳壹账通智能科技有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 蒋宏达 陈家豪 徐亮  (74)专利代理 机构 深圳众鼎专利商标代理事务 所(普通合伙) 44325 专利代理师 姚章国 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/242(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 用于文本检测的模型训练方法、 装置、 计算 机设备及 介质 (57)摘要 本发明涉及人工智能技术领域, 尤其涉及一 种用于文本检测的模型训练方法、 装置、 计算机 设备及介质。 该方法将训练文本输入模板预测模 型得到预训练模板, 并确定预训练模板与多个人 工模板的相似度最大值为训练参考值, 将训练文 本与预训练模板拼接为预检测文本, 输入文本检 测模型, 得到 预检测结果, 根据预检测结果、 标注 以及训练参考值, 训练模板预测模型, 再将训练 文本输入训练好的模板预测模型, 将输出的预测 模板与训练文本拼接为检测文本, 并输入文本检 测模型, 得到检测结果, 根据检测结果和标注, 训 练文本检测模型, 得到训练好的文本检测模型, 采用预测模板能够有效地提高文本检测模型的 训练效率和准确性, 以及文本检测模 型的泛化能 力。 权利要求书3页 说明书13页 附图3页 CN 114925700 A 2022.08.19 CN 114925700 A 1.一种用于文本检测的模型训练方法, 其特 征在于, 所述方法包括: 将已知标注 的训练文本输入模板预测模型得到预训练模板后, 将所述预训练模板与N 个人工模板进行相似度计算, 确定计算结果的最大值 为训练参 考值, N为大于零的整数; 将所述训练文本与 所述预训练模板拼接构 成的预检测文本, 输入预训练好的文本检测 模型, 得到预检测结果; 根据所述预检测结果与所述训练文本的标注的比较结果, 以及所述训练参考值, 更新 所述模板预测模型的参数, 迭代直至收敛, 得到训练好的模板预测模型; 将所述训练文本输入所述训练好的模板预测模型, 输出的预测模板与 所述训练文本拼 接构成检测文本, 并将所述检测文本 输入预训练好的文本检测模型, 得到检测结果; 根据所述检测结果与所述训练文本的标注的比较结果, 更新所述文本检测模型的参 数, 迭代直至收敛, 得到训练好的文本检测模型。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述将所述预训练模板与N个人 工模板进行相似度计算, 确定计算结果的最大值 为训练参 考值包括: 使用预训练好的语义模型, 提取所述预训练模板的预测词向量以及N个人工模板的人 工词向量; 计算所述预测词向量与每个人工词向量的余弦相似度, 确定N个余弦相似度中的最大 值为训练参 考值。 3.根据权利要求2所述的模型训练方法, 其特征在于, 所述预测词向量包括M个预测词 项, 所述人工词向量包括K个人工词项, M和K均为大于零的整数; 在所述提取所述预训练模板的预测词向量以及N个人工模板的人工词向量之后, 还包 括: 针对任一人工词向量, 采用最大权匹配算法, 将所述预测词向量的预测词项与人工词 向量的人工词项 进行匹配, 得到对应预测词项的匹配人工词项; 提取所有 匹配人工词项在所述人工词向量中的位置顺序, 按照所述位置顺序 更新对应 预测词项在所述预测词向量中的位置顺序, 得到更新的预测词向量; 所述计算所述预测词向量与每 个人工词向量的余弦相似度包括: 计算更新后的预测词向量与更新所使用的人工词向量的余弦相似度。 4.根据权利要求1所述的模型训练方法, 其特征在于, 所述预检测结果包括文本预检测 类别和对应的预检测置信度; 所述根据所述预检测结果与所述训练文本的标注的比较结果, 以及所述训练参考值, 更新所述模板预测模型的参数, 迭代直至收敛, 得到训练好的模板预测模型包括: 将所述文本预检测类别与所述训练文本的标注进行比较, 得到第一比较结果, 所述第 一比较结果包括相同和不相同; 根据所述第一比较结果, 确定预训练指标值, 所述第 一比较结果为相同时, 所述预训练 指标值为所述对应的预检测置信度, 所述第一比较结果为不相同时, 所述预训练指标值为 第一预设值; 根据所述训练参考值和所述预训练指标值更新所述模板预测模型的参数, 迭代直至收 敛, 得到训练好的模板预测模型。 5.根据权利要求4所述的模型训练方法, 其特征在于, 所述根据 所述训练参考值和所述权 利 要 求 书 1/3 页 2 CN 114925700 A 2预训练指标值更新所述模板预测模型 的参数, 迭代直至 收敛, 得到训练好的模板预测模型 包括: 根据所述训练参考值和所述预训练指标值计算第 一损失函数, 以所述第 一损失函数为 依据, 采用梯度下降法反向更新所述模板预测模型 的参数, 迭代直至所述第一损失函数收 敛, 得到训练好的模板预测模型, 其中, 所述第一损失函数 具体为: L1=k1(s‑1)2+k2(p1‑1)2 其中, L1为所述第一损失函数, s为所述训练参考值, 值域为[0, 1], p1为所述预训练指标 值, 值域为[0, 1], k1为第一权 重, k2为第二权 重。 6.根据权利要求1至5任一项所述的模型训练方法, 其特征在于, 所述检测结果包括文 本检测类别和对应的检测置信度; 所述根据 所述检测结果与 所述训练文本的标注的比较结果, 更新所述文本检测模型的 参数, 迭代直至收敛, 得到训练好的文本检测模型包括: 将所述文本检测类别与所述训练文本的标注进行比较, 得到第二比较结果, 所述第二 比较结果包括相同和不相同; 根据所述第二比较结果, 确定训练指标值, 所述第 二比较结果为相同时, 所述训练指标 值为所述对应的检测置信度, 所述第二比较结果为不相同时, 所述训练指标值为第二预设 值; 根据所述训练指标值更新所述文本检测模型的参数, 迭代直至收敛, 得到训练好的文 本检测模型。 7.根据权利要求6所述的模型训练方法, 其特征在于, 所述根据 所述训练指标值更新所 述文本检测模型的参数, 迭代直至收敛, 得到训练好的文本检测模型包括: 根据所述训练指标值计算第二损 失函数, 以所述第二损 失函数为依据, 采用 梯度下降 法反向更新所述文本检测模型 的参数, 直至所述第二损失函数收敛, 得到训练好的文本检 测模型, 其中, 所述第二损失函数 具体为: L2=k3(p2‑1)2 其中, L2为所述第二损失函数, p2为所述训练指标值, 值 域为[0, 1], k3为第三权 重值。 8.一种用于文本检测的模型训练装置, 其特 征在于, 所述模型训练装置包括: 参考值计算模块, 用于将已知标注的训练文本输入模板预测模型得到预训练模板后, 将所述预训练模板与N个人工模板进 行相似度计算, 确定计算结果的最大值为训练参考值, N为大于零的整数; 预检测模块, 用于将所述训练文本与所述预训练模板拼接构成的预检测文本, 输入预 训练好的文本检测模型, 得到预检测结果; 预测模型训练模块, 用于根据所述预检测结果与所述训练文本的标注的比较结果, 以 及所述训练参考值, 更新所述模板预测模型的参数, 迭代直至收敛, 得到训练好的模板预测 模型; 检测模块, 用于将所述训练文本输入所述训练好的模板预测模型, 输出的预测模板与 所述训练文本拼接构成检测文本, 并将所述检测文本输入预训练好的文本检测模型, 得到 检测结果; 检测模型训练模块, 用于根据所述检测结果与所述训练文本的标注的比较结果, 更新权 利 要 求 书 2/3 页 3 CN 114925700 A 3

.PDF文档 专利 用于文本检测的模型训练方法、装置、计算机设备及介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于文本检测的模型训练方法、装置、计算机设备及介质 第 1 页 专利 用于文本检测的模型训练方法、装置、计算机设备及介质 第 2 页 专利 用于文本检测的模型训练方法、装置、计算机设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。