说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111611363.5 (22)申请日 2021.12.27 (71)申请人 天翼物联科技有限公司 地址 510335 广东省广州市海珠区 阅江西 路366号广报中心南塔21层 (72)发明人 张建雄 杨震 龚晟 李洁  彭晓春  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 代理人 郑宏谋 (51)Int.Cl. G06V 10/22(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) G06V 10/75(2022.01) (54)发明名称 一种行业场景化的OCR模型实现系统、 方法 及设备 (57)摘要 本发明公开了一种行业场景化的OCR模 型实 现系统、 方法及设备, 本发明通过设置行业场景 化知识库、 行业场景化OCR模型、 行业场景化OCR 理解模块以及第三方行业资源检索接口, 对待识 别图片进行OCR识别, 根据OCR识别结果以及所述 行业场景化知识库进行场景化理解处理, 确定行 业拟合置信度, 当所述行业拟合置信度小于置信 度阈值, 获取行业补充资源, 结合行业场景化知 识库、 行业场景化OCR模型、 行业场景化OCR理解 模块, 提高不同行业场景下的识别适应性, 提高 识别准确性; 通过第三方行业资源检索接口获取 的行业补 充资源有利于进一步提高识别准确性, 本发明可广泛应用于文字识别领域。 权利要求书2页 说明书6页 附图1页 CN 114373068 A 2022.04.19 CN 114373068 A 1.一种行业场景化的OCR模型实现系统, 其特 征在于, 包括: 行业场景化知识库; 行业场景化OCR模型, 用于对待识别图片进行OCR识别; 行业场景化OCR理解模块, 用于根据OCR识别结果以及所述行业场景化知识库进行场景 化理解处 理, 确定行业拟合置信度; 第三方行业资源检索接口, 用于当所述行业拟合置信度小于置信度阈值, 获取行业补 充资源。 2.根据权利要求1所述行业场景化的OCR模型实现系统, 其特征在于: 所述行业场景化 OCR理解模块, 具体地用于对 所述OCR识别结果以及所述行业场景化知识库进 行行业特征匹 配拟合处 理, 对行业特 征匹配拟合处 理结果进行场景化理解, 确定行业拟合置信度。 3.根据权利要求1所述行业场景化的OCR模型实现系统, 其特征在于: 所述第三方行业 资源检索接口, 具体地用于当所述行业拟合置信度小于置信度阈值, 进行相关行业知识库 检索、 互联网搜索引擎以及社交网络搜索中的至少一种以确定多个检索文本, 计算所述检 索文本的文本置信度, 将所述文本置信度由高至低进行排列, 将排名靠前 的预设数量个检 索文本作为行业补充资源。 4.根据权利要求1所述行业场景化的OCR模型实现系统, 其特征在于: 所述行业场景化 的OCR模型实现系统还包括通用OCR模 型, 所述通用OCR模 型包括通用文字识别模块、 通用卡 证识别模块、 票据单据识别模块、 车牌/标牌识别模块以及通用文档识别模块中的至少一 种。 5.根据权利要求1所述行业场景化的OCR模型实现系统, 其特征在于: 所述行业场景化 的OCR模型实现系统还包括OCR/推理框架, 所述OCR/推理框架用于根据所述行业补充资源 对所述行业场景化OCR模型进行训练更新。 6.一种行业场景化的OCR模型实现方法, 其特征在于, 应用于行业场景化的OCR模型实 现系统, 包括: 通过行业场景化OCR模型对待识别图片进行OCR识别; 根据OCR识别结果以及行业场景化知识库进行场景化理解处 理, 确定行业拟合置信度; 当所述行业拟合置信度小于置信度阈值, 调用第 三方行业资源检索接口获取行业补充 资源。 7.根据权利 要求6所述行业场景化的OCR模型实现方法, 其特征在于: 所述根据OCR识别 结果以及行业场景化知识库进行场景化理解处 理, 确定行业拟合置信度, 包括: 对所述OCR识别结果以及所述行业场景化知识库进行 行业特征匹配拟合处 理; 对行业特 征匹配拟合处 理结果进行场景化理解, 确定行业拟合置信度。 8.根据权利要求6或7所述行业场景化的OCR模型实现方法, 其特征在于: 所述当所述行 业拟合置信度小于 置信度阈值, 调用第三方 行业资源检索接口获取 行业补充资源, 包括: 当所述行业拟合置信度小于置信度阈值, 进行相关行业知识库检索、 互联网搜索引擎 以及社交网络 搜索中的至少一种以确定多个 检索文本; 计算所述检索文本的文本 置信度; 将所述文本置信度由高至低进行排列, 将排名靠前的预设数量个检索文本作为行业补 充资源。权 利 要 求 书 1/2 页 2 CN 114373068 A 29.一种电子设备, 其特征在于, 所述电子设备包括处理器和存储器, 所述存储器中存储 有至少一条指 令、 至少一段程序、 代码集 或指令集, 所述至少一条指 令、 所述至少一段程序、 所述代码集或指令集由所述处 理器加载并执 行以实现如权利要求6 ‑8中任一项所述方法。 10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一条指令、 至 少一段程序、 代码集或指令集, 所述至少一条指令、 所述至少一段程序、 所述代码集或指令 集由处理器加载并执 行以实现如权利要求6 ‑8中任一项所述方法。权 利 要 求 书 2/2 页 3 CN 114373068 A 3

.PDF文档 专利 一种行业场景化的OCR模型实现系统、方法及设备

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种行业场景化的OCR模型实现系统、方法及设备 第 1 页 专利 一种行业场景化的OCR模型实现系统、方法及设备 第 2 页 专利 一种行业场景化的OCR模型实现系统、方法及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:15:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。