说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211008302.4 (22)申请日 2022.08.22 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张魏斌  (74)专利代理 机构 北京英赛 嘉华知识产权代理 有限责任公司 1 1204 专利代理师 王达佐 马晓亚 (51)Int.Cl. G06V 10/96(2022.01) G06V 30/42(2022.01) G06V 30/414(2022.01) G06F 9/50(2006.01) G06F 9/54(2006.01) (54)发明名称 用于识别图像文字的方法、 装置、 设备、 介质 和产品 (57)摘要 本公开提供了用于识别图像文字的方法、 装 置、 设备、 介质和产品, 涉及人工智能技术领域, 具体为计算机视觉技术领域。 具体实现方案为: 将试题标识文件分割为多个试题标识子文件; 将 多个试题标识子文件传输至第一消息队列; 从第 一消息队列中循环读取试题标识子文件; 基于多 个进程, 并发处理试题标识子文件, 得到与每个 试题标识子文件相匹配的试题标识集合; 对于每 个试题标识, 响应于确定该试题标识对应的试题 内容中包含图像, 将试题内容发送给第二消息队 列, 以使第二消息队列对图像进行光学字符识 别。 本实现方式可以提高OCR识别效率。 权利要求书2页 说明书10页 附图5页 CN 115331089 A 2022.11.11 CN 115331089 A 1.一种用于识别图像文字的方法, 包括: 将试题标识文件分割为多个试题标识子文件; 将多个所述试题标识子文件传输 至第一消息队列; 从所述第一消息队列中循环读取 所述试题标识子文件; 基于多个进程, 并发处理所述试题标识子文件, 得到与每个所述试题标识子文件相匹 配的试题标识集合; 其中, 所述进程的数量与所述第一消息队列中的试题标识子文件数量 相同, 所述试题标识集合是从所述试题标识子文件包含的各个试题标识中确定出 的、 预设 数量个试题标识组成的集 合; 对于每个试题标识, 响应于确定该试题标识对应的试题内容中包含图像, 将所述试题 内容发送给第二消息队列, 以使 所述第二消息队列对所述图像进 行光学字 符识别; 其中, 一 个试题标识对应一个试题内容。 2.根据权利要求1所述的方法, 其中, 所述基于多个进程, 并发处理所述试题标识子文 件, 得到与每 个所述试题标识子文件相匹配的试题标识集 合, 包括: 对于每个所述试题标识子文件, 利用所述试题标识子文件对应的进程, 按照所述试题 标识子文件中的试题标识顺序, 从所述试题标识子文件中获取所述预设数量个试题标识; 其中, 每个所述试题标识子文件 对应的进程并发执 行; 基于所述预设数量个试题标识, 生成与 所述试题标识子文件相匹配的所述试题标识集 合。 3.根据权利要求2所述的方法, 还 包括: 对于所述试题标识集合中每个试题标识对应的试题内容, 确定该试题内容对应的图像 判别结果; 其中, 所述图像判别结果 为包含图像或者 不包含图像; 响应于所述试题标识集合中各试题标识对应的试题内容均已确定所述图像判别结果, 从所述试题标识 集合相匹配的所述试题标识子文件中重新获取所述预设数量个试题标识, 并基于重新获取的所述预设数量个试题标识更新所述试题标识集 合。 4.根据权利要求3所述的方法, 还 包括: 对于所述试题标识集合中每个试题标识对应的试题内容, 响应于该试题内容已确定所 述图像判别结果, 将该试题标识存储至所述试题 标识集合相匹配的所述试题 标识子文件对 应的日志文件。 5.根据权利要求 4所述的方法, 还 包括: 响应于所述试题标识子文件中各试题标识均已存储至所述日志文件, 将所述日志文件 移动至指定文件目录存 储; 基于所述指定文件目录中的文件, 更新所述试题标识子文件。 6.根据权利要求 4所述的方法, 还 包括: 基于所述指定文件目录中的文件, 确定识别进度信息 。 7.一种用于识别图像文字的装置, 包括: 文件分割单 元, 被配置成将试题标识文件分割为多个试题标识子文件; 文件传输单 元, 被配置成将多个所述试题标识子文件传输 至第一消息队列; 文件读取 单元, 从所述第一消息队列中循环读取 所述试题标识子文件; 标识确定单元, 被配置成基于多个进程, 并发处理所述试题标识子文件, 得到与每个所权 利 要 求 书 1/2 页 2 CN 115331089 A 2述试题标识子文件相匹配的试题标识集合; 其中, 所述进程的数量与所述第一消息队列中 的试题标识子文件数量相同, 所述试题标识 集合是从所述试题标识子文件包含的各个试题 标识中确定出的、 预设数量个试题标识组成的集 合; 图像识别单元, 被配置成对于每个试题标识, 响应于确定该试题标识对应的试题内容 中包含图像, 将所述试题内容发送给第二消息队列, 以使所述第二消息队列对所述图像进 行光学字符识别; 其中, 一个试题标识对应一个试题内容。 8.根据权利要求7 所述的装置, 其中, 所述标识确定单 元进一步被配置成: 对于每个所述试题标识子文件, 利用所述试题标识子文件对应的进程, 按照所述试题 标识子文件中的试题标识顺序, 从所述试题标识子文件中获取所述预设数量个试题标识; 其中, 每个所述试题标识子文件 对应的进程并发执 行; 基于所述预设数量个试题标识, 生成与 所述试题标识子文件相匹配的所述试题标识集 合。 9.根据权利要求8所述的装置, 所述标识确定单 元进一步被配置成: 对于所述试题标识集合中每个试题标识对应的试题内容, 确定该试题内容对应的图像 判别结果; 其中, 所述图像判别结果 为包含图像或者 不包含图像; 响应于所述试题标识集合中各试题标识对应的试题内容均已确定所述图像判别结果, 从所述试题标识 集合相匹配的所述试题标识子文件中重新获取所述预设数量个试题标识, 并基于重新获取的所述预设数量个试题标识更新所述试题标识集 合。 10.根据权利要求8所述的装置, 还 包括: 文件处理单元, 被配置成对于所述试题标识集合中每个试题标识对应的试题内容, 响 应于该试题内容已确定所述图像判别结果, 将该试题标识存储至所述试题标识 集合相匹配 的所述试题标识子文件 对应的日志文件。 11.根据权利要求10所述的装置, 其中, 所述文件处 理单元进一步被配置成: 响应于所述试题标识子文件中各试题标识均已存储至所述日志文件, 将所述日志文件 移动至指定文件目录存 储; 基于所述指定文件目录中的文件, 更新所述试题标识子文件。 12.根据权利要求10所述的装置, 其中, 所述文件处 理单元进一步被配置成: 基于所述指定文件目录中的文件, 确定识别进度信息 。 13.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑6中任一项所述的方法。 14.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑6中任一项所述的方法。 15.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1 ‑6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115331089 A 3

.PDF文档 专利 用于识别图像文字的方法、装置、设备、介质和产品

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于识别图像文字的方法、装置、设备、介质和产品 第 1 页 专利 用于识别图像文字的方法、装置、设备、介质和产品 第 2 页 专利 用于识别图像文字的方法、装置、设备、介质和产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:14:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。