说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210331613.8 (22)申请日 2022.03.31 (71)申请人 迈容智能科技 (上海) 有限公司 地址 200433 上海市杨 浦区邯郸路10号8号 楼309室 (72)发明人 吴昆  (74)专利代理 机构 上海诺衣知识产权代理事务 所(普通合伙) 31298 专利代理师 衣然 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/14(2022.01) G06V 30/18(2022.01) G06V 30/413(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 40/02(2012.01) (54)发明名称 银行回单识别方法、 系统、 设备及存 储介质 (57)摘要 本发明公开了一种银行回单识别方法, 它包 括: 获取待识别的银行回单图像; 检测出所述银 行回单图像的表 格区域; 采用图像页面分割算法 对表格区域的图像进行文字检测, 以得到多个被 判定为文字区域的子图; 将所述多个被判定为文 字区域的子图串联起来, 以得到待识别的文字区 域; 对所述待识别的文字区域进行文字识别, 以 实现图像数据至文字数据的转化。 相应的, 本发 明还提供一种银行回单识别系统、 电子设备以及 存储介质。 本发 明可以有效满足对不同样式银行 回单进行信息提取的需求, 进而显著提高银行回 单的识别效率。 权利要求书2页 说明书10页 附图6页 CN 114898371 A 2022.08.12 CN 114898371 A 1.一种银 行回单识别方法, 其特 征在于, 包括: 获取待识别的银 行回单图像; 检测出所述银行回单图像的表格区域; 采用图像页面分割算法对表格区域的图像进行文字检测, 以得到多个被判定为文字区 域的子图; 将所述多个 被判定为文字区域的子图串联起 来, 以得到待识别的文字区域; 对所述待识别的文字区域进行文字识别, 以实现图像数据至文字数据的转 化。 2.根据权利要求1所述的银行回单识别方法, 其特征在于, 所述检测出所述银行回单图 像的表格区域包括: 采用基于U ‑Net网络的语义分割模型对所述银 行回单图像的表格区域进行检测; 采用生成对抗网络对检测出的表格区域的整体形状进行约束。 3.根据权利要求2所述的银行回单识别方法, 其特征在于, 所述采用基于U ‑Net网络的 语义分割模型对所述银 行回单图像的表格区域进行检测包括: 所述银行回单图像 被分割为多个联通区域; 所述检测出 所述银行回单图像的表格区域还 包括: 选取最大 联通区域作为 候选表格区域; 填充候选表格区域内的联通区域使其作为表格区域的一部分; 以及 基于候选表格区域的边界轮廓确定表格区域的四个顶点。 4.根据权利要求3所述的银行回单识别方法, 其特征在于, 所述基于候选表格区域的边 界轮廓确定表格区域的四个顶点包括: 检测出候选区域 边界的轮廓; 将所述轮廓的曲线折线化, 对图像 轮廓点进行多边形拟合; 确定拟合得到的多边形的所有顶点的位置; 以距离所述银 行回单图像四个顶点 最近的四个点, 作为表格区域的四个顶点。 5.根据权利要求1所述的银行回单识别方法, 其特征在于, 所述采用图像页面分割算法 对表格区域的图像进行文字检测, 以得到多个 被判定为文字区域的子图包括: 采用投影法对表格区域的图像进行列分割, 得到若干包 含一行文字的图片; 采用基于长短时记忆网络和条件随机场的序列标注模型对所述若干包含一行文字的 图片进行 行分割, 得到多个 被判定为文字区域的子图。 6.根据权利要求1所述的银行回单识别方法, 其特征在于, 所述对所述待识别的文字区 域进行文字识别包括: 通过基于注意力机制的文字识别模型对所述待识别的文字区域进行文字识别。 7.根据权利要求1所述的银行回单识别方法, 其特征在于, 所述对所述待识别的文字区 域进行文字识别还 包括: 建立一映射表, 所述映射表的键为银行回单中同一目标字段的多种别称字样, 值为归 类后的字段名; 通过所述映射表将银 行回单中同一目标字段的不同别称字样映射 为归类后的字段名。 8.一种银 行回单识别系统, 其特 征在于, 包括: 获取模块, 用以获取待识别的银 行回单图像;权 利 要 求 书 1/2 页 2 CN 114898371 A 2第一检测模块, 用以检测出 所述银行回单图像的表格区域; 第二检测模块, 用以采用图像页面分割算法对表格区域的图像进行文字检测, 以得到 多个被判定为文字区域的子图; 串联模块, 用以将所述多个被判定为文字区域的子 图串联起来, 以得到待识别的文字 区域; 以及 识别模块, 用以对所述待识别的文字区域进行文字识别, 以实现图像数据至文字数据 的转化。 9.一种存储介质, 其特征在于, 所述存储介质上存储有计算机程序, 所述计算机程序被 处理器运行时执 行如权利要求1至7中任一项所述银 行回单识别方法的步骤。 10.一种电子设备, 其特 征在于, 所述电子设备包括: 处理器; 存储介质, 其上存储有计算机程序, 所述计算机程序被所述处理器运行时执行如权利 要求1至7中任一项所述银 行回单识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 114898371 A 3

.PDF文档 专利 银行回单识别方法、系统、设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 银行回单识别方法、系统、设备及存储介质 第 1 页 专利 银行回单识别方法、系统、设备及存储介质 第 2 页 专利 银行回单识别方法、系统、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:04:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。