说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211031968.1 (22)申请日 2022.08.26 (71)申请人 山大地纬软件股份有限公司 地址 250101 山东省济南市高新区港兴一 路300号 (72)发明人 于秋波 程秋晨 徐喆 朱晓洪  郭伟 赵丁丁 姚保岐 李旭升  张建军 董雪  (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 赵妍 (51)Int.Cl. G06V 30/412(2022.01) G06N 20/00(2019.01) G06V 30/413(2022.01)G06V 30/418(2022.01) (54)发明名称 基于光学字符识别的医保零星报销 目录匹 配方法及系统 (57)摘要 本发明涉及目录匹配技术领域, 提供了基于 光学字符识别的医保零星报销目录匹配方法及 系统, 包括: 获取费用清单图像; 采用OCR深度学 习模型对费用清单图像进行文本检测和文本识 别, 得到若干个文本框、 以及每个文本框的位置 和包含的字符; 将文本框进行行对齐和列对齐 后, 与目录库进行匹配, 以得到医保报销信息。 可 以自适应提取不同医院不同类型表格图片内容, 节省了人工设计规则和模板的繁琐流 程。 权利要求书2页 说明书8页 附图1页 CN 115376150 A 2022.11.22 CN 115376150 A 1.基于光学字符识别的医保零星报销目录匹配方法, 其特 征在于, 包括: 获取费用清单图像; 采用OCR深度学习模型对费用清单图像进行文本检测和文本识别, 得到若干个文本框、 以及每个文本框的位置和包 含的字符; 将文本框进行行对齐和列对齐后, 与目录库进行匹配, 以得到医保报销 信息。 2.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法, 其特征在于, 所述行对齐的具体方法为: 若两个文本框之间的纵向重叠比位于指定范围内, 这两个文本 框属于一行。 3.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法, 其特征在于, 所述列对齐的方法为: 将含有目标字符的文本 框, 作为列名文本 框; 对于每个列名文本 框, 根据横向重 叠比和距离, 选取匹配参 考坐标; 对于每一行中的每个文本框, 计算与不同列的匹配参考坐标的重叠范围, 选取最大重 叠范围对应的匹配参 考坐标作为文本 框的分列依据。 4.如权利要求3所述的基于光学字符识别的医保零星报销目录匹配方法, 其特征在于, 根据所述横向重 叠比选取匹配参 考坐标的具体方法为: 对于某个列名文本框A, 计算与所有非列名文本框的横向重叠比, 将横向重叠比在 设定 范围内的非列名文本 框全部加入匹配坐标集 合; 在匹配坐标集合中选取出与列名文本框A重叠度最高的非列名文本框T, 并将非列名文 本框T的坐标设置为列名文本 框A的匹配参 考坐标。 5.如权利要求3所述的基于光学字符识别的医保零星报销目录匹配方法, 其特征在于, 根据所述距离 选取匹配参 考坐标的具体方法为: 对于某个列名文本框A, 若与 所有非列名文本框的横向重叠比均不在设定范围内, 则检 索与列名文本 框A距离最近的非列名文本 框T; 若与非列名文本框T距离最近的列名文本框, 与列名文本框A含有的字符相同, 则将非 列名文本框T的坐标设置为列名文本框A对应的匹配参考坐标; 否则, 将列名文本框A的坐标 设置为列名文本 框A对应的匹配参 考坐标。 6.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法, 其特征在于, 在采用OCR深度学习模型对 费用清单图像进行文本检测和文本识别之前, 对 费用清单图像 进行预处理; 所述预处理包括: 对费用清单图像进行去噪、 平滑和色度增强后, 检测图像 中的直线信 息, 利用霍夫变换对倾 斜图像进行矫 正。 7.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法, 其特征在于, 所述OCR深度学习模型包括文本检测模型和文本识别模型; 所述文本检测模型使用可微分二 值化网络结构; 所述文本识别模型使用卷积循环神经网络和连接时序分类结构的深度学习模型。 8.基于光学字符识别的医保零星报销目录匹配系统, 其特 征在于, 包括: 图像获取模块, 其被 配置为: 获取费用清单图像; OCR模块, 其被配置为: 采用OCR深度学习模型对费用清单图像进行文本检测和文本识权 利 要 求 书 1/2 页 2 CN 115376150 A 2别, 得到若干个文本 框、 以及每 个文本框的位置和包 含的字符; 目录匹配模块, 其被配置为: 将文本框进行行对齐和列对齐后, 与目录库进行匹配, 以 得到医保报销 信息。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执 行时实现如权利要求1 ‑7中任一项 所述的基于光学字 符识别的医保零星报销目录匹配方法 中的步骤。 10.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7中任一项 所述的基 于光学字符识别的医保零星报销目录匹配方法中的步骤。权 利 要 求 书 2/2 页 3 CN 115376150 A 3

.PDF文档 专利 基于光学字符识别的医保零星报销目录匹配方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于光学字符识别的医保零星报销目录匹配方法及系统 第 1 页 专利 基于光学字符识别的医保零星报销目录匹配方法及系统 第 2 页 专利 基于光学字符识别的医保零星报销目录匹配方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:04:42上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。