说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210657254.5 (22)申请日 2022.06.10 (71)申请人 达而观数据 (成 都) 有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都市天府新区湖畔路 北段366号1栋3楼1号 (72)发明人 吴万杰 文敏 白良俊 纪传俊 纪达麒 陈运文 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 马迪 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/19(2022.01) G06V 30/41(2022.01)G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种图像的语义识别方法、 装置、 设备和存 储介质 (57)摘要 本发明公开了一种图像的语义识别方法、 装 置、 设备和存储介质。 包括: 根据样本字符识别结 果进行训练获取信息抽取训练模 型; 对待测图像 进行光学字符识别获取待测字 符识别结果; 根据 待测字符识别结果进行分割处理获取待测语料, 将待测语料输入信息抽取训练模型获取待测图 像的语义识别结果。 通过较少的样 本字符识别结 果进行训练所 获取的信息抽取训练模 型, 来对待 测字符识别结果进行信息抽取, 从而在无需大量 标注数据的情况下, 就可以实现对 具有多样式文 本分布的图像进行有效的语义识别。 权利要求书2页 说明书9页 附图3页 CN 114898374 A 2022.08.12 CN 114898374 A 1.一种图像的语义识别方法, 其特 征在于, 包括: 根据样本 字符识别结果进行训练获取信息抽取训练模型; 对待测图像进行光学字符识别获取待测字符识别结果; 根据所述待测字符识别结果进行分割处理获取待测语料, 将所述待测语料输入所述信 息抽取训练模型获取 所述待测图像的语义识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别文本进行训练获取 信息抽取训练模型之前, 还 包括: 获取样本图像, 其中, 所述样本图像中包 含字符; 对所述样本图像进行光学字符识别获取包含文本信息和文本位置的所述样本字符识 别结果, 其中, 所述文本位置包含所述文本信息在所述样本图像的起始点位置、 高度和宽 度。 3.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别结果进行训练获取 信息抽取训练模型, 包括: 对所述样本字符识别结果按照指定特征进行聚类获取初始簇团, 其中, 每个初始簇团 中包含至少一个完整语义; 对所述初始簇团进行去噪处理获取样本簇团, 并根据所述样本簇团进行训练获取信 息 抽取训练模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述样本簇团进行训练获取信 息 抽取训练模型, 包括: 确定实体抽取模板, 并根据 所述实体抽取模板和所述样本簇团构建训练语料, 其中, 每 个所述训练语料中包 含实体抽取模板的置信度; 根据所述训练语料对初始信息模型进行训练, 获取 所述信息抽取训练模型。 5.根据权利要求1所述的方法, 其特征在于, 所述对待测图像进行光学字符识别获取待 测字符识别结果, 包括: 对所述待测图像进行光学字符识别获取文本信息和文本位置的所述待测字符识别结 果, 其中, 所述文本位置包 含所述文本信息在所述待测图像的起始点 位置、 高度和宽度。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述待测字符识别结果进行分割 处理获取待测语料, 将所述待测语料输入所述信息抽取训练模型获取所述待测图像的语义 识别结果, 包括: 对所述待测字符识别结果进行聚类处 理获取待测簇团; 根据所述实体抽取模板和所述待测簇团构建待测语料, 其中, 每个待测语料对应至少 两个实体抽取模板; 将所述待测语料输入所述信 息抽取训练模型, 获取待测语料所对应的每个实体抽取模 板的语言概 率; 获取概率最高的实体抽取模板, 并将所述实体抽取模板对应的实体作为所述待测图像 的语义识别结果。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述待测语料输入所述信 息抽取训 练模型获取 所述待测图像的语义识别结果之后, 还 包括: 对所述语义识别结果进行检测;权 利 要 求 书 1/2 页 2 CN 114898374 A 2当确定检测结果 不符合要求时进行报警提 示。 8.一种图像的语义识别装置, 其特 征在于, 包括: 模型训练模块, 用于根据样本 字符识别结果进行训练获取信息抽取训练模型; 待测字符识别结果获取模块, 用于对待测图像进行光学字符识别获取待测字符识别结 果; 语义识别模块, 用于根据所述待测字符识别结果进行分割处理获取待测语料, 将所述 待测语料输入所述信息抽取训练模型获取 所述待测图像的语义识别结果。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114898374 A 3
专利 一种图像的语义识别方法、装置、设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 14:07:09
上传分享
举报
下载
原文档
(539.6 KB)
分享
友情链接
ISO 8538 1999 Aerospace — Nuts, hexagonal, self-locking, with counterbore and captive washer, with MJ threads, classifications 1 100 MPa (at ambient temperature.pdf
ISO 10058-3 2008 Chemical analysis of magnesite and dolomite refractory products (alternative to the X-ray fluorescence method) — Part 3 Flame atomic absorption spectrophotometry.pdf
ISO 5455 1979 Technical drawings — Scales.pdf
ISO IEC TR 15413 2001 Information technology — Font services — Abstract service def.pdf
ISO 21849 2022 Aircraft and space — Industrial data — Product identification and traceability.pdf
ISO 23132 2020 Road vehicles Extended Vehicle (ExVe) time critical applications General requirements definitions and classification methodology of time-constrained situations related to Road and ExV.pdf
ISO-TS 20428 2024 Genomics Informatics Data elements and their metadata for describing structured clinical genomic sequence information in electronic health records.pdf
ISO 1598 1990 Plastics - Cellulose acetate — Determination of insoluble particles.pdf
ISO 25178-604 2013 Geometrical product specifications (GPS) — Surface texture Areal — Part 604 Nominal characteristics of non-contact (cohe.pdf
ISO 22241-1 2019 Diesel engines — NOx reduction agent AUS 32 — Part 1 Quality requirements.pdf
GB-T 20159.2-2008 环境条件分类 环境条件分类与环境试验之间的关系及转换指南 运输.pdf
GB-T 6370-2012 表面活性剂 阴离子表面活性剂 水中溶解度的测定.pdf
GB-T 28954-2012 汽车发动机 旋装式机油滤清器 连接尺寸.pdf
GB-T 39281-2020 气体保护电弧焊用高强钢实心焊丝.pdf
GB-T 40017-2021 信息技术 系统间远程通信和信息交换 社区节能控制异构网络融合与可扩展性.pdf
GB-T 43458-2023 二手货出口贸易.pdf
GB-T 690-2008 化学试剂 苯.pdf
GB-T 968-2007 丝锥螺纹公差.pdf
GB-T 42462-2023 化妆品色谱分析结果确认准则.pdf
GB-T 43523-2023 信息与文献 应急准备和响应.pdf
1
/
3
15
评价文档
赞助1.5元 点击下载(539.6 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。