说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210676151.3 (22)申请日 2022.06.15 (71)申请人 中网华信科技股份有限公司 地址 030082 山西省太原市山西综改示范 区太原学府园区南中环 街529号D座20 层3-6、 10号房间 (72)发明人 赵睿 杨旭东 王大庆 邸宴龙  辛伟平 张舰  (74)专利代理 机构 北京维正专利代理有限公司 11508 专利代理师 张伟 (51)Int.Cl. G06F 40/186(2020.01) G06F 40/30(2020.01) G06V 30/41(2022.01)G06V 30/418(2022.01) G06F 16/33(2019.01) (54)发明名称 电子卷宗自动编 目方法、 装置、 设备及可读 存储介质 (57)摘要 本申请涉及一种电子卷宗自动编目方法、 装 置、 设备及可读存储介质, 应用于数据整理技术 领域, 其方法包括: 获取目标案件的待编目 电子 卷宗; 对所述待编目电子卷宗进行图像处理生成 目标电子 卷宗; 将所述目标电子卷宗按照预设样 本模板进行调整, 生成目标电子卷宗页; 识别所 述目标电子卷宗页的文件属性; 基于所述文件属 性生成用于描述所述目标电子卷宗页的编目信 息; 基于所述编目信息和预设编目规则对所述目 标电子卷宗页进行编目。 本申请具有提高电子卷 宗自动编目的效率的效果。 权利要求书2页 说明书8页 附图2页 CN 115034193 A 2022.09.09 CN 115034193 A 1.一种电子卷宗自动 编目方法, 其特 征在于, 包括: 获取目标案件的待编目电子卷宗; 对所述待编目电子卷宗进行图像处 理生成目标电子卷宗; 将所述目标电子卷宗按照预设样本模板进行调整, 生成目标电子卷宗页; 识别所述目标电子卷宗页的文件属性; 基于所述文件属性 生成用于描述所述目标电子卷宗页的编目信息; 基于所述编目信息和预设编目规则对所述目标电子卷宗页进行编目。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述待编目电子卷宗进行图像处理 生成目标电子卷宗包括: 判断所述待编目电子卷宗是否存在识别干扰; 若存在所述识别干扰, 则对所述待编目电子卷宗进行清洗, 以消除所述识别干扰; 将消除所述识别干扰的所述待编目电子卷宗作为所述目标电子卷宗; 若不存在所述识别干扰, 则将所述待编目电子卷宗作为所述目标电子卷宗。 3.根据权利要求1或2所述的方法, 其特征在于, 所述将所述目标电子卷宗按照预设样 本模板进行调整, 生成目标电子卷宗页包括: 获取所述目标电子卷宗的格式; 判断所述目标电子卷宗的格式是否与预设样本模板是否一 致; 若一致, 则将所述目标电子卷宗作为所述目标电子卷宗页; 若不一致, 则将所述目标电子卷宗的格式调整至与所述预设样本模板的格式一致, 将 调整后的目标电子卷宗作为所述目标电子卷宗页。 4.根据权利要求3所述的方法, 其特征在于, 所述识别所述目标电子卷宗页的文件属性 包括: 识别所述目标电子卷宗页上的文字和图片组合; 对所述文字进行语义分析, 得到文字类型; 对所述图片进行图片识别, 得到图片类型; 基于所述文字类型和所述图片类型的组合确定所述目标电子卷宗页的文件属性。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述文字类型和所述图片类型的 组合确定所述目标电子卷宗页的文件属性包括: 判断所述文字类型和所述图片类型的组合与预设文字类型和图片类型的组合属性是 否存在匹配项; 若存在匹配项, 则将所述匹配项的文件属性作为所述目标电子卷宗页的文件属性; 若不存在匹配项, 则基于所述文字内容类型和图片类型生成告警信息 。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述编目信 息和预设编目规则对 所述目标电子卷宗页进行编目包括: 基于所述编目信息将所述目标电子卷宗页划分为首页、 尾页和多个中间页; 基于所述语义分析确定多个所述中间页中的关联页和标识页; 基于所述首页、 所述尾页、 所述关联页和所述标识页对所述目标电子卷宗页进行编目。 7.根据权利要求1所述的方法, 其特征在于, 在所述基于所述编目信 息和预设编目规则 对所述目标电子卷宗页进行编目之后, 还 包括:权 利 要 求 书 1/2 页 2 CN 115034193 A 2识别所述编目信 息中的关键字, 将所述关键字与 所述关键字数据库内预设关键字进行 匹配; 获取与所述关键字匹配的预设关键字的属性和存放数据库, 将编目后的所述目标电子 卷宗页存 入所述存放数据库。 8.一种电子卷宗自动 编目装置, 其特 征在于, 包括: 卷宗获取模块, 用于获取任意目标案件的待编目电子卷宗; 目标生成模块, 用于对所述待编目电子卷宗进行图像处 理生成目标电子卷宗; 卷宗调整模块, 用于将所述目标电子卷宗按照预设样本模板进行调整, 生成目标电子 卷宗页; 属性识别模块, 用于识别所述目标电子卷宗页的文件属性; 信息生成模块, 用于基于所述文件属性生成用于描述所述目标电子卷宗页的编目信 息; 卷宗编目模块, 用于基于所述编目信 息和预设编目规则对所述目标电子卷宗页进行编 目。 9.一种电子设备, 其特征在于, 包括存储器和处理器, 所述存储器上存储有能够被所述 处理器加载并执 行如权利要求1至7中项一种所述的电子卷宗自动 编目方法的计算机程序。 10.一种计算机可读存储介质, 其特征在于, 存储有能够被处理器加载并执行如权利要 求1至7中任一项所述的电子卷宗自动 编目方法的计算机程序。权 利 要 求 书 2/2 页 3 CN 115034193 A 3

.PDF文档 专利 电子卷宗自动编目方法、装置、设备及可读存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 电子卷宗自动编目方法、装置、设备及可读存储介质 第 1 页 专利 电子卷宗自动编目方法、装置、设备及可读存储介质 第 2 页 专利 电子卷宗自动编目方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。