说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210749683.5 (22)申请日 2022.06.29 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310023 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 魏扬威 都金涛 祝慧佳  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 钱孟清 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/216(2020.01) G06F 40/30(2020.01) (54)发明名称 用于相似案件检索的方法、 系统和存 储介质 (57)摘要 本说明书的实施例提供了一种用 于相似案 件检索的方法, 所述方法包括: 接收待查询案件 的相似案件查询请求; 至少部分地基于所述相似 案件查询请求, 分别提取所述待查询案件和历史 判决案例的文本特征和经验特征, 以及提取历史 判决案例的知识图谱特征; 融合文本特征、 经验 特征、 以及知识图谱特征; 以及基于所融合的特 征而检索并输出历史判决案例中的相似案件。 还 提供了众多其 他方面。 权利要求书2页 说明书11页 附图5页 CN 115293145 A 2022.11.04 CN 115293145 A 1.一种用于相似案件检索的方法, 所述方法包括: 接收待查询案件的相似案件查询请求; 至少部分地基于所述相似案件查询请求, 提取所述待查询案件的第 一文本特征和第 一 经验特征, 以及历史判决案例的第二文本特 征和第二经验特 征; 融合所述第一文本特征、 所述第二文本特征、 所述第一经验特征、 所述第二经验特征、 以及所述历史判决案例的预 先提取的知识图谱特 征; 以及 至少部分地基于所融合的特 征而检索并输出 所述历史判决案例中的相似案件。 2.如权利要求1所述的方法, 其中提取 所述第一文本特 征和所述第二文本特 征包括: 使用单塔K ‑BERT文本特征提取模型提取 所述第一文本特 征和所述第二文本特 征, 并且 其中所述单塔K ‑BERT文本特征提取模型使用通用知识图谱来预训练。 3.如权利要求1所述的方法, 其中提取 所述第一文本特 征和所述第二文本特 征包括: 使用双塔K ‑BERT文本特征提取模型的User塔提取所述待查询案件 的所述第一文本特 征; 使用双塔K ‑BERT文本特征提取模型的Item塔提取所述历史判决案例的所述第二文本 特征, 并且 其中所述双塔K ‑BERT模型使用通用知识图谱来预训练。 4.如权利要求1所述的方法, 其中提取 所述第一经验特 征和所述第二经验特 征包括: 使用经验特 征提取模型提取 所述第一经验特 征和所述第二经验特 征, 并且 其中所述经验特征提取模型至少部分地基于通过人工经验生成的经验词汇群来预训 练。 5.如权利要求1所述的方法, 提取 所述第一经验特 征和所述第二经验特 征包括: 至少部分地基于人工经验来 生成经验词汇群; 使用TF‑IDF提取所述待查询案件的第一浅层词汇特征和所述历史判决案例的第二浅 层词汇特 征; 使用经验特征提取模型提取所述待查询案件的对应经验向量, 并且将其与 所述第一浅 层词汇特征拼接以作为所述第一经验特征, 其中所述经验特征提取模型是至少部分地基于 通过人工经验生成的经验词汇群来预训练的; 以及 使用所述经验特征提取模型提取所述历史判决案例的对应经验向量, 并且将其与 所述 第一浅层词汇特 征拼接以作为所述第二经验特 征。 6.如权利要求4或5所述的方法, 其中所述经验词汇群是能被预配置的, 并且包括以下 一者或多者: 是否包含担保人、 担保人个数、 是否包含抵押物、 抵押物个数、 原告是否属于公司、 原告 人数、 被告是否属于公司、 被告人数、 是否存在借贷关系、 是否包含利息、 原告被告关系、 死 亡情况。 7.如权利要求1所述的方法, 其中提取 所述历史判决案例的所述知识图谱特 征包括: 至少部分地基于法条知识来构建法条知识图谱; 至少部分地基于所述历史判决案例来构建历史判决关系知识图谱; 以及 至少部分地基于所述法条知识图谱和所述历史判决关系知识图谱进行图谱推理, 以将 所述历史判决案例的对应节点向量输出为所述知识图谱特 征。权 利 要 求 书 1/2 页 2 CN 115293145 A 28.如权利要求7 所述的方法, 其中构建所述历史判决关系知识图谱 包括: 提取所述历史判决案例的指定 字段; 以及 使用所述指定 字段构建针对所述历史判决案例之间的关系的历史判决关系图谱。 9.如权利要求1所述的方法, 其中所述融合包括: 执行对所述第一文本特征、 所述第二文本特征、 所述第一经验特征、 所述第二经验特 征、 以及所述知识图谱特 征的特征拼接、 信息融合和特 征降维。 10.如权利要求1所述的方法, 其中检索并输出 所述相似案件 包括: 将所融合的特征输入分类器以获得所述待查询案件和所述历史判决案例的相似度; 以 及 输出其相似度大于指定阈值的历史判决案例作为检索到的相似案件。 11.如权利要求10所述的方法, 其中检索并输出 所述相似案件进一 步包括: 自动提取一个或多个相似案件的案例判决; 或者 分组显示具有相同或相似关键信息的一个或多个相似案件。 12.一种用于相似案件检索的系统, 所述系统包括 交互模块, 其被 配置成接收待查询案件的相似案件查询请求; 特征提取模块, 其被配置成至少部分地基于所述相似案件查询请求, 提取所述待查询 案件的第一文本特征和第一经验特征, 以及历史判决案例的第二文本特征和第二经验特 征; 特征融合模块, 其被配置成融合所述第一文本特征、 所述第 二文本特征、 所述第 一经验 特征、 所述第二经验特 征、 以及所述历史判决案例的预 先提取的知识图谱特 征; 以及 相似案件输出模块, 其被配置成至少部分地基于所融合的特征而检索并输出所述历史 判决案例中的相似案件。 13.一种存储指令的非瞬态计算机可读存储介质, 所述指令当被计算机执行时, 使所述 计算机执 行如权利要求1 ‑11中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115293145 A 3

.PDF文档 专利 用于相似案件检索的方法、系统和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于相似案件检索的方法、系统和存储介质 第 1 页 专利 用于相似案件检索的方法、系统和存储介质 第 2 页 专利 用于相似案件检索的方法、系统和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。