(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111402681.0
(22)申请日 2021.11.24
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 黄涛 孙富 黄耀波 李怀松
(74)专利代理 机构 济南信达专利事务所有限公
司 37100
代理人 李世喆
(51)Int.Cl.
G06Q 10/10(2012.01)
G06Q 50/30(2012.01)
G06N 20/00(2019.01)
(54)发明名称
自动化审理方法和装置
(57)摘要
本说明书实施例提供了一种 自动化审理方
法和装置。 该方法包括: 得到主体数据特征; 将所
述主体数据特征输入预先训练的审理模型中, 得
到该审理模型输出的审理结果; 其中, 所述审理
模型是利用第一人工专家经验训练得到的; 将所
述审理结果输入 预先训练的报文生成模型中, 得
到该报文生成模型输出的审理结果报文; 其中,
所述报文生成模型是利用第二人工专家经验训
练得到的; 上报所述审理结果报文。 本说明书实
施例能够自动化实现对主体进行审理的审理业
务。
权利要求书3页 说明书11页 附图2页
CN 114118958 A
2022.03.01
CN 114118958 A
1.自动化审理方法, 其中, 包括:
得到主体数据特 征;
将所述主体数据特征输入预先训练的审理模型中, 得到该审理模型输出的审理结果;
其中, 所述审理模型 是利用第一人工专 家经验训练得到的;
将所述审理结果输入预先训练 的报文生成模型中, 得到该报文生成模型输出的审理结
果报文; 其中, 所述报文生成模型 是利用第二人工专 家经验训练得到的;
上报所述审理结果报文。
2.根据权利要求1所述的方法, 其中, 所述审理模型包括: 用于对单个主体进行识别的
单主体识别模型;
该单主体识别模型的训练方法包括:
根据单个主体的类型及特点, 确定单主体识别模型的识别任务及每一种识别任务的特
征;
将对单个主体进行识别的各第一人工专 家经验形成各个第一人工规则;
将该各个第一人工规则给定权重值加入所述单主体识别模型所使用算法的损失函数
中, 形成第一损失函数;
利用该第一损失函数训练该 单主体识别模型。
3.根据权利要求2所述的方法, 其中, 所述第一损失函数包括:
其中, i表 征每一个样本; yi表征二分类样本中第i个样本的取值; ri表征第i个样本取值
为第一个分类的概率, (1 ‑ri)表征第i个样本取值为第二个分类的概率; F表征各个第一人
工规则的集合; wf表征规则f的权重; f+表征将样本识别为第一个分类的规则集合; f ‑表征
将样本识别为第二个分类的规则集合; r表征规则f的取值;
表征: 样
本若至少被一条第一人工规则识别为第一个分类或第二个分类, 则取值 为1, 否则取值 为0。
4.根据权利要求2所述的方法, 其中, 所述单主体识别模型包括:
第一层子模型, 该第一层子模型通过白名单与黑名单进行单个主体的识别, 并输出第
一识别结果;
第二层子模型, 用于进行 单个主体的二分类的识别, 输出第二识别结果;
第三层子模型, 用于根据所述识别任务及每一种识别任务的特征, 利用元学习算法进
行单个主体的多任务的识别, 输出第三识别结果;
第四层子模型, 用于根据第 一识别结果、 第二识别结果以及第三识别结果, 得到单个主
体的识别结果。
5.根据权利要求1所述的方法, 其中, 所述审理模型包括: 用于对多个主体形成的团伙
进行识别的多 主体识别模型;
该多主体识别模型的训练方法包括: 将对多个主体进行识别的各第 一人工专家经验形
成各个第二人工规则;
将是否符合团伙识别的该各个第二人工规则加入所述多主体识别模型所使用算法的
损失函数, 形成第二损失函数; 利用该第二损失函数训练该多 主体识别模型。权 利 要 求 书 1/3 页
2
CN 114118958 A
26.根据权利要求5所述的方法, 其中, 所述第二损失函数包括:
其中, Aij表征节点i与节点j连接的边的权重; ki, kj表征和节点i、 j连接的所有 边的权重
之和; m表征图中所有边的数量;
表示节点i与节点j在随机情况下连接的权重;
表示实际连接权重与随机连接权重的差值; δ(ci,cj)表示的是一个函数, 当
节点i和节 点j在同一个团伙时, 函数值为1, 否则为0; max{max{r},max{1 ‑r}}表征一条第二
人工规则若判节 点i与节点j属于一个团伙 或者不属于一个团伙, 则取值为 1, 否则取值为0;
λ表征第二人工规则的权 重。
7.根据权利要求1所述的方法, 其中, 所述将所述审理结果输入预先训练 的报文生成模
型中得到该报文生成模型输出的审理结果报文, 包括:
利用所述审理结果, 在知识图谱中进行检索; 该知识图谱是利用所述第二人工专家经
验生成的;
将检索结果作为预 先训练的ret rieval‑based算法模型的输入;
将retrieval ‑based算法模型输出的文本进行编码, 将编码结果作为预先训练的
generation ‑based算法模型的输入, 得到generation ‑based算法模型逐字输 出的审理结果
报文。
8.根据权利要求7所述的方法, 其中, 所述retrieval ‑based算法模型与所述
generati on‑based算法模型进行 联合训练, 且利用如下第三损失函数进行 联合训练:
其中α表征第二人工专家经验对应
的损失函数的权重, α 为预先设定的常数; L表征目标生成句子的长度, t表征句子中每一个
字, pt表征目标生成的句子中每一个字的概率, m表征第二人工专家经验对每个客户形成的
描述文本中, 所有字的个数;
表征每一个第二人工专家经验里的字的概率,
表征对上述所有第二人工专 家经验里的字取概 率最大的值。
9.自动化审理装置, 其中, 包括:
数据输入 模块, 配置为得到主体数据特 征, 将所述主体数据特 征输入到审理模型模块;
审理模型模块, 配置为利用预先训练的审理模型得到审理结果, 将审理结果发送给报
文生成模块; 其中, 所述审理模型 是利用第一人工专 家经验训练得到的;
报文生成模块, 配置为利用预先训练的报文生成模型得到审理结果报文, 并上报所述
审理结果报文; 其中, 所述报文生成模型 是利用第二人工专 家经验训练得到的。
10.根据权利要求9所述的装置, 其中, 所述审理模型模块包括:
单主体识别模型, 配置为对单个主体进行识别;
多主体识别模型, 配置为对多个主体形成的团伙进行识别。
11.一种计算设备, 包括存储器和 处理器, 所述存储器中存储有可执行代码, 所述处理权 利 要 求 书 2/3 页
3
CN 114118958 A
3
专利 自动化审理方法和装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 01:22:44上传分享