专利 自动化审理方法和装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111402681.0 (22)申请日 2021.11.24 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人黄涛　孙富　黄耀波　李怀松　 (74)专利代理机构济南信达专利事务所有限公司 37100 代理人李世喆 (51)Int.Cl. G06Q 10/10(2012.01) G06Q 50/30(2012.01) G06N 20/00(2019.01) (54)发明名称自动化审理方法和装置 (57)摘要本说明书实施例提供了一种自动化审理方法和装置。该方法包括：得到主体数据特征；将所述主体数据特征输入预先训练的审理模型中，得到该审理模型输出的审理结果；其中，所述审理模型是利用第一人工专家经验训练得到的；将所述审理结果输入预先训练的报文生成模型中，得到该报文生成模型输出的审理结果报文；其中，所述报文生成模型是利用第二人工专家经验训练得到的；上报所述审理结果报文。本说明书实施例能够自动化实现对主体进行审理的审理业务。权利要求书3页说明书11页附图2页 CN 114118958 A 2022.03.01 CN 114118958 A 1.自动化审理方法，其中，包括：得到主体数据特征；将所述主体数据特征输入预先训练的审理模型中，得到该审理模型输出的审理结果；其中，所述审理模型是利用第一人工专家经验训练得到的；将所述审理结果输入预先训练的报文生成模型中，得到该报文生成模型输出的审理结果报文；其中，所述报文生成模型是利用第二人工专家经验训练得到的；上报所述审理结果报文。 2.根据权利要求1所述的方法，其中，所述审理模型包括：用于对单个主体进行识别的单主体识别模型；该单主体识别模型的训练方法包括：根据单个主体的类型及特点，确定单主体识别模型的识别任务及每一种识别任务的特征；将对单个主体进行识别的各第一人工专家经验形成各个第一人工规则；将该各个第一人工规则给定权重值加入所述单主体识别模型所使用算法的损失函数中，形成第一损失函数；利用该第一损失函数训练该单主体识别模型。 3.根据权利要求2所述的方法，其中，所述第一损失函数包括：其中， i表征每一个样本； yi表征二分类样本中第i个样本的取值； ri表征第i个样本取值为第一个分类的概率， (1 ‑ri)表征第i个样本取值为第二个分类的概率； F表征各个第一人工规则的集合； wf表征规则f的权重； f+表征将样本识别为第一个分类的规则集合； f ‑表征将样本识别为第二个分类的规则集合； r表征规则f的取值；表征：样本若至少被一条第一人工规则识别为第一个分类或第二个分类，则取值为1，否则取值为0。 4.根据权利要求2所述的方法，其中，所述单主体识别模型包括：第一层子模型，该第一层子模型通过白名单与黑名单进行单个主体的识别，并输出第一识别结果；第二层子模型，用于进行单个主体的二分类的识别，输出第二识别结果；第三层子模型，用于根据所述识别任务及每一种识别任务的特征，利用元学习算法进行单个主体的多任务的识别，输出第三识别结果；第四层子模型，用于根据第一识别结果、第二识别结果以及第三识别结果，得到单个主体的识别结果。 5.根据权利要求1所述的方法，其中，所述审理模型包括：用于对多个主体形成的团伙进行识别的多主体识别模型；该多主体识别模型的训练方法包括：将对多个主体进行识别的各第一人工专家经验形成各个第二人工规则；将是否符合团伙识别的该各个第二人工规则加入所述多主体识别模型所使用算法的损失函数，形成第二损失函数；利用该第二损失函数训练该多主体识别模型。权　利　要　求　书 1/3 页 2 CN 114118958 A 26.根据权利要求5所述的方法，其中，所述第二损失函数包括：其中， Aij表征节点i与节点j连接的边的权重； ki， kj表征和节点i、 j连接的所有边的权重之和； m表征图中所有边的数量；表示节点i与节点j在随机情况下连接的权重；表示实际连接权重与随机连接权重的差值； δ(ci,cj)表示的是一个函数，当节点i和节点j在同一个团伙时，函数值为1，否则为0； max{max{r},max{1 ‑r}}表征一条第二人工规则若判节点i与节点j属于一个团伙或者不属于一个团伙，则取值为 1，否则取值为0； λ表征第二人工规则的权重。 7.根据权利要求1所述的方法，其中，所述将所述审理结果输入预先训练的报文生成模型中得到该报文生成模型输出的审理结果报文，包括：利用所述审理结果，在知识图谱中进行检索；该知识图谱是利用所述第二人工专家经验生成的；将检索结果作为预先训练的ret rieval‑based算法模型的输入；将retrieval ‑based算法模型输出的文本进行编码，将编码结果作为预先训练的 generation ‑based算法模型的输入，得到generation ‑based算法模型逐字输出的审理结果报文。 8.根据权利要求7所述的方法，其中，所述retrieval ‑based算法模型与所述 generati on‑based算法模型进行联合训练，且利用如下第三损失函数进行联合训练：其中α表征第二人工专家经验对应的损失函数的权重， α 为预先设定的常数； L表征目标生成句子的长度， t表征句子中每一个字， pt表征目标生成的句子中每一个字的概率， m表征第二人工专家经验对每个客户形成的描述文本中，所有字的个数；表征每一个第二人工专家经验里的字的概率，表征对上述所有第二人工专家经验里的字取概率最大的值。 9.自动化审理装置，其中，包括：数据输入模块，配置为得到主体数据特征，将所述主体数据特征输入到审理模型模块；审理模型模块，配置为利用预先训练的审理模型得到审理结果，将审理结果发送给报文生成模块；其中，所述审理模型是利用第一人工专家经验训练得到的；报文生成模块，配置为利用预先训练的报文生成模型得到审理结果报文，并上报所述审理结果报文；其中，所述报文生成模型是利用第二人工专家经验训练得到的。 10.根据权利要求9所述的装置，其中，所述审理模型模块包括：单主体识别模型，配置为对单个主体进行识别；多主体识别模型，配置为对多个主体形成的团伙进行识别。 11.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理权　利　要　求　书 2/3 页 3 CN 114118958 A 3

专利 自动化审理方法和装置

专利自动化审理方法和装置