说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210720096.3 (22)申请日 2022.06.23 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 刘期烈 宋建平 王毅 孙开伟  方阳 刘倩 邹建宏 屈喜龙  李贝 吕明  (74)专利代理 机构 重庆辉腾律师事务所 5 0215 专利代理师 王诗思 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01) G06F 40/216(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 50/18(2012.01) (54)发明名称 一种基于半监督的图神经网络的案件争议 焦点识别方法及装置 (57)摘要 本发明公开了一种基于半监督的图神经网 络的案件争议焦点识别方法及装置, 所述方法包 括: 首先利用司法知识图谱三元 组嵌入丰富诉 辩 双方关键陈述句子, 然后设计关键单词筛选机 制, 将输入的诉 辩文本单词进行排序、 抽取操作, 将处理后的单词与文本作为两种节点构建文本 图, 将文本图输入图注意力网络实现多标签文本 分类, 从而识别争议焦点。 本发明通过利用司法 知识图谱中的知识要素、 关键文本单词筛选机 制, 增强了文本特征、 改善了长文本限制问题, 降 低了模型占用资源, 最终基于半监督的图神经网 络实现多标签文本分类技术完成争议焦点的识 别, 提高庭审效率。 权利要求书2页 说明书7页 附图2页 CN 115048521 A 2022.09.13 CN 115048521 A 1.一种基于半监督的图神经网络的案件争议焦点识别方法, 其特征在于, 包括以下步 骤: 将待识别的案件 诉辩陈述数据进行中文数据预处 理, 得到法律文本相关的句子; 将法律知识图谱三元组融入到句子中, 对句子进行分词处理, 并将分词处理后的单词 与文本分别作为节点构建出第一文本图; 采用图卷积网络与个人页面排名算法迭代计算出所述第一文本图中每个单词节点对 于文本节点的重要程度, 并根据重要程度排序获得关键单词节点; 将获取到的关键单词节 点通过词嵌入求和得到 关键文本节点, 并将关键单词节点与关键文本节点构建出关键文本 图; 将关键文本图输入到基于图注意力网络的争议焦点识别模块中, 输出案件争议焦点。 2.根据权利要求1所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其 特征在于, 所述中文数据预处 理包括: 按照预先定义的争议焦点标签体系将所述数据整理为诉辩内容和标签集的格式, 对整 理后的重复数据、 短数据进行删除处理; 并删除文本中的乱码、 和英文字符, 去除无实际意 义的停用词。 3.根据权利要求1所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其 特征在于, 所述将法律知识图谱三元组融入到句子中包括: 将待识别的案件诉辩陈述数据与法律知识图谱三元组转换为带有知识的句子; 通过知 识查询从法律知识图谱中找出句子中所有实体所涉及到的三元组, 通过知识注入将三元组 集合加到句子中。 4.根据权利要求1所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其 特征在于, 所述采用图卷积网络与个人页面排名算法迭代计算出所述初始文本图中每个单 词节点对于文本节点的重要程度, 并根据重要程度排序获得关键单词包括: 将第一文本图输入到图卷积网络中, 计算出第一文本图损失; 使用个人页面排名算法计算出第 一文本图中单词节点对于文本节点的重要程度, 并将 其作为文本节点与单词节点的边, 将边权重也即重要程度大于第一阈值的单词节点作为第 一关键单词节点; 将第一关键单词节点构 成的第一关键文本图输入到图卷积网络中, 计算出第 一关键文 本图损失, 与所述第一文本图损失作差值, 若该差值大于 设定的第一损失差阈值, 则降低第 一阈值, 增加关键单词节点数量, 更新第一关键单词节点, 继续将更新后的第一关键单词节 点构成的第一关键文本图输入图卷积网络, 迭代直至 收敛, 将最终的第一关键单词节点作 为第二关键单词输出; 若该差值小于或等于设定的第一损失差阈值, 则直接将第一关键单 词作为第二关键单词输出。 5.根据权利要求4所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其 特征在于, 构建出第一关键文本图的过程包括: 将第一关键单词节点通过词嵌入求和组合为第 一关键文本节点, 使用个人页面排名算 法计算出重要程度作为第一关键单词节点与第一关键文本节点的边, 使用逐点互信息法对 筛选后的第一关键单词之间的逐点互信息作为第一关键单词节点与第一关键单词节点的 边, 使用第一关键单词节点、 第一关键文本节点以及对应的关系构建第一关键文本图。权 利 要 求 书 1/2 页 2 CN 115048521 A 26.根据权利要求4或5所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其特征在于, 所述个人页面 排名算法所采用的公式表示 为: 其中, S(Vi)为单词节点Vi的重要程度, In(Vi)为单词节点Vi的前驱节点集合, Out(Vj)为 单词节点Vi的后继节点 集合, d为阻尼系数, 用于收敛。 7.根据权利要求6所述的基于半监督的图神经网络的案件争议焦点识别方法, 其特征 在于, 降低 第一阈值所采用的公式表示 为: LG=LG0‑0.1*step 其中, LG表示降低后的第一阈值, LG0为初始设置的第一阈值, step为衰减系数。 8.根据权利要求1所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其 特征在于, 所述基于图神经网络的争议焦点识别模块输出案件争议焦点的过程具体为: 使用关键单词节点、 关键文本节点构成关键文本 图, 将关键文本 图作为图注意力网络 的输入, 图注意力网络通过图注意力机制对邻居节点赋权, 实现有权重的提取邻居节点即 关键单词节点的重要特征信息, 聚和出关键文本节点新的特征信息, 将图注意力网络输出 的关键文本节点特征信息输入到全连接层, 使用sigmod函数激活输出每个标签的概率值, 将大于等于阈值的标签预测为该标签存在争议焦点, 小于该阈值的标签预测为不是争议焦 点。 9.一种基于半监督的图神经网络的案件争议焦点识别装置, 其应用于如权利要求1~8 中任一项所述的一种基于半监督的图神经网络的案件争议焦点识别方法, 其特征在于, 所 述装置包括数据获取模块、 数据 处理模块、 关键文本单词筛选模块和争议焦点分类预测模 块; 所述数据获取模块用于获取待识别的案件 诉辩陈述数据; 所述数据处 理模块用于进行中文数据预处 理, 得到法律文本相关的句子; 所述关键文本筛选模块用于将法律知识图谱三元组融入到句子中, 对句子进行分词处 理, 并将分词处 理后的单词与文本分别作为节点构建出第一文本图; 采用图卷积网络与个人页面排名算法迭代计算出所述第一文本图中每个单词节点对 于文本节点的重要程度, 并根据重要程度排序获得关键单词节点; 将获取到的关键单词节点通过词嵌入求和得到关键文本, 并将关键单词节点与关键文 本节点构建出关键文本图; 所述争议焦点分类预测模块用于对关键文本图处理, 预测待识别的案件包含的争议焦 点。权 利 要 求 书 2/2 页 3 CN 115048521 A 3

.PDF文档 专利 一种基于半监督的图神经网络的案件争议焦点识别方法及装置

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于半监督的图神经网络的案件争议焦点识别方法及装置 第 1 页 专利 一种基于半监督的图神经网络的案件争议焦点识别方法及装置 第 2 页 专利 一种基于半监督的图神经网络的案件争议焦点识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。