(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210511295.3
(22)申请日 2022.05.12
(65)同一申请的已公布的文献号
申请公布号 CN 114610891 A
(43)申请公布日 2022.06.10
(73)专利权人 湖南工商大 学
地址 410205 湖南省长 沙市岳麓 大道569号
(72)发明人 陈晓红 郑旭哲 梁伟 吴嘉懿
胡东滨
(74)专利代理 机构 长沙轩荣专利代理有限公司
43235
专利代理师 董崇东
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/253(2020.01)
G06F 40/284(2020.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06Q 10/04(2012.01)
G06Q 50/18(2012.01)
(56)对比文件
CN 113536780 A,2021.10.2 2
CN 110750635 A,2020.02.04
CN 110717843 A,2020.01.21
CN 112183094 A,2021.01.0 5
WO 202025 3052 A1,2020.12.24
陶永才等.一种结合 LSTM和集成算法的文本
校对模型. 《小型微型计算机系统》 .2020,(第0 5
期),
张虎等.面向法律裁判文 书的法条推荐方
法. 《计算机科 学》 .2019,第46卷(第9期), (续)
审查员 王辞
(54)发明名称
面向不平衡司法裁判文书数据的法条推荐
方法及系统
(57)摘要
本发明提供了一种面向不平衡司法裁判文
书数据的法条推荐方法及系统, 将获取的司法裁
判文书数据输入模型并预处理, 进行序列化得到
模型的训练集; 将训练集通过基于预训练模型的
嵌入层, 得到文本的向量表示; 将文本向量通过
CNN (卷积神经网络) 获取文本特征; 将训练集通
过基于语 法依赖信息的词语搭配算法, 得到文本
的词语搭配特征; 将文本特征和词语搭配特征通
过神经网络进行融合, 得到混合语义向量; 将混
合语义向量输入到深层神经网络中, 输出法条预
测结果; 基于法条预测结果和真实司法裁判文书
的法条标签进行模型训练, 并将训练完成的模型
用于司法案件的辅助判决, 能有效在极度不平衡数据下推荐适用的法条辅助法官进行司法裁判。
[转续页]
权利要求书3页 说明书9页 附图2页
CN 114610891 B
2022.07.22
CN 114610891 B
(56)对比文件
Matthew E.Peters等.De ep
contextual ized word representati ons.
《Proceedings of the 2018 Co nference of
the North American C hapter of the
Association for Computati onal Linguistics》 .2018,
王旭.基于法律裁判文 书的法条推荐研究与
应用. 《万方数据库》 .2021,
肖莉才.文本摘要生成技 术研究与应用. 《万
方数据库》 .2021,2/2 页
2[接上页]
CN 114610891 B1.一种面向不平衡司法裁判文 书数据的法条推荐方法, 其特 征在于, 包括如下步骤:
S1, 将获取的司法裁判文书数据输入模型, 对原始的裁判文书进行数据预处理, 并且将
预处理后的文本数据进行序列化得到模型的训练集;
S2, 将训练集 通过基于预训练模型的嵌入层, 得到文本的向量表示;
S3, 将文本向量 通过卷积神经网络获取文本特 征;
S4, 将训练集通过基于语法依赖信息的词语搭配算法, 得到文本的词语搭配特征; 通过
句中词语语法依赖信息获取词语的搭配信息, 并通过结合注意力机制的双向长 短期记忆神
经网络将搭配的单词向量 合并, 得到词语搭配特 征;
具体包括如下子步骤:
S 4 1 ,通 过 词 语 的 依 赖 关 系 提 取 词 语 序 列
的 词 语 搭 配 序 列
,
, 其中
,
代表了
中的两个词;
S42, 将每个词转换成其对应的语义向量, 得到搭配嵌入
和句向量
, 其中
是搭配词语
的嵌入向量;
S43, 将每个单词组中的单词嵌入向量
和
通过一层结合注意力机制的双向长
短期记忆神经网络进行合并, 得到搭配 语义向量
, 具体计算公式如下 所示:
其中,
是第j时间下长短期记忆神经网络的正向 隐藏状态,
是第j时间下LSTM的反
向隐藏状态, 计算公式如下:
对于每一个搭配语义向量
, 将注意力 机制应用到词语搭配特征的计算过程中, 并且
得到词语搭配特 征
, 其具体的计算方式如下:
其中
是搭配语义向量
的注意力权 重值, 其计算公式如下:
其中
是权重矩阵,
是激活函数;
S5, 将文本特征和词语搭配 特征通过神经网络进行融合, 得到混合语义向量
, 其计算
公式如下:
其中
是神经网络的权 重矩阵,
是偏置向量,
是矩阵加法;
S6, 将混合语义向量输入到使用
作为激活函数的双层神经网络中进行法条的权 利 要 求 书 1/3 页
2
CN 114610891 B
3
专利 面向不平衡司法裁判文书数据的法条推荐方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:15:21上传分享