说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210535875.6 (22)申请日 2022.05.17 (71)申请人 马上消费金融股份有限公司 地址 401120 重庆市渝北区黄山大道中段 52号渝兴广场B2栋4至8楼 (72)发明人 赵宏宇 蒋宁 王洪斌 白安琪  (74)专利代理 机构 北京国昊天诚知识产权代理 有限公司 1 1315 专利代理师 姜凤岩 (51)Int.Cl. G06F 40/242(2020.01) G06F 40/211(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文本纠正模 型训练方法及装置、 文本纠正方 法及装置 (57)摘要 本申请实施例提供了一种文本纠正模型训 练方法及装置、 文本纠正方法及装置, 其中模型 训练方法包括: 获取用于训练模型的样本数据、 第一发音混淆词典和第二发音混淆词典; 所述第 一发音混淆词典包括第一场景下的发音混淆文 本; 所述第二发音混淆词典包括第二场景下的发 音混淆文本; 所述第一场景与所述第二场景不 同; 基于所述第一发音混淆词典构建第一图数 据, 将所述第一图数据转换为第一邻接矩阵, 以 及基于所述第二发音混淆词典构建第二图数据, 将所述第二图数据转换为第二邻接矩阵; 将所述 样本数据、 所述第一邻接矩阵和所述第二邻接矩 阵输入待训练模 型中进行模型训练, 得到文本纠 正模型。 通过本实施例, 能够提高文本纠正的精 准性。 权利要求书5页 说明书24页 附图5页 CN 114896965 A 2022.08.12 CN 114896965 A 1.一种文本纠正模型训练方法, 其特 征在于, 所述方法包括: 获取用于训练模型的样本数据、 第一发音混淆词典和第二发音混淆词典; 所述第一发 音混淆词典包括第一场景下的发音混淆文本; 所述第二 发音混淆词典包括第二场景下的发 音混淆文本; 所述第一场景与所述第二场景不同; 基于所述第一发音混淆词典构建第一图数据, 将所述第一图数据转换为第一邻接矩 阵, 以及基于所述第二发音混淆词典构建第二图数据, 将所述第二图数据转换为第二邻接 矩阵; 将所述样本数据、 所述第 一邻接矩阵和所述第 二邻接矩阵输入待训练模型中进行模型 训练, 得到文本纠正模型。 2.根据权利要求1所述的方法, 其特征在于, 所述待训练模型包括第一纠 正网络、 第二 纠正网络和第三纠正网络; 其中, 所述第一邻接矩阵输入至所述第一纠 正网络, 所述第二邻居矩阵输入至所述第 二纠正网络, 所述样本数据输入至所述第三纠正网络 。 3.根据权利要求2所述的方法, 其特 征在于, 所述模型训练, 包括: 通过所述第三纠正网络基于所述样本数据中的每个样本文本的上下文语义信息对所 述每个样本文本进行纠正处 理, 得到所述每 个样本文本的第一处 理结果; 通过所述第一纠正网络将所述每个样本文本的所述第一处理结果与所述第一邻接矩 阵相结合, 得到所述每 个样本文本的第二处 理结果; 通过所述第二纠正网络将所述每个样本文本的所述第一处理结果与所述第二邻接矩 阵相结合, 得到所述每 个样本文本的第三处 理结果; 根据所述每个样本文本的所述第 一处理结果、 所述每个样本文本的所述第 二处理结果 和所述每个样本文本的所述第三处理结果, 对所述第一纠正网络、 所述第二纠正网络和所 述第三纠正网络中的参数进行调整。 4.根据权利要求3所述的方法, 其特征在于, 所述第 一纠正网络包括第 一图卷积网络和 第一结果融合层, 所述第一图卷积网络包括 N个第一图卷积层, 所述 N为大于1的整数; 针对每个样本文本, 将所述样本文本的所述第一处理结果与所述第一邻接矩阵相结 合, 得到所述样本文本的第二处 理结果, 包括: 通过所述第一图卷积网络将所述样本文本的所述第一处理结果与所述第一邻接矩阵 进行卷积处理; 其中, 所述第一图卷积网络的第1层第一图卷积层的输入为所述样本文本的 所述第一处理结果和所述第一邻接矩阵, 所述第一图卷积网络的第i层第一图卷积层的输 入为所述第i层第一图卷积层的上一第一图卷积层的输出和所述第一邻接矩阵, 每一第一 图卷积层均将输入信息进行 卷积处理, i=2,..,N; 通过所述第一结果融合层将所述样本文本的所述第一处理结果和所述第一图卷积网 络的每一第一图卷积层的输出进行融合, 得到所述样本文本的第二处 理结果。 5.根据权利要求4所述的方法, 其特征在于, 所述将所述样本文本的所述第 一处理结果 和所述第一图卷积网络的每一第一图卷积层的输出进 行融合, 得到所述样本文本的第二处 理结果, 包括: 根据所述样本文本的所述第一处理结果和所述第一图卷积网络的每一第一图卷积层 的输出, 评估所述样本文本的所述第一处理结果的重要程度得分和每一第一图卷积层的输权 利 要 求 书 1/5 页 2 CN 114896965 A 2出的重要程度得分; 根据所述样本文本的所述第一处理结果的重要程度得分和每一第一图卷积层的输出 的重要程度得分, 对所述样本文本的所述第一处理结果和每一第一图卷积层的输出进 行加 权融合, 得到所述样本文本的第二处 理结果。 6.根据权利要求3所述的方法, 其特征在于, 所述第 二纠正网络包括第 二图卷积网络和 第二结果融合层, 所述第二图卷积网络包括M个第二图卷积层, 所述M为大于1的整数; 针对每个样本文本, 将所述样本文本的所述第一处理结果与所述第二邻接矩阵相结 合, 得到所述样本文本的第三处 理结果, 包括: 通过所述第二图卷积网络将所述样本文本的所述第一处理结果与所述第二邻接矩阵 进行卷积处理; 其中, 所述第二图卷积网络的第1层第二图卷积层的输入为所述样本文本的 所述第一处理结果和所述第二邻接矩阵, 所述第二图卷积网络的第j层第二图卷积层的输 入为所述第j层第二图卷积层的上一第二图卷积层的输出和所述第二邻接矩阵, 每一第二 图卷积层均将输入信息进行 卷积处理, j=2,. .,M; 通过所述第二结果融合层将所述样本文本的所述第一处理结果和所述第二图卷积网 络的每一第二图卷积层的输出进行融合, 得到所述样本文本的第三处 理结果。 7.根据权利要求6所述的方法, 其特征在于, 所述将所述样本文本的所述第 一处理结果 和所述第二图卷积网络的每一第二图卷积层的输出进 行融合, 得到所述样本文本的第三处 理结果, 包括: 根据所述样本文本的所述第一处理结果和所述第二图卷积网络的每一第二图卷积层 的输出, 评估所述样本文本的所述第一处理结果的重要程度得分和每一第二图卷积层的输 出的重要程度得分; 根据所述样本文本的所述第一处理结果的重要程度得分和每一第二图卷积层的输出 的重要程度得分, 对所述样本文本的所述第一处理结果和每一第二图卷积层的输出进 行加 权融合, 得到所述样本文本的第三处 理结果。 8.根据权利要求3所述的方法, 其特征在于, 所述文本纠正模型还包括纠正结果选择网 络和纠正结果评估网络; 所述样本文本中包括多个样本字词; 所述第一处理结果、 所述第二 处理结果和所述第三处理结果中, 均包括每个样本字词的处理结果; 所述根据所述每个样 本文本的所述第一处理结果、 所述每个样本文本的所述第二处理结果和所述每个样本文本 的所述第三处理结果, 对所述第一纠正网络、 所述第二纠正网络和所述第三纠正网络中的 参数进行调整, 包括: 通过所述纠正结果选择网络进行样本字词处理结果选择, 得到每个样本字词的目标处 理结果, 其中, 所述 目标处理结果为其在所述第一处理结果中的处理结果, 或者, 为其在所 述第二处 理结果中的处 理结果, 或者, 为 其在所述第三处 理结果中的处 理结果; 通过所述纠正结果评估网络根据每个样本字词的目标处理结果和每个样本字词的期 望处理结果, 反向驱动所述第一纠正网络、 所述第二纠正网络和所述第三纠正网络中的参 数进行调整。 9.根据权利要求8所述的方法, 其特 征在于, 针对每 个样本字词, 若所述样本字词位于所述第 二发音混淆词典中, 且所述样本字词在所述样本文本 中的 上下文相关字词位于所述第二发音混淆词典中, 则所述目标 处理结果为其在所述第三处理权 利 要 求 书 2/5 页 3 CN 114896965 A 3

.PDF文档 专利 文本纠正模型训练方法及装置、文本纠正方法及装置

文档预览
中文文档 35 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共35页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本纠正模型训练方法及装置、文本纠正方法及装置 第 1 页 专利 文本纠正模型训练方法及装置、文本纠正方法及装置 第 2 页 专利 文本纠正模型训练方法及装置、文本纠正方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。