说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210767656.0 (22)申请日 2022.06.30 (71)申请人 北京三快在线科技有限公司 地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人 任磊 马放 张辰 莫莹 王金刚  武威  (74)专利代理 机构 北京曼威知识产权代理有限 公司 11709 专利代理师 王宏财 (51)Int.Cl. G06F 40/186(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 语言处理任务的执行方法、 装置、 可读存储 介质以及设备 (57)摘要 本说明书公开了一种语言处理任务的执行 方法、 装置、 可读存储介质以及设备, 通过根据语 言处理任务的类型, 确定目标模板参数, 再根据 目标模板参数和用于将不同类型的语言处理任 务分别对应的模板参数映射为不同模板的目标 映射矩阵, 确定目标模板, 再将目标模板和文本 信息进行 组合, 输入预先训练好的目标语言模型 中, 得到文本信息的执行结果。 本方法可使用目 标语言模型执行多种语言处理任务, 成本低, 利 用率高。 权利要求书2页 说明书13页 附图4页 CN 115146601 A 2022.10.04 CN 115146601 A 1.一种语言处 理任务的执 行方法, 其特 征在于, 包括: 响应于语言处理任务, 确定所述语言处理任务对应的文本信息, 并根据所述语言处理 任务的类型, 确定所述类型对应的目标模板参数; 根据所述目标模板参数和预先确定出的目标映射矩阵, 确定所述语言处理任务的目标 模板, 其中, 所述 目标映射矩阵用于将不同类型 的语言处理任务分别对应的模板参数映射 为不同模板; 将所述目标模板和所述文本信息进行组合, 并将组合结果作为输入, 输入预先训练好 的目标语言模型中, 得到所述文本信息的执 行结果。 2.如权利要求1所述的方法, 其特征在于, 采用下述方式确定所述目标映射矩阵和各类 型分别对应的目标模板参数, 其中: 获取预先基于若干无标注文本信 息自监督训练得到的指定语言模型的模型参数, 作为 目标语言模型的模型参数; 获取所述各类型分别对应的待定模板参数, 并根据各待定模板参数和待定映射矩阵, 确定所述各类型分别对应的待定模板; 将各待定模板和各文本信息分别进行组合, 确定各第一训练样本, 以及确定所述各第 一训练样本分别对应的标注; 根据所述各第 一训练样本及其标注确定损失, 对所述待定映射矩阵和所述各类型分别 对应的所述待定模板参数进行调整, 并将调整 结果分别作为所述目标语言模型对应的目标 映射矩阵, 以及所述各类型分别对应的目标模板参数。 3.如权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 接收携带有语言处理任务的类型的调整请求, 并根据所述类型, 获取所述类型对应的 目标模板参数; 根据所述目标模板参数和所述目标映射矩阵, 确定所述类型对应的目标模板; 将所述目标模板和各文本信息进行组合, 确定各第二训练样本, 并确定所述各第二训 练样本分别对应的标注; 根据所述各第二训练样本的标注, 对所述目标模板参数重新进行调整。 4.如权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 将所述各第一训练样本对应的各语言处 理任务的类型, 作为各第一类型; 接收携带有语言处理任务的类型的调整请求, 并判断所述类型是否属于所述各第 一类 型; 若否, 获取所述类型对应的目标模板参数, 根据所述目标模板参数和所述目标映射矩 阵, 确定所述类型对应的目标模板, 并基于各文本信息和所述目标模板进 行组合, 确定各第 二训练样本及其标注, 以及根据所述各第二训练样本的标注, 对所述类型对应的目标模板 参数进行调整。 5.如权利要求1所述的方法, 其特征在于, 根据所述目标模板参数和预先确定出的目标 映射矩阵, 确定所述语言处 理任务的目标模板, 具体包括: 根据所述目标模板参数以及目标映射矩阵, 确定所述语言处 理任务对应的特 征向量; 从预先确定出的各类型分别对应的人工标注中, 确定所述类型对应的人工标注; 根据所述人工标注和所述特 征向量, 确定所述语言处 理任务的目标模板 。权 利 要 求 书 1/2 页 2 CN 115146601 A 26.如权利要求2所述的方法, 其特 征在于, 采用下述方式训练所述指定语言模型, 其中: 获取若干文本信息和若干掩膜; 针对每个掩膜, 将该掩膜和各文本信息进行组合, 确定该掩膜对应的各第三训练样本 及其标注, 所述第三训练样本为将文本信息用所述掩膜进行遮盖后的结果, 所述标注为所 述文本信息; 根据所述各第三训练样本及其标注, 确定损 失, 并根据所述损 失将所述指定语言模型 的模型参数进行调整。 7.如权利要求3或4所述的方法, 其特征在于, 根据 所述各第 二训练样本的标注, 对所述 目标模板参数重新进行调整, 具体包括: 将所述各第二训练样本作为输入, 输入所述目标语言模型中, 得到所述目标语言模型 输出的所述各第二训练样本分别对应的执 行结果; 采用演化策略对所述目标模板参数进行调整, 并根据调整后的目标模板参数迭代确定 各第二训练样本及其执 行结果, 直至所述各第二训练样本的执 行结果和标注一 致。 8.一种语言处 理装置, 其特 征在于, 所述装置包括: 响应模块, 用于响应于语言处理任务, 根据 所述语言处理任务的类型, 确定所述语言处 理任务对应的模板参数, 以及所述语言处 理任务对应的文本信息; 确定模块, 用于根据所述模板参数和预先确定出的映射矩阵, 确定所述语言处理任务 的模板, 其中, 所述映射矩阵用于将不同语言处理任务分别对应的模板参数映射为不同模 板; 执行模块, 用于将所述模板和所述文本信 息进行组合, 并将组合结果作为输入, 输入预 选训练好的语言模型中, 得到所述语言模型输出的所述文本信息的执 行结果。 9.一种计算机可读存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算 机程序被处 理器执行时实现上述权利要求1~7任一项所述的方法。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方 法。权 利 要 求 书 2/2 页 3 CN 115146601 A 3

.PDF文档 专利 语言处理任务的执行方法、装置、可读存储介质以及设备

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语言处理任务的执行方法、装置、可读存储介质以及设备 第 1 页 专利 语言处理任务的执行方法、装置、可读存储介质以及设备 第 2 页 专利 语言处理任务的执行方法、装置、可读存储介质以及设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。