专利语言处理任务的执行方法、装置、可读存储介质以及设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210767656.0 (22)申请日 2022.06.30 (71)申请人北京三快在线科技有限公司地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人任磊　马放　张辰　莫莹　王金刚　武威　 (74)专利代理机构北京曼威知识产权代理有限公司 11709 专利代理师王宏财 (51)Int.Cl. G06F 40/186(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称语言处理任务的执行方法、装置、可读存储介质以及设备 (57)摘要本说明书公开了一种语言处理任务的执行方法、装置、可读存储介质以及设备，通过根据语言处理任务的类型，确定目标模板参数，再根据目标模板参数和用于将不同类型的语言处理任务分别对应的模板参数映射为不同模板的目标映射矩阵，确定目标模板，再将目标模板和文本信息进行组合，输入预先训练好的目标语言模型中，得到文本信息的执行结果。本方法可使用目标语言模型执行多种语言处理任务，成本低，利用率高。权利要求书2页说明书13页附图4页 CN 115146601 A 2022.10.04 CN 115146601 A 1.一种语言处理任务的执行方法，其特征在于，包括：响应于语言处理任务，确定所述语言处理任务对应的文本信息，并根据所述语言处理任务的类型，确定所述类型对应的目标模板参数；根据所述目标模板参数和预先确定出的目标映射矩阵，确定所述语言处理任务的目标模板，其中，所述目标映射矩阵用于将不同类型的语言处理任务分别对应的模板参数映射为不同模板；将所述目标模板和所述文本信息进行组合，并将组合结果作为输入，输入预先训练好的目标语言模型中，得到所述文本信息的执行结果。 2.如权利要求1所述的方法，其特征在于，采用下述方式确定所述目标映射矩阵和各类型分别对应的目标模板参数，其中：获取预先基于若干无标注文本信息自监督训练得到的指定语言模型的模型参数，作为目标语言模型的模型参数；获取所述各类型分别对应的待定模板参数，并根据各待定模板参数和待定映射矩阵，确定所述各类型分别对应的待定模板；将各待定模板和各文本信息分别进行组合，确定各第一训练样本，以及确定所述各第一训练样本分别对应的标注；根据所述各第一训练样本及其标注确定损失，对所述待定映射矩阵和所述各类型分别对应的所述待定模板参数进行调整，并将调整结果分别作为所述目标语言模型对应的目标映射矩阵，以及所述各类型分别对应的目标模板参数。 3.如权利要求2所述的方法，其特征在于，所述方法还包括：接收携带有语言处理任务的类型的调整请求，并根据所述类型，获取所述类型对应的目标模板参数；根据所述目标模板参数和所述目标映射矩阵，确定所述类型对应的目标模板；将所述目标模板和各文本信息进行组合，确定各第二训练样本，并确定所述各第二训练样本分别对应的标注；根据所述各第二训练样本的标注，对所述目标模板参数重新进行调整。 4.如权利要求2所述的方法，其特征在于，所述方法还包括：将所述各第一训练样本对应的各语言处理任务的类型，作为各第一类型；接收携带有语言处理任务的类型的调整请求，并判断所述类型是否属于所述各第一类型；若否，获取所述类型对应的目标模板参数，根据所述目标模板参数和所述目标映射矩阵，确定所述类型对应的目标模板，并基于各文本信息和所述目标模板进行组合，确定各第二训练样本及其标注，以及根据所述各第二训练样本的标注，对所述类型对应的目标模板参数进行调整。 5.如权利要求1所述的方法，其特征在于，根据所述目标模板参数和预先确定出的目标映射矩阵，确定所述语言处理任务的目标模板，具体包括：根据所述目标模板参数以及目标映射矩阵，确定所述语言处理任务对应的特征向量；从预先确定出的各类型分别对应的人工标注中，确定所述类型对应的人工标注；根据所述人工标注和所述特征向量，确定所述语言处理任务的目标模板。权　利　要　求　书 1/2 页 2 CN 115146601 A 26.如权利要求2所述的方法，其特征在于，采用下述方式训练所述指定语言模型，其中：获取若干文本信息和若干掩膜；针对每个掩膜，将该掩膜和各文本信息进行组合，确定该掩膜对应的各第三训练样本及其标注，所述第三训练样本为将文本信息用所述掩膜进行遮盖后的结果，所述标注为所述文本信息；根据所述各第三训练样本及其标注，确定损失，并根据所述损失将所述指定语言模型的模型参数进行调整。 7.如权利要求3或4所述的方法，其特征在于，根据所述各第二训练样本的标注，对所述目标模板参数重新进行调整，具体包括：将所述各第二训练样本作为输入，输入所述目标语言模型中，得到所述目标语言模型输出的所述各第二训练样本分别对应的执行结果；采用演化策略对所述目标模板参数进行调整，并根据调整后的目标模板参数迭代确定各第二训练样本及其执行结果，直至所述各第二训练样本的执行结果和标注一致。 8.一种语言处理装置，其特征在于，所述装置包括：响应模块，用于响应于语言处理任务，根据所述语言处理任务的类型，确定所述语言处理任务对应的模板参数，以及所述语言处理任务对应的文本信息；确定模块，用于根据所述模板参数和预先确定出的映射矩阵，确定所述语言处理任务的模板，其中，所述映射矩阵用于将不同语言处理任务分别对应的模板参数映射为不同模板；执行模块，用于将所述模板和所述文本信息进行组合，并将组合结果作为输入，输入预选训练好的语言模型中，得到所述语言模型输出的所述文本信息的执行结果。 9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～7任一项所述的方法。 10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1～7任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115146601 A 3

专利 语言处理任务的执行方法、装置、可读存储介质以及设备

专利语言处理任务的执行方法、装置、可读存储介质以及设备