说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210958184.7 (22)申请日 2022.08.10 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 陆华 鲍思琪 何煌 王凡 吴华  黄世维  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 孟洋 (51)Int.Cl. G06F 16/332(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 信息处理与模型训练方法、 装置、 设备、 介质 及程序产品 (57)摘要 本公开提供了一种信息处理与模型训练方 法、 装置、 设备、 介质及程序产品。 本公开涉及计 算机技术技术领域, 尤其涉及一种人工智能和语 音技术领域。 在本公开的一些实施例中, 根据修 正回复样 本语句、 第二候选回复样 本语句和召回 回复样本语句进行训练得到对话模型初始对话 样本语句输入初始对话模型中得到多个候选回 复样本语句, 第二候选回复样 本语句为多个候选 回复样本语句中的任意一个语句, 修正回复样本 语句为对候选回复样本中的第一回复样本语句 进行修正得到的对话质量较高的语句; 召回回复 样本语句为训练样本语句中除初始对话样本语 句和多个候选回复样本语句之外的其他样本语 句; 得到对话精度较高的对话模 型和对话质量较 高的目标回复语句。 权利要求书3页 说明书9页 附图3页 CN 115292467 A 2022.11.04 CN 115292467 A 1.一种信息处 理方法, 包括: 获取初始对话语句; 将所述初始对话语句输入已经训练完成的对话模型中, 得到目标回复语句; 其中, 所述对话模型为根据修正回复样本语句、 第二候选回复样本语句和召回回复样 本语句进行训练得到的模型; 其中, 初始对话样本语句 输入初始对话模型中得到多个候选 回复样本语句; 所述第二候选回复样本语句为所述多个候选回复样本语句中的任意一个语 句; 所述修正回复样本语句为对所述候选回复样本中的第一回复样本语句进 行修正得到的 语句; 所述召回回复样本语句为训练样本语句中除所述初始对话样本语句和所述多个候选 回复样本语句之外的其 他样本语句。 2.根据权利要求1所述的方法, 其中, 所述将所述初始对话语句输入已经训练完成的对 话模型中, 得到目标回复语句, 包括: 在所述对话模型内部, 将所述初始对话语句输入所述对话模型的语句生成模型中, 得 到多个候选回复语句和每 个所述候选回复语句的概 率; 将所述多个候选回复语句和每个所述候选回复语句的概率输入所述对话模型的语句 确定模型中, 得到目标回复语句。 3.根据权利要求2所述的方法, 其中, 所述将所述多个候选回复语句和每个所述候选回 复语句的概 率输入所述对话模型的语句确定模型中, 得到目标回复语句, 包括: 将所述多个候选回复语句和每个所述候选回复语句的概率输入所述语句确定模型中, 从所述多个候选回复语句中选择 出概率最大的目标回复语句。 4.一种模型训练方法, 包括: 获取初始对话样本语句; 将所述初始对话样本语句输入初始对话模型中, 得到多个候选回复样本语句; 对所述多个候选回复样本语句中的第 一候选回复样本语句进行修正, 得到修正回复样 本语句; 根据所述修正 回复样本语句、 所述多个候选回复样本语句中的第 二候选回复样本语句 和召回回复样本语句对所述初始对话模型进行训练, 得到对话模型; 其中, 所述召回回复样本语句为训练样本语句中除所述初始对话样本语句和所述多个 候选回复样本语句之外的其 他样本语句。 5.根据权利要求4所述的方法, 其中, 所述根据所述修正回复样本语句、 所述多个候选 回复样本语句中的第二候选回复样本语句和召回回复样本语句对所述初始对话模型进行 训练, 得到对话模型, 包括: 将所述修正 回复样本语句、 所述第 二候选回复样本语句和所述召回回复样本语句输入 所述初始对话模型的语句生 成模型中, 得到 真实回复语句、 修正回复样本语句概率、 第二候 选回复样本语句概 率和召回 回复样本语句概 率; 根据所述真实回复语句、 所述修正回复样本语句概率、 所述第二候选回复样本语句概 率和所述召回回复样本语句概率对所述初始对话模型中的所述初始语句生成模型和初始 语句确定模型进行 联合训练, 得到所述对话模型。 6.根据权利要求5所述的方法, 其中, 所述根据所述真实回复语句、 所述修正回复样本 语句概率、 所述第二候选回复样本语句概率和所述召回回复样本语句概率对所述初始对话权 利 要 求 书 1/3 页 2 CN 115292467 A 2模型中的所述初始语句生成模型和初始语句确定模型进行联合训练, 得到所述对话模型, 包括: 根据所述真实回复语句和所述 修正回复样本语句, 确定损失函数; 根据所述损失函数, 以所述修正 回复样本语句概率大于所述第 二候选回复样本语句概 率、 所述修正回复样本语句概率大于所述召回回复样本语句概率、 所述第二候选回复样本 语句概率大于所述召回回复样本语句概率为训练目标, 对所述初始语句生成模型和所述初 始语句确定模型进行 联合训练, 得到所述对话模型。 7.一种信息处 理装置, 包括: 获取模块, 用于获取初始对话语句; 输入模块, 用于将所述初始对话语句输入已经训练完成的对话模型中, 得到目标回复 语句; 其中, 所述对话模型为根据修正回复样本语句、 第二候选回复样本语句和召回回复样 本语句进行训练得到的模型; 其中, 初始对话样本语句 输入初始对话模型中得到多个候选 回复样本语句; 所述第二候选回复样本语句为所述多个候选回复样本语句中的任意一个语 句; 所述修正回复样本语句为对所述候选回复样本中的第一回复样本语句进 行修正得到的 语句; 所述召回回复样本语句为训练样本语句中除所述初始对话样本语句和所述多个候选 回复样本语句之外的其 他样本语句。 8.根据权利要求7所述的装置, 其中, 所述输入模块在将所述初始对话语句输入已经训 练完成的对话模型中, 得到目标回复语句时, 用于: 在所述对话模型内部, 将所述初始对话语句输入所述对话模型的语句生成模型中, 得 到多个候选回复语句和每 个所述候选回复语句的概 率; 将所述多个候选回复语句和每个所述候选回复语句的概率输入所述对话模型的语句 确定模型中, 得到目标回复语句。 9.根据权利要求8所述的装置, 其中, 所述输入模块在将所述多个候选回复语句和每个 所述候选回复语句的概率输入所述对话模型 的语句确定模型中, 得到目标回复语句时, 用 于: 将所述多个候选回复语句和每个所述候选回复语句的概率输入所述语句确定模型中, 从所述多个候选回复语句中选择 出概率最大的目标回复语句。 10.一种模型训练装置, 包括: 语句获取模块, 获取初始对话样本语句; 语句输入模块, 将所述初始对话样本语句输入初始对话模型中, 得到多个候选回复样 本语句; 修正模块, 对所述多个候选回复样本语句中的第一候选回复样本语句进行修正, 得到 修正回复样本语句; 训练模块, 根据所述修正回复样本语句、 所述多个候选回复样本语句中的第二候选回 复样本语句和召回 回复样本语句对所述初始对话模型进行训练, 得到对话模型; 其中, 所述召回回复样本语句为训练样本语句中除所述初始对话样本语句和所述多个 候选回复样本语句之外的其 他样本语句。 11.根据权利要求10所述的装置, 其中, 所述训练模块在根据所述修正回复样本语句、权 利 要 求 书 2/3 页 3 CN 115292467 A 3

.PDF文档 专利 信息处理与模型训练方法、装置、设备、介质及程序产品

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息处理与模型训练方法、装置、设备、介质及程序产品 第 1 页 专利 信息处理与模型训练方法、装置、设备、介质及程序产品 第 2 页 专利 信息处理与模型训练方法、装置、设备、介质及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:04:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。