说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211441290.4 (22)申请日 2022.11.17 (71)申请人 苏州浪潮智能科技有限公司 地址 215100 江苏省苏州市吴中经济开发 区郭巷街道官浦路1号9幢 (72)发明人 刘红丽 李峰  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 王华 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/289(2020.01) G06F 40/58(2020.01) G06K 9/62(2022.01) (54)发明名称 一种对话模 型的训练方法及装置、 对话响应 方法及装置 (57)摘要 本发明公开了一种对话模型的训练方法, 包 括: 利用通用对话数据集对原始对话模型进行训 练, 得到通用对话模型; 获取预设的专业关键词 组, 根据专业关键词组对通用对话数据集进行数 据筛选; 利用筛选到的初始标注数据集对通用对 话模型进行训练, 得到初始专业对话模型; 利用 验证数据集和预设自然语言处理评价指标对初 始专业对话模型进行验证, 得到验证得分; 判断 验证得分是否大于预设得分阈值; 若是, 则将初 始专业对话模 型确定为目标专业对话模型。 本发 明使得训练出来的目标专业对话模型同时拥有 通用性和专业性, 提升了用户使用体验。 本发明 还公开了一种对话模型的训练装置、 对话响应方 法及装置、 电子设备及计算机可读存储介质, 具 有相应技 术效果。 权利要求书4页 说明书19页 附图5页 CN 115495568 A 2022.12.20 CN 115495568 A 1.一种对话模型的训练方法, 其特 征在于, 包括: 利用预获取的通用对话数据集对原 始对话模型进行训练, 得到通用对话模型; 获取预设的专业关键词组, 并根据 所述专业关键词组对所述通用对话数据集进行数据 筛选, 将筛选得到的数据集确定为初始标注数据集; 利用所述初始标注数据集对所述 通用对话模型进行训练, 得到初始 专业对话模型; 利用验证数据集和预设自然语言处理评价指标对所述初始专业对话模型进行验证操 作, 得到验证得分; 判断所述验证得分是否大于预设得分阈值; 若是, 则将所述初始 专业对话模型确定为目标专业对话模型。 2.根据权利要求1所述的对话模型的训练方法, 其特征在于, 当确定所述验证得分小于 等于所述预设得分阈值时, 还 包括: 利用所述初始 专业对话模型针对预设未 标记池中各样本数据生成对应的响应数据; 分别计算各 所述响应数据对应的自动评估得分; 对各所述自动评估得分进行大小排序, 从得分较小的一端选取预设数量个自动评估得 分; 输出对选取 得到的各 所述自动评估得分对应的响应数据进行 标注的标注提 示信息; 根据标注结果对初始标注数据集进行 更新, 得到更新后标注数据集; 基于所述更新后标注数据集对所述初始专业对话模型进行训练, 得到更新后专业对话 模型; 利用所述验证数据集对所述更新后专业对话模型进行验证操作, 得到验证得分, 并重 复执行所述判断所述验证得分是否大于预设得分阈值的步骤。 3.根据权利要求2所述的对话模型的训练方法, 其特征在于, 在得到更新后标注数据集 之后, 还包括: 根据所述更新后标注数据集对所述预设未 标记池进行 更新操作。 4.根据权利要求1所述的对话模型的训练方法, 其特征在于, 利用验证数据集和预设 自 然语言处 理评价指标对所述初始 专业对话模型进行验证操作, 包括: 通过以下公式结合所述验证数据集、 BLEU指标、 ROUGE指标、 PPL指标、 DISTINCT指标对 所述初始 专业对话模型进行验证操作: ; 其中, 为所述初始专业对话模型在BLEU指标上的得 分, 为所述初始 专业对话模型在ROUGE指标上的得分, 为所述初始专业对话模型在PPL指标上的得 分, 采用PPL指标得分的倒数形式, 为所述初始专业对话模型在DIST INCT指标上 的得分, 为验证得分。 5.根据权利要求4所述的对话模型的训练方法, 其特征在于, 还包括所述初始专业对话 模型在BLEU指标上的得分 的计算过程, 所述初始专业对话模型在BLEU指标上的 得分 的计算过程包括:权 利 要 求 书 1/4 页 2 CN 115495568 A 2通过以下公式计算所述初始 专业对话模型在 BLEU指标 上的得分 : ; 其中, , 为机器译文的长度, 为最短的参考翻译句子的长 度, 为n‑gram的精确率, 为n‑gram的权重, 对于任意n都有 , BP 为惩罚因 子。 6.根据权利要求4所述的对话模型的训练方法, 其特征在于, 还包括所述初始专业对话 模型在ROUGE指标上的得分 的计算过程, 所述初始专业对话模型在ROUGE指标上 的得分 的计算过程包括: 通过以下公式计算所述初始 专业对话模型在ROUGE指标 上的得分 : ; 其中, {参考译文}表示参考译文集合, 表示N个字的组合, 表示 计算译文中N ‑gram的数目, 公式的分母是统计在所有的参考译文中N ‑gram的个数, 分子是 统计所有参 考译文与机器译 文共有的N ‑gram个数。 7.根据权利要求4所述的对话模型的训练方法, 其特征在于, 还包括所述初始专业对话 模型在PPL指 标上的得分 的计算过程, 所述初始专业对话模型在PPL指 标上的得分 的计算过程: ; 其中, 表示根据上文词语预测第i个词的概 率, N代表句子长度。 8.根据权利要求4所述的对话模型的训练方法, 其特征在于, 还包括所述初始专业对话 模型在DISTINCT指标上的得分 的计算过程, 所述初始专业对话模型在 DISTINCT 指标上的得分 的计算过程包括: 通过以下公式计算所述初始 专业对话模型在DISTI NCT指标上的得分 : ;权 利 要 求 书 2/4 页 3 CN 115495568 A 3

.PDF文档 专利 一种对话模型的训练方法及装置、对话响应方法及装置

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种对话模型的训练方法及装置、对话响应方法及装置 第 1 页 专利 一种对话模型的训练方法及装置、对话响应方法及装置 第 2 页 专利 一种对话模型的训练方法及装置、对话响应方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。