专利一种对话模型的训练方法及装置、对话响应方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211441290.4 (22)申请日 2022.11.17 (71)申请人苏州浪潮智能科技有限公司地址 215100 江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢 (72)发明人刘红丽　李峰　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师王华 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/289(2020.01) G06F 40/58(2020.01) G06K 9/62(2022.01) (54)发明名称一种对话模型的训练方法及装置、对话响应方法及装置 (57)摘要本发明公开了一种对话模型的训练方法，包括：利用通用对话数据集对原始对话模型进行训练，得到通用对话模型；获取预设的专业关键词组，根据专业关键词组对通用对话数据集进行数据筛选；利用筛选到的初始标注数据集对通用对话模型进行训练，得到初始专业对话模型；利用验证数据集和预设自然语言处理评价指标对初始专业对话模型进行验证，得到验证得分；判断验证得分是否大于预设得分阈值；若是，则将初始专业对话模型确定为目标专业对话模型。本发明使得训练出来的目标专业对话模型同时拥有通用性和专业性，提升了用户使用体验。本发明还公开了一种对话模型的训练装置、对话响应方法及装置、电子设备及计算机可读存储介质，具有相应技术效果。权利要求书4页说明书19页附图5页 CN 115495568 A 2022.12.20 CN 115495568 A 1.一种对话模型的训练方法，其特征在于，包括：利用预获取的通用对话数据集对原始对话模型进行训练，得到通用对话模型；获取预设的专业关键词组，并根据所述专业关键词组对所述通用对话数据集进行数据筛选，将筛选得到的数据集确定为初始标注数据集；利用所述初始标注数据集对所述通用对话模型进行训练，得到初始专业对话模型；利用验证数据集和预设自然语言处理评价指标对所述初始专业对话模型进行验证操作，得到验证得分；判断所述验证得分是否大于预设得分阈值；若是，则将所述初始专业对话模型确定为目标专业对话模型。 2.根据权利要求1所述的对话模型的训练方法，其特征在于，当确定所述验证得分小于等于所述预设得分阈值时，还包括：利用所述初始专业对话模型针对预设未标记池中各样本数据生成对应的响应数据；分别计算各所述响应数据对应的自动评估得分；对各所述自动评估得分进行大小排序，从得分较小的一端选取预设数量个自动评估得分；输出对选取得到的各所述自动评估得分对应的响应数据进行标注的标注提示信息；根据标注结果对初始标注数据集进行更新，得到更新后标注数据集；基于所述更新后标注数据集对所述初始专业对话模型进行训练，得到更新后专业对话模型；利用所述验证数据集对所述更新后专业对话模型进行验证操作，得到验证得分，并重复执行所述判断所述验证得分是否大于预设得分阈值的步骤。 3.根据权利要求2所述的对话模型的训练方法，其特征在于，在得到更新后标注数据集之后，还包括：根据所述更新后标注数据集对所述预设未标记池进行更新操作。 4.根据权利要求1所述的对话模型的训练方法，其特征在于，利用验证数据集和预设自然语言处理评价指标对所述初始专业对话模型进行验证操作，包括：通过以下公式结合所述验证数据集、 BLEU指标、 ROUGE指标、 PPL指标、 DISTINCT指标对所述初始专业对话模型进行验证操作：；其中，为所述初始专业对话模型在BLEU指标上的得分，为所述初始专业对话模型在ROUGE指标上的得分，为所述初始专业对话模型在PPL指标上的得分，采用PPL指标得分的倒数形式，为所述初始专业对话模型在DIST INCT指标上的得分，为验证得分。 5.根据权利要求4所述的对话模型的训练方法，其特征在于，还包括所述初始专业对话模型在BLEU指标上的得分的计算过程，所述初始专业对话模型在BLEU指标上的得分的计算过程包括：权　利　要　求　书 1/4 页 2 CN 115495568 A 2通过以下公式计算所述初始专业对话模型在 BLEU指标上的得分：；其中，，为机器译文的长度，为最短的参考翻译句子的长度，为n‑gram的精确率，为n‑gram的权重，对于任意n都有， BP 为惩罚因子。 6.根据权利要求4所述的对话模型的训练方法，其特征在于，还包括所述初始专业对话模型在ROUGE指标上的得分的计算过程，所述初始专业对话模型在ROUGE指标上的得分的计算过程包括：通过以下公式计算所述初始专业对话模型在ROUGE指标上的得分：；其中， {参考译文}表示参考译文集合，表示N个字的组合，表示计算译文中N ‑gram的数目，公式的分母是统计在所有的参考译文中N ‑gram的个数，分子是统计所有参考译文与机器译文共有的N ‑gram个数。 7.根据权利要求4所述的对话模型的训练方法，其特征在于，还包括所述初始专业对话模型在PPL指标上的得分的计算过程，所述初始专业对话模型在PPL指标上的得分的计算过程：；其中，表示根据上文词语预测第i个词的概率， N代表句子长度。 8.根据权利要求4所述的对话模型的训练方法，其特征在于，还包括所述初始专业对话模型在DISTINCT指标上的得分的计算过程，所述初始专业对话模型在 DISTINCT 指标上的得分的计算过程包括：通过以下公式计算所述初始专业对话模型在DISTI NCT指标上的得分：；权　利　要　求　书 2/4 页 3 CN 115495568 A 3

专利 一种对话模型的训练方法及装置、对话响应方法及装置

专利一种对话模型的训练方法及装置、对话响应方法及装置