专利模型训练方法、短视频召回方法、装置、设备和介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210579279.8 (22)申请日 2022.05.25 (71)申请人海信视像科技股份有限公司地址 266555 山东省青岛市经济技术开发区前湾港路218号 (72)发明人潘程　王敏　杨善松　 (74)专利代理机构北京国之大铭知识产权代理事务所(普通合伙) 11565 专利代理师张平 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 16/732(2019.01) G06F 16/735(2019.01) (54)发明名称模型训练方法、短视频召回方法、装置、设备和介质 (57)摘要本公开涉及一种模型训练方法、短视频召回方法、装置、设备和介质，包括：获取训练样本；定义语义理解模型，其中，语义理解模型包括第一语义理解模型和第二语义理解模型，第一语义理解模型和所述第二语义理解模型并联连接；基于第一训练样本和第一语义理解模型，生成对应的第一语义向量，基于第二训练样本和第二语义理解模型，生成对应的第二语义向量；基于第一语义向量和第二语义向量的损失函数值，对语义理解模型进行训练，得到目标语义理解模型，保证语义理解模型更准确，且有利于提高领域对话理解的准确性。权利要求书2页说明书15页附图11页 CN 115114931 A 2022.09.27 CN 115114931 A 1.一种语义理解模型训练方法，其特征在于，包括：获取训练样本，其中，所述训练样本包括第一训练样本和第二训练样本，所述第一训练样本包括自然语言文本、所述自然语言文本对应的标签以及所述自然语言本文所属的领域，所述第二训练样本包括基于所述自然语言文本召回的短视频媒资的标题信息以及召回的所述短视频媒资对应的标签；定义语义理解模型，其中，所述语义理解模型包括第一语义理解模型和第二语义理解模型，所述第一语义理解模型和所述第二语义理解模型并联连接；基于所述第一训练样本和所述第一语义理解模型，生成对应的第一语义向量，基于所述第二训练样本和所述第二语义理解模型，生成对应的第二语义向量；基于所述第一语义向量和所述第二语义向量的损失函数值，对所述语义理解模型进行训练，得到目标语义理解模型。 2.根据权利要求1所述的方法，其特征在于，所述基于所述第一语义向量和所述第二语义向量的损失函数值，对所述语义理解模型进行训练，得到目标语义理解模型，包括：基于预设损失函数，确定所述第一语义向量和所述第二语义向量的损失函数值；根据所述损失函数值，调整所述语义理解模型的参数，直至所述语义理解模型收敛，得到目标语义理解模型。 3.根据权利要求2所述的方法，根据所述损失函数值，调整所述语义理解模型的参数，直至所述语义理解模型收敛，得到目标语义理解模型，包括：在所述损失函数值不满足预设阈值时，基于所述第一训练样本对所述第一语义理解模型进行训练，调整所述第一语义理解模型的参数，并基于所述第二训练样本对所述第二语义理解模型进行训练，调整所述第二语义理解模型的参数；在所述第一语义理解模型输出的第一语义向量和所述第二语义理解模型输出的第二语义向量的损失函数值满足预设阈值时，得到目标语义理解模型。 4.根据权利要求1所述的方法，其特征在于，所述第一语义理解模型包括语义特征提取单元、全连接层和激活函数，其中，所述全连接层包括N个子全连接层，所述激活函数包括N 个子激活函数，所述语义特征提取单元、所述全连接层和所述激活函数串联连接， N个子全连接层并联连接， N个子激活函数并联连接；所述语义特征提取单元用于将所述第一训练样本生成对应的语义特征向量；所述全连接层用于将所述语义特征向量映射到不同的子空间得到子语义特征向量；所述激活函数用于对所述全连接映射到子空间的所述子语义特征向量进行特征提取，并将各个子空间得到的子语义特征向量进行拼接处理，得到第一语义向量。 5.根据权利要求1所述的方法，其特征在于，所述定义语义理解模型之前，还包括：获取所述训练样本对应的负训练样本，其中，所述负训练样本包括从训练样本数据集中选取的短视频媒资的标题信息。 6.一种短视频召回方法，其特征在于，包括：获取待预测文本和待召回短视频媒资；将所述待预测文本输入第一目标语义理解模型中，得到所述待预测文本对应的第一目标语义向量，将所述待召回短视频媒资输入第二目标语义理解模型，得到所述待召回短视频媒资对应的第二目标语义向量；权　利　要　求　书 1/2 页 2 CN 115114931 A 2根据所述第一目标语义向量与所述第二目标语义向量，计算待预测文本与待召回短视频媒资的召回评分；根据所述召回评分，确定召回短视频媒资；其中，所述目标语义理解模型包括第一目标语义理解模型和第二目标语义理解模型，所述目标语义理解模型基于如权利要求1至 5任一项所述的方法训练得到。 7.一种语义理解模型训练装置，其特征在于，包括：训练样本获取模块，用于获取训练样本，其中，所述训练样本包括第一训练样本和第二训练样本，所述第一训练样本包括自然语言文本、所述自然语言文本对应的标签以及所述自然语言本文所属的领域，所述第二训练样本包括基于所述自然语言文本召回的短视频媒资的标题信息以及召回的所述短视频媒资对应的标签；定义模块，用于定义语义理解模型，其中，所述语义理解模型包括第一语义理解模型和第二语义理解模型，所述第一语义理解模型和所述第二语义理解模型并联连接；语义向量生成模块，用于基于所述第一训练样本和所述第一语义理解模型，生成对应的第一语义向量，基于所述第二训练样本和所述第二语义理解模型，生成对应的第二语义向量；模型确定模块，用于基于所述第一语义向量和所述第二语义向量的损失函数值，对所述语义理解模型进行训练，得到目标语义理解模型。 8.一种短视频召回装置，其特征在于，包括：信息获取模块，用于获取待预测文本和待召回短视频媒资；语义向量获取模块，用于将所述待预测文本输入第一目标语义理解模型中，得到所述待预测文本对应的第一目标语义向量，将所述待召回短视频媒资输入第二目标语义理解模型，得到所述待召回短视频媒资对应的第二目标语义向量；召回评分计算模块，用于根据所述第一目标语义向量与所述第二目标语义向量，计算待预测文本与待召回短视频媒资的召回评分；召回模块，用于根据所述召回评分，确定召回短视频媒资；其中，所述目标语义理解模型包括第一目标语义理解模型和第二目标语义理解模型，所述目标语义理解模型基于如权利要求1至 5任一项所述的方法训练得到。 9.一种计算机设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1 ‑5中任一所述的方法或实现如权利要求6所述的方法。 10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1 ‑5中任一所述的方法或实现如权利要求6所述的方法。权　利　要　求　书 2/2 页 3 CN 115114931 A 3

专利 模型训练方法、短视频召回方法、装置、设备和介质

专利模型训练方法、短视频召回方法、装置、设备和介质