说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210579279.8 (22)申请日 2022.05.25 (71)申请人 海信视像科技股份有限公司 地址 266555 山东省青岛市经济技 术开发 区前湾港路218号 (72)发明人 潘程 王敏 杨善松  (74)专利代理 机构 北京国之大铭知识产权代理 事务所(普通 合伙) 11565 专利代理师 张平 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 16/732(2019.01) G06F 16/735(2019.01) (54)发明名称 模型训练方法、 短视频召回方法、 装置、 设备 和介质 (57)摘要 本公开涉及一种模型训练方法、 短视频召回 方法、 装置、 设备和介质, 包 括: 获取训练样本; 定 义语义理解模型, 其中, 语义理解模型包括第一 语义理解模 型和第二语义理解模 型, 第一语义理 解模型和所述第二语义理解模型并联连接; 基于 第一训练样 本和第一语义理解模 型, 生成对应的 第一语义向量, 基于第二训练样 本和第二语义理 解模型, 生成对应的第二语义向量; 基于第一语 义向量和第二语义向量的损失函数值, 对语义理 解模型进行训练, 得到目标语义理解模型, 保证 语义理解模 型更准确, 且有利于提高领域对话理 解的准确性。 权利要求书2页 说明书15页 附图11页 CN 115114931 A 2022.09.27 CN 115114931 A 1.一种语义理解模型训练方法, 其特 征在于, 包括: 获取训练样本, 其中, 所述训练样本包括第一训练样本和第 二训练样本, 所述第 一训练 样本包括自然语言文本、 所述自然语言文本对应的标签以及所述自然语言本文所属的领 域, 所述第二训练样本包括基于所述自然语言文本召回的短视频媒资的标题信息以及召回 的所述短视频媒资对应的标签; 定义语义理解模型, 其中, 所述语义理解模型包括第一语义理解模型和第二语义理解 模型, 所述第一语义理解模型和所述第二语义理解模型并联 连接; 基于所述第一训练样本和所述第一语义理解模型, 生成对应的第一语义向量, 基于所 述第二训练样本和所述第二语义理解模型, 生成对应的第二语义向量; 基于所述第 一语义向量和所述第 二语义向量的损失函数值, 对所述语义理解模型进行 训练, 得到目标语义理解模型。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述第 一语义向量和所述第 二语 义向量的损失函数值, 对所述语义理解模型进行训练, 得到目标语义理解模型, 包括: 基于预设损失函数, 确定所述第一语义向量和所述第二语义向量的损失函数值; 根据所述损失函数值, 调整所述语义理解模型的参数, 直至所述语义理解模型收敛, 得 到目标语义理解模型。 3.根据权利要求2所述的方法, 根据所述损 失函数值, 调整所述语义理解模型的参数, 直至所述语义理解模型收敛, 得到目标语义理解模型, 包括: 在所述损失函数值不满足预设阈值 时, 基于所述第 一训练样本对所述第 一语义理解模 型进行训练, 调整所述第一语义理解模型 的参数, 并基于所述第二训练样本对所述第二语 义理解模型进行训练, 调整所述第二语义理解模型的参数; 在所述第一语义理解模型输出的第一语义向量和所述第二语义理解模型输出的第二 语义向量的损失函数值满足预设阈值时, 得到目标语义理解模型。 4.根据权利要求1所述的方法, 其特征在于, 所述第 一语义理解模型包括语义特征提取 单元、 全连接层和 激活函数, 其中, 所述全连接层包括N个子全连接层, 所述激活函数包括N 个子激活函数, 所述语义特征提取单元、 所述全连接层和所述激活函数串联连接, N个子全 连接层并联 连接, N个子 激活函数并联 连接; 所述语义特 征提取单元用于将所述第一训练样本生成对应的语义特 征向量; 所述全连接层用于将所述语义特 征向量映射到不同的子空间得到 子语义特 征向量; 所述激活函数用于对所述全连接映射到子空间的所述子语义特征向量进行特征提取, 并将各个子空间得到的子语义特 征向量进行拼接处 理, 得到第一语义向量。 5.根据权利要求1所述的方法, 其特 征在于, 所述定义语义理解模型之前, 还 包括: 获取所述训练样本对应的负训练样本, 其中, 所述负训练样本包括从训练样本数据集 中选取的短视频媒资的标题信息 。 6.一种短视频召回方法, 其特 征在于, 包括: 获取待预测文本和待召回短视频媒资; 将所述待预测文本输入第 一目标语义理解模型中, 得到所述待预测文本对应的第 一目 标语义向量, 将所述待召回短视频媒资输入第二 目标语义理解模型, 得到所述待召回短视 频媒资对应的第二目标语义向量;权 利 要 求 书 1/2 页 2 CN 115114931 A 2根据所述第 一目标语义向量与所述第 二目标语义向量, 计算待预测文本与待召回短视 频媒资的召回评分; 根据所述召回评分, 确定召回短视频媒资; 其中, 所述目标语义理解模型包括第一目标语义理解模型和第二目标语义理解模型, 所述目标语义理解模型基于如权利要求1至 5任一项所述的方法训练得到 。 7.一种语义理解模型训练装置, 其特 征在于, 包括: 训练样本获取模块, 用于获取训练样本, 其中, 所述训练样本包括第 一训练样本和第二 训练样本, 所述第一训练样本包括自然语言文本、 所述自然语言文本对应的标签以及所述 自然语言本文 所属的领域, 所述第二训练样本包括基于所述自然语言文本召回的短视频媒 资的标题信息以及召回的所述短视频媒资对应的标签; 定义模块, 用于定义语义理解模型, 其中, 所述语义理解模型包括第 一语义理解模型和 第二语义理解模型, 所述第一语义理解模型和所述第二语义理解模型并联 连接; 语义向量生成模块, 用于基于所述第一训练样本和所述第一语义理解模型, 生成对应 的第一语义向量, 基于所述第二训练样本和所述第二语义理解模型, 生成对应的第二语义 向量; 模型确定模块, 用于基于所述第一语义向量和所述第二语义向量的损 失函数值, 对所 述语义理解模型进行训练, 得到目标语义理解模型。 8.一种短视频召回装置, 其特 征在于, 包括: 信息获取模块, 用于获取待预测文本和待召回短视频媒资; 语义向量获取模块, 用于将所述待预测文本输入第一目标语义理解模型中, 得到所述 待预测文本对应的第一目标语义向量, 将所述待召回短视频媒资输入第二目标语义理解模 型, 得到所述待召回短视频媒资对应的第二目标语义向量; 召回评分计算模块, 用于根据所述第一目标语义向量与所述第二目标语义向量, 计算 待预测文本与待召回短视频媒资的召回评分; 召回模块, 用于根据所述召回评分, 确定召回短视频媒资; 其中, 所述目标语义理解模型包括第一目标语义理解模型和第二目标语义理解模型, 所述目标语义理解模型基于如权利要求1至 5任一项所述的方法训练得到 。 9.一种计算机设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实 现如权利要求1 ‑5中任一所述的方法或实现如权利要求6所述的方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现如权利要求1 ‑5中任一所述的方法或实现如权利要求6所述的方法。权 利 要 求 书 2/2 页 3 CN 115114931 A 3

.PDF文档 专利 模型训练方法、短视频召回方法、装置、设备和介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、短视频召回方法、装置、设备和介质 第 1 页 专利 模型训练方法、短视频召回方法、装置、设备和介质 第 2 页 专利 模型训练方法、短视频召回方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。