说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210708694.9 (22)申请日 2022.06.21 (71)申请人 青岛海信网络科技股份有限公司 地址 266071 山东省青岛市崂山区株洲路 151号 (72)发明人 孙永良 李建伟 汪铎 赵峂  苏晓伟 李浩  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 李迪 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01) G06N 3/08(2006.01)G06N 3/04(2006.01) (54)发明名称 一种问答模型训练方法 (57)摘要 本申请公开了一种 问答模型训练方法及存 储介质。 该方法包括: 根据第一三元组更新第一 知识图谱, 得到更新后的第二知识图谱; 从第一 知识图谱中选择第二三元组, 形成三元组集合; 其中, 三元 组集合中每个三元 组中的头实体与第 一三元组中的头实体相关; 根据三元组集合生成 正例样本集合以及负例样本集合, 正例样本集合 是三元组集合的一个子集, 负样 本集合中的负例 三元组的头实体与所述正例样本集合中的头实 体相同、 尾实体和/或关系与正例样本三元组的 尾实体和/或关系不同; 根据所述正例样本集合 和所述负例样本集合, 更新所述第二知识图谱的 表示模型; 根据第二知 识图谱的表 示模型以及问 答模型的训练样本集合, 对所述问答模型进行训 练。 权利要求书2页 说明书11页 附图7页 CN 115114421 A 2022.09.27 CN 115114421 A 1.一种问答模型训练方法, 其特 征在于, 包括: 根据第一三元组更新第一知识图谱, 得到更新后的第 二知识图谱; 其中, 所述第 一三元 组为待更新到知识图谱中的三元组, 所述第一 三元组包括头实体、 尾实体和关系; 从所述第 一知识图谱中选择第 二三元组, 形成三元组集合; 其中, 所述三元组集合中每 个三元组中的头实体与所述第一 三元组中的头实体相关; 根据所述三元组集合生成正例 样本集合以及负例样本集合, 所述正例样本集合是所述 三元组集合的一个子集, 所述负样本集合中的负例三元组的头实体与所述正例样本集合中 的头实体相同、 尾实体和/或关系与所述 正例样本三元组的尾实体和/或关系不同; 根据所述 正例样本集 合和所述负例样本集 合, 更新所述第二知识图谱的表示模型; 根据所述第 二知识图谱的表示模型以及问答模型的训练样本集合, 对所述问答模型进 行训练。 2.如权利要求1所述的方法, 其特征在于, 所述从所述第一知识图谱中选择第二三元 组, 形成三元组集 合, 包括: 根据所述第一三元组的头实体, 从所述第一知识图谱中选择候选三元组, 所述候选三 元组中的头实体与所述第一 三元组的头实体相关; 根据所述候选三元组中的头实体与尾实体间的关系所属的关系类别, 确定每个关系类 别对应的候选三元组的数量; 选择最高数量对应的关系类别作为目标关系类别, 将关系类别与所述目标关系类别相 同的候选三元组, 构成所述 三元组集 合。 3.如权利要求2所述的方法, 其特征在于, 所述三元组集合中至少包括一跳候选三元组 和二跳候选三元组; 所述根据所述第一三元组的头实体, 从所述第一知识图谱中选择候选三元组, 至少包 括以下步骤: 从所述第一知识图谱中选择一跳候选三元组, 所述一跳候选三元组中的头实体与 所述 第一三元组的头实体相同; 从所述第一知识图谱中选择二跳候选三元组, 所述二跳候选三元组中的头实体与 所述 一跳候选三元组中的头实体相同。 4.如权利要求1所述的方法, 其特征在于, 所述负例三元组中的尾实体, 与所述第一知 识图谱中的第三 三元组中的尾实体相同; 和/或, 所述负例三元组中头实体和尾实体间的关系, 与 所述第一知识图谱中第四三元组中头 实体和尾实体间的关系相同; 其中, 所述第三 三元组和所述第四三元组为所述第一知识图谱中的任意 三元组。 5.如权利要求1所述的方法, 其特征在于, 所述第二知识图谱中每个三元组中的头实 体、 尾实体和关系, 分别用一个复数向量表示。 6.如权利要求5所述的方法, 其特征在于, 所述第二知识图谱中每个三元组中的头实 体、 尾实体和关系, 分别用一个复数向量表示, 包括: 将第五三元组中的头实体、 尾实体以及所述头实体和所述尾实体间的关系, 表示为[1 ×2N]维向量, 所述第五三元组为所述每 个三元组中的任意 一个三元组, N 为大于0的整数; 将所述[1 ×2N]维向量从中间进行拆分, 得到 两个[1×N]维向量;权 利 要 求 书 1/2 页 2 CN 115114421 A 2将所述两个[1 ×N]维向量表示到复空间, 得到所述第五三元组中的头实体的复数向 量、 尾实体的复数向量, 以及所述头实体和所述尾实体间的关系的复数向量。 7.如权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 为所述第一 三元组设置时间戳。 8.如权利要求1 ‑7任一项所述的方法, 其特 征在于, 所述方法, 还 包括: 从所述第二知识图谱中选择多个三元组; 根据所述多个三元组, 生成所述问答模型的训练样本集 合。 9.如权利要求8所述的方法, 其特征在于, 所述从所述第二知识图谱中选择多个三元 组, 包括: 根据所述第 二知识图谱中的三元组 的时间戳确定三元组 的权重, 根据三元组 的权重从 所述第二知识图谱中选择三元组。 10.如权利要求1 ‑7任一项所述的方法, 其特征在于, 根据所述正例样本集合和所述负 例样本集 合, 更新所述第二知识图谱的表示模型, 包括: 将所述正例样本集 合和所述负例样本集 合进行合并; 基于所述第二知识图谱的表示模型的损 失函数, 以及所述第一三元组、 合并后的所述 正例样本集 合和所述负例样本集 合, 更新所述第二知识图谱的表示模型。权 利 要 求 书 2/2 页 3 CN 115114421 A 3

.PDF文档 专利 一种问答模型训练方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种问答模型训练方法 第 1 页 专利 一种问答模型训练方法 第 2 页 专利 一种问答模型训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。