说明:收录全网最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111251539.0 (22)申请日 2021.10.21 (71)申请人 泰康保险集团股份有限公司 地址 100031 北京市西城区复兴门内大街 156号 (72)发明人 李钊 刘岩 党莹 宋慧驹 (74)专利代理 机构 隆天知识产权代理有限公司 72003 代理人 郑特强 石海霞 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/36(2019.01) G06F 40/253(2020.01) G06F 40/40(2020.01)G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 多语种推理模型的问答处理方法、 装置、 设 备和可读介质 (57)摘要 本公开提供一种多语种推理模型的问答处 理方法、 装置、 设备和可读介质, 其中, 方法包括: 选取用指定语 言描述的问题集; 选取相同语言的 问答数据集和知识图谱; 根据指定语 言的多种翻 译语法对问答数据集和知识图谱进行翻译, 以获 得i个翻译后的问答数据集和j个翻译后的知识 图谱; 在i个翻译后的问答数据集和j个翻译后的 知识图谱上进行推理训练; 根据训练结果统计在 翻译后的知识 图谱上找到指定答案的知识推理 路径的边的次数; 以次数为权重对j个翻译后的 知识图谱中相应的边进行加权融合, 以得到翻译 后的推理模 型, 适用于回答指定语 言描述的问题 集中的问题。 通过本公开实施例, 降低了多语种 推理模型的构建成本, 提高了问答可靠性和准确 性。 权利要求书2页 说明书12页 附图7页 CN 113987121 A 2022.01.28 CN 113987121 A 1.一种多语种推理模型的问答处 理方法, 其特 征在于, 包括: 选取用指定语言描述的问题集; 选取相同语言的问答数据集和知识图谱; 根据所述指定语言的多种翻译语法对所述问答数据集和所述知识图谱进行翻译, 以获 得i个翻译后的问答数据集和j个翻译后的知识图谱; 在所述i个翻译后的问答数据集和j个翻译后的知识图谱上进行推理训练; 根据训练结果统计在翻译后的知识图谱上找到指定答案的知识推理路径的边的次数; 以所述次数为权重对j个翻译后的知识图谱中相应的边进行加权融合, 以得到翻译后 的推理模型, 翻译后的所述推理模型适用于回答所述指定语言描述的问题集中的问题。 2.如权利要求1所述的多语种推理模型的问答处理方法, 其特征在于, 在所述i个翻译 后的问答数据集和j个翻译后的知识图谱上进行推理训练包括: 将i个翻译后的问答数据集与j个翻译后的知识图谱进行两两组合, 以得到i ×j个训练 样本组合; 对i×j个所述训练样本组合中的任一训练样本组合依次进行推理训练。 3.如权利要求2所述的多语种推理模型的问答处理方法, 其特征在于, 对i ×j个所述训 练样本组合中的任一训练样本组合依次进行推理训练包括: 确定第一个所述训练样本组合中的第一问答数据集和第一知识图谱; 确定所述第一问答数据集中包括 k个问题; 根据所述第一问答数据集中的任一问题提取 所述第一知识图谱中的子知识图谱; 以所述第一问答数据集中的任一问题作为问题节点, 与 所述子知识图谱拼接形成工作 图; 采用神经网络对所述工作图进行关联信息训练; 从训练后的所述工作图中的所述问题节点出发, 确定权重满足阈值要求的节点为备选 答案节点, 记录所述问题 节点与所述备选答案节点之间的推理路径; 对i×j个所述训练样本组合的所述问题节点、 所述备选答案节点和所述推理路径进行 记录。 4.如权利要求3所述的多语种推理模型的问答处理方法, 其特征在于, 根据训练结果统 计在翻译后的知识图谱上找到指定答案的知识推理路径的边的次数包括: 将所述备选答案节点写入答案集; 确定所述 答案集中出现频率 最高的一个备选答案节点 为所述指定答案; 统计所述指定答案节点对应的知识推理路径的边的次数。 5.如权利要求3所述的多语种推理模型的问答处 理方法, 其特 征在于, 还 包括: 确定所述第一知识图谱中的第p条边的两个节点, 分别记作第一节点和第二节点; 确定第p条边被记录的推理路径经 过的次数; 根据所述推理路径经过的次数确定所述第 一节点与所述第 二节点之间的关联强度, 所 述关联强度与进行 所述进行加权融合的权 重值正相关。 6.如权利要求1 ‑5中任一项所述的多语种推理模型的问答处理方法, 其特征在于, 还包 括: 确定所述知识图谱中任一 边的两个节点之间的关联强度;权 利 要 求 书 1/2 页 2 CN 113987121 A 2判断所述关联强度是否小于预设 关联强度; 若判定所述关联强度小于所述预设 关联强度, 则 删除所述关联强度对应的边。 7.如权利要求1 ‑5中任一项所述的多语种推理模型的问答处理方法, 其特征在于, j个 所述知识图谱中相应位置的实体的翻译结果 不同。 8.一种多语种推理模型的问答处 理装置, 其特 征在于, 包括: 选取模块, 设置为选取用指定语言描述的问题集; 所述选取模块还设置为, 选取相同语言的问答数据集和知识图谱; 翻译模块, 设置为根据 所述指定语言的多种翻译语法对所述问答数据集和所述知识图 谱进行翻译, 以获得i个翻译后的问答数据集和j个翻译后的知识图谱; 推理模块, 设置为在所述i个翻译后的问答数据集和j个翻译后的知识图谱上进行推理 训练; 统计模块, 设置为根据训练结果统计在翻译后的知识图谱上找到指定答案的知识推理 路径的边的次数; 融合模块, 设置为以所述次数为权重对j个翻译后的知识图谱中相应的边进行加权融 合, 以得到翻译后的推理模型, 翻译后的所述推理模型适用于回答所述指定语言描述的问 题集中的问题。 9.一种电子设备, 其特 征在于, 包括: 存储器; 以及 耦合到所述存储器的处理器, 所述处理器被配置为基于存储在所述存储器中的指令, 执行如权利要求1 ‑7中任一项所述的多语种推理模型的问答处 理方法。 10.一种计算机可读存储介质, 其上存储有程序, 该程序被处理器执行时实现如权利要 求1‑7中任一项所述的多语种推理模型的问答处 理方法。权 利 要 求 书 2/2 页 3 CN 113987121 A 3
专利 多语种推理模型的问答处理方法、装置、设备和可读介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 02:02:15
上传分享
举报
下载
原文档
(1.3 MB)
分享
友情链接
T-ZZB 1424—2019 节能低噪音三相干式电力变压器.pdf
GB-T 25060-2010 信息安全技术 公钥基础设施 X.509数字证书应用接口规范.pdf
GA-T 1720-2020 移动警务 数字证书格式要求.pdf
GB-T 8239-2014 普通混凝土小型砌块.pdf
公安部 网络安全等级保护条例 征求意见稿 .pdf
T-CSTM 00236—2020 化学试剂 农残级甲醇.pdf
T-HSCA 001—2018 体育场馆钢结构检测与鉴定规程.pdf
DB41-T 2282-2022 独山玉鉴定与原料分级 河南省.pdf
GB-T 42752-2023 区块链和分布式记账技术 参考架构.pdf
T-CADERM 6007—2023 心肺转流系统用空氧混合器.pdf
GB-T 37655-2019 光伏与建筑一体化发电系统验收规范.pdf
DB34-T 3041-2017 杨树大径级用材林培育技术规程 安徽省.pdf
DB3301-T 0416—2023 河湖数字化引排水系统建设与管理规范 杭州市.pdf
GB-T 27930-2023 非车载传导式充电机与电动汽车之间的数字通信协议.pdf
GB-T 43739-2024 数据安全技术 应用商店的移动互联网应用程序(App)个人信息处理规范性审核与管理指南.pdf
DB11-T 140-2015 三相配电变压器节能监测 北京市.pdf
DB52-T 1597-2021 计量检测元数据及交互规范 贵州省.pdf
GB-T 28637-2012 电动采光排烟天窗.pdf
T-CESA 1220—2022 服务器管理北向接口技术要求.pdf
GB 17167-2006 用能单位能源计量器具配备和管理通则.pdf
1
/
3
22
评价文档
赞助1.5元 点击下载(1.3 MB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。