说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210549895.9 (22)申请日 2022.05.20 (71)申请人 网易 (杭州) 网络有限公司 地址 310052 浙江省杭州市滨江区长河街 道网商路59 9号4幢7层 (72)发明人 郑杰文 陈泽  (74)专利代理 机构 北京清源汇知识产权代理事 务所(特殊普通 合伙) 11644 专利代理师 冯德魁 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/36(2019.01) (54)发明名称 一种问答方法及系统 (57)摘要 本发明公开了一种问答方法, 包括: 识别输 入问题中的实体, 获取实体对列表; 获取所述实 体对列表中每一个实体对的备选关系, 形成所述 实体对列表对应的备选关系集合; 根据所述输入 问题及所述备选关系集合, 获取所述输入问题在 所述备选关系集合上的概率分布; 获取包含所述 实体对列表中任意一个实体对的已知问题在所 述备选关系集合上的概率分布; 计算所述输入问 题与所述已知问题在所述备选关系集合上的概 率分布的相似度, 并根据所述概率分布的相似度 确定所述输入问题对应的输出答复。 该方法是一 种基于概率 分布及概率分布相似度的问答方法, 解决了现有技术中无法对多实体问题及缺失关 系问题进行解答的技术问题, 提升了问答技术的 全面性。 权利要求书3页 说明书21页 附图4页 CN 115129834 A 2022.09.30 CN 115129834 A 1.一种问答方法, 其特 征在于, 包括: 识别输入问题中的实体, 获取实体对列表; 获取所述实体对列表中每一个实体对的备选关系, 形成所述实体对列表对应的备选关 系集合; 根据所述输入问题及所述备选关系集合, 获取所述输入问题在所述备选关系集合上的 概率分布; 获取包含所述实体对列表中任意一个实体对的已知问题在所述备选关系集合上的概 率分布; 计算所述输入问题与 所述已知问题在所述备选关系集合上的概率分布的相似度, 并根 据所述概率分布的相似度确定所述输入问题对应的输出答复。 2.根据权利要求1所述的方法, 其特征在于, 所述识别输入问题中的实体, 获取实体对 列表, 包括: 通过实体识别模型识别所述输入问题中的实体; 将所述输入问题中的实体进行两 两组队, 形成所述实体对列表。 3.根据权利要求2所述的方法, 其特 征在于, 获得 所述实体识别模型的方法, 包括: 以知识图谱中存在的实体作为训练数据, 提供 给初始实体识别模型, 对其进行训练; 将训练后达 到预定标准的实体识别模型作为实际使用的所述实体识别模型。 4.根据权利要求1所述的方法, 其特征在于, 所述获取所述实体对列表中每一个实体对 的备选关系, 包括: 以所述实体对在 知识图谱中存在的关系为备选关系。 5.据权利要求1所述的方法, 其特征在于, 所述获取所述实体对列表中每一个实体对的 备选关系, 还 包括: 以所述实体对 对应的类型对在 知识图谱中存在的关系为备选关系。 6.根据权利要求1所述的方法, 其特征在于, 所述根据所述输入问题及所述备选关系集 合, 获取所述输入问题在所述备选关系集 合上的概 率分布, 包括: 通过关系抽取模型获取所述输入问题在所述备选关系集合中的每一个备选关系上的 得分; 根据所述输入问题在所述备选关系集合中的每一个备选关系上的得分, 形成所述输入 问题在所述备选关系集 合上的概 率分布。 7.根据权利要求6所述的方法, 其特 征在于, 获得 所述关系抽取模型的方法, 包括: 以问答库中的已知问题及所述已知问题中实体对对应的关系 描述作为训练数据, 提供 给初始关系抽取模型, 对其进行训练; 将训练后达 到预定标准的关系抽取模型作为实际使用的所述关系抽取模型。 8.根据权利要求6所述的方法, 其特征在于, 所述通过关系抽取模型获取所述输入问题 在所述备选关系集 合中的每一个备选关系上的得分, 包括: 将所述备选关系集 合中的每一个备选关系映射 为关系描述; 通过所述关系抽取模型, 获取所述输入问题在每一个所述备选关系的关系 描述上的正 确的概率; 以所述输入问题在每一个所述备选关系的关系 描述上的正确的概率, 作为所述输入问 题在每一个所述备选关系上的得分。 9.根据权利要求8所述的方法, 其特征在于, 所述将所述备选关系集合中的每一个备选权 利 要 求 书 1/3 页 2 CN 115129834 A 2关系映射为关系描述, 包括: 根据关系与关系描述列 表, 对应获取所述备选 关系集合中的每 一个备选关系的关系描述。 10.根据权利要求1所述的方法, 其特征在于, 所述获取包含所述实体对列表中任意一 个实体对的已知问题在所述备选关系集 合上的概 率分布, 包括: 从问答库中获取包 含所述实体对列表中任意 一个实体对的全部已知问题; 通过关系抽取模型, 获取每一个所述已知问题在所述备选关系集 合上的概 率分布。 11.根据权利要求1所述的方法, 其特征在于, 所述计算所述输入问题与所述已知问题 在所述备选 关系集合上的概率分布的相似程度, 并根据所述相似程度确定所述输入问题对 应的输出答复, 包括: 计算所述输入问题在所述备选关系集合上的概率分布与所述已知问题在所述备选关 系集合上的概 率分布的JS散度值; 根据所述JS散度值判断所述输入问题与所述已知问题的相似度; 根据所述输入问题与所述已知问题的相似度, 确定所述输入问题对应的输出答复。 12.根据权利要求11所述的方法, 其特征在于, 所述根据所述JS散度值判断所述输入问 题与所述已知问题的相似度, 包括: 比较所述JS散度值是否小于预设相似度阈值; 根据比较结果, 判断所述输入问题是否与所述已知问题相似, 包括: 若是, 则所述输入 问题与所述已知问题相似; 若否, 则所述输入问题与所述已知问题不相似。 13.根据权利要求11所述的方法, 其特征在于, 所述根据所述JS散度值判断所述输入问 题与所述已知问题的相似度, 还 包括: 比较多个所述JS散度值的大小; 根据比较结果, 判断与所述输入问题相似度最高的所述已知问题, 包括: JS散度值越 小, 所述输入问题与所述已知问题的相似度越高。 14.根据权利要求11所述的方法, 其特征在于, 所述根据 所述输入问题与所述已知问题 的相似度, 确定所述输入问题对应的输出答复, 包括: 以与所述输入问题的相似度最高的所 述已知问题的答案作为所述输入问题对应的输出答复。 15.一种问答系统, 其特征在于, 包括: 实体识别单元、 备选关系获取单元、 输入问题概 率分布获取 单元、 已知问题概 率分布获取 单元、 相似度计算单 元; 所述实体识别单 元, 用于识别输入问题中的实体, 获取实体对列表; 所述备选关系获取单元, 用于获取所述实体对列表中每一个实体对的备选关系, 形成 所述实体对列表对应的备选关系集 合; 所述输入问题概率分布获取单元, 用于根据所述输入问题及所述备选关系集合, 获取 所述输入问题在所述备选关系集 合上的概 率分布; 所述已知问题概率分布获取单元, 用于获取包含所述实体对列表中任意一个实体对的 已知问题在所述备选关系集 合上的概 率分布; 所述相似度计算单元, 用于计算所述输入问题与 所述已知问题在所述备选关系集合上 的概率分布的相似度, 并根据所述 概率分布的相似度确定所述输入问题对应的输出答复。 16.一种电子设备, 其特 征在于, 包括: 存 储器、 处理器; 所述存储器, 用于存 储一条或多条计算机指令;权 利 要 求 书 2/3 页 3 CN 115129834 A 3

.PDF文档 专利 一种问答方法及系统

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种问答方法及系统 第 1 页 专利 一种问答方法及系统 第 2 页 专利 一种问答方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。