说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210582333.4 (22)申请日 2022.05.26 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 田孟 冯欣伟 姜文斌 陈帅宇  吴学谦 柴春光 李斐斐 时鸿剑  孙雨 王煜 杨霖  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 罗岚 (51)Int.Cl. G06F 40/253(2020.01) G06F 40/247(2020.01) G06F 40/30(2020.01) (54)发明名称 提问信息生成方法、 装置、 电子设备及存储 介质 (57)摘要 本公开提出了提问信息生成方法、 装置、 电 子设备及存储介质, 涉及人工智 能技术领域, 具 体涉及知识图谱、 深度学习、 自然语言处理等技 术领域。 具体实现方案为: 从结构化知识库中获 取至少一组键值对; 根据设定的树形结构模板, 对所述至少一组键值对进行 组合, 以得到树形结 构; 根据树形结构中至少一个条件层中的属性 键、 属性值和关联关系, 生成对应条件层的至少 一组词语组合; 根据各条件层的至少一组词语组 合, 以及顶层对应的疑问文本, 生成提问信息。 由 此, 基于各条件层的至少一组词语组合, 生成提 问信息, 提高了生成提问信息的灵活性, 降低了 生成提问信息的生成难度, 同时, 无需人工标注, 降低了人工成本 。 权利要求书4页 说明书15页 附图10页 CN 114861639 A 2022.08.05 CN 114861639 A 1.一种提问信息生成方法, 包括: 从结构化知识库中获取至少一组键值对; 根据设定的树形结构模板, 对所述至少一组键值对进行组合, 以得到树形结构, 其中, 所述树形结构 中包括用于指示疑问文本的顶层, 以及所述顶层下 的至少一个条件层, 任一 所述条件层对应一组键值对中的属 性键和属 性值以及所述属 性键和所述属 性值之间的关 联关系; 根据所述至少一个条件层中的所述属性键、 属性值和所述关联关系, 生成对应条件层 的至少一组词语组合; 根据各所述条件层的所述至少一组词语组合, 以及所述顶层对应的疑问文本, 生成提 问信息。 2.根据权利要求1所述的方法, 其中, 所述根据各所述条件层的所述至少一组词语组 合, 以及所述顶层对应的疑问文本, 生成提问信息, 包括: 在所述条件层为多个的情况下, 根据处于底层的条件层的各组所述词语组合, 生成至 少一条文本片段; 对处于所述底层和顶层 之间的任一中间条件层, 基于处在所述中间条件层之下且邻 接 的一个条件层所生成的至少一条文本片段, 以及所述中间条件层的至少一组词语组合, 生 成所述中间条件层的至少一条文本片段; 根据所述顶层对应的疑 问文本, 以及处在所述顶层 之下且邻 接的一个中间条件层所生 成的至少一条文本片段, 采用端到端的句子生成模型生成所述 提问信息 。 3.根据权利要求1所述的方法, 其中, 所述根据各所述条件层的所述至少一组词语组 合, 以及所述顶层对应的疑问文本, 生成提问信息, 包括: 对所述至少一个条件层中的任一条件层, 根据所述至少一组词语组合, 生成对应条件 层的至少一条文本片段; 根据所述至少一个条件层所生成的至少一条文本片段, 以及所述顶层对应的疑问文 本, 采用端到端的句子生成模型生成所述 提问信息 。 4.根据权利要求1 ‑3任一项所述的方法, 其中, 所述根据所述至少一个条件层中的所述 属性键、 属性 值和所述关联关系, 生成对应条件层的至少一组词语组合, 包括: 对所述至少一个条件层中的属性键、 属性值和所述关联关系, 分别确定所述属性键的 同义词语集 合、 所述属性 值的同义词语集 合, 以及所述关联关系的同义词语集 合; 从所述属性键的同义词语集合、 所述属性值的同义词语集合, 以及所述关联关系的同 义词语集 合中, 分别选取词语进行组合, 以得到 至少一组词语组合。 5.根据权利要求4所述的方法, 其中, 所述对所述至少一个条件层中的属性键、 属性值 和所述关联关系, 分别确定所述属性键的同义词语集合、 所述属性值的同义词语集合, 以及 所述关联关系的同义词语集 合, 包括: 对所述属性键、 属性值和所述关联关系中的至少一个, 查询同义词词库, 以确定对应的 同义词语集 合。 6.根据权利要求4所述的方法, 其中, 所述对所述至少一个条件层中的属性键、 属性值 和所述关联关系, 分别确定所述属性键的同义词语集合、 所述属性值的同义词语集合, 以及 所述关联关系的同义词语集 合, 包括:权 利 要 求 书 1/4 页 2 CN 114861639 A 2将任一所述条件层所含的所述属性键、 属性值和所述关联关系中的至少一个作为元 素, 根据所述元 素中字符的词性和/或语义, 匹配 语义成分模板; 根据匹配的语义成分模板, 查询关联的至少一文本模板; 依据所述元素中所含字符的词性和/或语义, 将所述字符填充到所述至少一文本模板 中, 以得到所述元 素的同义词语; 将所述元素, 以及基于所述至少一文本模板所生成的同义词语, 作为所述同义词语集 合。 7.根据权利要求4所述的方法, 其中, 所述对所述至少一个条件层中的属性键、 属性值 和所述关联关系, 分别确定所述属性键的同义词语集合、 所述属性值的同义词语集合, 以及 所述关联关系的同义词语集 合, 包括: 将任一所述条件层所含的所述属性键、 属性值和所述关联关系中的至少一个作为元 素, 输入端到端的文本生成模型中, 以得到 输出的同义词语; 将所述元素, 以及所述端到端的文本生成模型输出的同义词语, 作为所述同义词语集 合。 8.根据权利要求1 ‑3任一项所述的方法, 其中, 所述根据设定的树形结构模板, 对所述 至少一组键值对进行组合, 以得到树形 结构, 包括: 分别确定各 所述键值对在所述 树形结构模板中对应的层; 针对各所述键值对对应层中的任一条件层, 根据对应键值对中属性值的数据类型, 确 定所述条件层对应的所述关联关系; 针对各所述键值对对应层中的所述顶层, 根据对应键值对中属性键, 确定疑 问对象, 以 及根据所述 树形结构模板中所述顶层设定的疑问词, 确定所述疑问文本; 根据所述顶层对应的所述疑 问文本, 各所述条件层对应的键值对和对应的所述关联关 系, 确定所述 树形结构。 9.根据权利要求8所述的方法, 其中, 所述针对各所述键值对对应层中的任一条件层, 根据对应键值对中属性 值的数据类型, 确定所述条件层对应的所述关联关系, 包括: 针对任一条件层, 在对应键值对的属性值为字符串的数据类型的情况下, 确定所述条 件层对应的所述关联关系为 等于; 在对应键值对的属性值为非字符串的数据类型的情况下, 确定所述条件层对应的所述 关联关系为 等于和不 等于中的任意 一个。 10.一种提问信息生成装置, 包括: 获取模块, 用于从结构化知识库中获取至少一组键值对; 组合模块, 用于根据设定的树形结构模板, 对所述至少一组键值对进行组合, 以得到树 形结构, 其中, 所述树形结构中包括用于指示疑问文本的顶层, 以及所述顶层下的至少一个 条件层, 任一所述条件层对应一组键值对中的属性键和属性值以及所述属性键和所述属性 值之间的关联关系; 第一生成模块, 用于根据所述至少一个条件层中的所述属性键、 属性值和所述关联关 系, 生成对应条件层的至少一组词语组合; 第二生成模块, 用于根据各所述条件层的所述至少一组词语组合, 以及所述顶层对应 的疑问文本, 生成提问信息 。权 利 要 求 书 2/4 页 3 CN 114861639 A 3

.PDF文档 专利 提问信息生成方法、装置、电子设备及存储介质

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 提问信息生成方法、装置、电子设备及存储介质 第 1 页 专利 提问信息生成方法、装置、电子设备及存储介质 第 2 页 专利 提问信息生成方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。