说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111630180.8 (22)申请日 2021.12.28 (71)申请人 讯飞智元信息科技有限公司 地址 230000 安徽省合肥市高新区望江西 路666号讯飞大厦8层-10层 (72)发明人 王华 周定良 范勇 郑伟伟  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 代理人 刘希 (51)Int.Cl. G06F 40/258(2020.01) G06F 16/332(2019.01) G06K 9/62(2022.01) (54)发明名称 摘要生成方法及相关装置、 设备和存 储介质 (57)摘要 本申请公开了一种摘要生成方法及相关装 置、 设备和存储介质, 其中, 摘要生成方法包括: 获取到待生成摘要文本; 将待生成摘要文本生成 多个问答对; 其中, 各问答对包括与一个待生成 摘要文本对应的主题要素的关键要素; 每个主题 要素包括多个 关键要素; 将问答对输入摘要生成 模型, 对问答对进行摘要抽取处理, 得到各问答 对的摘要; 对各问答对的摘要进行整合, 形成待 生成摘要文本的综合摘要。 上述方案, 能够提高 摘要的质量。 权利要求书3页 说明书13页 附图5页 CN 114357987 A 2022.04.15 CN 114357987 A 1.一种摘要生成方法, 其特 征在于, 所述方法包括: 获取到待生成摘要 文本; 将所述待生成摘要文本生成多个问答对; 其中, 各所述问答对包括与一个所述待生成 摘要文本对应的主题要素的关键要素; 每 个所述主题要素包括多个关键要素; 将所述问答对输入摘要生成模型, 对所述问答对进行摘要抽取处理, 得到各所述问答 对的摘要; 对各所述问答对的摘要 进行整合, 形成所述待生成摘要 文本的综合摘要。 2.根据权利要求1所述的摘要生成方法, 其特征在于, 所述待生成摘要文本为问答文 本; 其中, 所述问答文本中的问题和答案是不同对象所提供的; 所述将所述待生成摘要 文本生成多个问答对的步骤, 包括: 识别所述待生成摘要文本中的各个问题, 并基于所述问题, 确定各所述问答对的所述 关键要素; 对各所述问题对应的答案进行识别, 得到确定关键要素的多个问答对。 3.根据权利要求2所述的摘要生成方法, 其特征在于, 所述识别所述待生成摘要文本中 的各个问题, 并基于所述问题, 确定各 所述问答对的所述关键要素的步骤之前, 包括: 构建所述主题要素的问题提纲库; 其中, 所述问题提纲库包括所述主题要素的各所述 关键要素的至少一种问法; 所述识别所述待生成摘要文本中的各个问题, 并基于所述问题, 确定各所述问答对的 所述关键要素的步骤, 包括: 将各所述问题与所述问题提纲库的问法进行比对, 确定各 所述问答对的关键要素。 4.根据权利要求3所述的摘要生成方法, 其特征在于, 所述将各所述问题与 所述问题提 纲库的所述问法进行比对, 确定各 所述问答对的关键要素的步骤, 包括: 分别计算得到各 所述问题与所述问题提纲库的问法的相似度; 确定与所述问题相似度最高的问法, 并将所述问法对应的关键要素确定为所述问答对 的关键要素。 5.根据权利要求3所述的摘要生成方法, 其特 征在于, 所述摘要生成方法还 包括: 如果所述问题与所述问题提纲库的问法均不相关, 删除所述问题以及其对应的答案 。 6.根据权利要求1~5任一项所述的摘要生成方法, 其特征在于, 所述将所述待生成摘 要文本生成多个问答对的步骤, 包括: 基于所述待生成摘要文本的主题要素将所述待生成摘要文本分成多个片段; 其中, 每 个所述片段中的问答对均包括相同的关键要素; 将各所述片段中的问答对中的问题进行合并, 以及将所述问题对应的答案进行合并, 得到各所述片段对应的问答组对; 所述将所述问答对输入摘要生成模型, 对所述问答对进行摘要抽取处理, 得到各所述 问答对的摘要的步骤, 包括: 将所述各所述片段对应的问答组对输入到所述摘要生成模型, 对所述问答组对进行摘 要抽取处 理, 得到各 所述问答组对的摘要。 7.根据权利要求1~5任一项所述的摘要生成方法, 其特征在于, 所述将所述问答对输 入摘要生成模型, 对所述问答对进行摘要抽取处理, 得到各所述问答对的摘要的步骤, 包权 利 要 求 书 1/3 页 2 CN 114357987 A 2括: 抽取所述问答对在本次迭代的摘要字符; 将已有候选摘要与 所述本次迭代的摘要字符组成本次候选摘要, 所述已有候选路径为 所述本次迭代之前生成的; 判断所述本次候选摘要是否满足摘要生成条件; 若是, 则将所述本次候选摘要作为所述问答对的最终候选摘要, 若否, 则将加入所述本 次迭代的摘要字符的问答对输入所述摘要生成模型, 迭代执行所述抽取所述问答对在本次 迭代的摘要字符及其后续 步骤, 直到所述本次候选摘要满足摘要生成条件; 基于所述 最终候选摘要, 确定所述问答对的摘要。 8.根据权利要求7所述的摘要生成方法, 其特征在于, 所述摘要生成条件为所述迭代的 累计次数超过 预设迭代次数, 和/或, 所述本次迭代的摘要字符为结束字符。 9.根据权利 要求7所述的摘要生成方法, 其特征在于, 所述摘要生成模型为Unilm模型, 所述抽取 所述问答对在本次迭代的摘要字符的步骤, 包括: 将所述问答对转换为字符数组, 所述字符数组包括组成所述问答对的每 个字符; 获取并排名所述每 个字符的第一预测得分; 将排名靠前的第一预设数量个所述第一预测得分对应的字符作为所述本次迭代的摘 要字符。 10.根据权利要求7所述的摘要生成方法, 其特征在于, 所述将已有候选摘要与所述本 次迭代的摘要字符组成本次候选摘要的步骤, 包括: 利用集束搜索算法计算每个所述本次迭代的摘要字符组成的候选摘要的第二预测得 分; 将排名靠前的第二预设数量个所述第二预测得分对应的所述候选摘要作为所述本次 候选摘要; 所述最终候选摘要对应有所述第二预测得分, 所述基于所述最终候选摘要, 确定所述 问答对的摘要的步骤, 包括: 将排名靠前的第三预设数量个所述第二预测得分对应的所述最终候选摘要作为所述 问答对的摘要。 11.根据权利要求1所述的摘要生成方法, 其特征在于, 所述对各所述问答对的摘要进 行整合, 形成所述待生成摘要 文本的综合摘要的步骤, 包括: 利用文本相似度算法识别所述问答对的摘要之间的相似摘要信 息, 将去除所述相似摘 要信息的摘要拼接成所述综合摘要, 或者, 将各 所述问答对的摘要拼接成所述综合摘要。 12.一种摘要生成装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取到待生成摘要 文本; 生成模块, 用于将所述待生成摘要文本生成多个问答对; 其中, 各所述问答对包括与一 个所述待生成摘要文本对应的主题要素的关键要素; 每个所述主题要素包括多个关键要 素; 抽取模块, 用于将所述问答对输入摘要生成模型, 对所述问答对进行摘要抽取处理, 得 到各所述问答对的摘要; 整合模块, 用于对各所述问答对的摘要进行整合, 形成所述待生成摘要文本的综合摘权 利 要 求 书 2/3 页 3 CN 114357987 A 3

.PDF文档 专利 摘要生成方法及相关装置、设备和存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 摘要生成方法及相关装置、设备和存储介质 第 1 页 专利 摘要生成方法及相关装置、设备和存储介质 第 2 页 专利 摘要生成方法及相关装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:44:31上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。