说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210532540.9 (22)申请日 2022.05.12 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 刘辉 张睿卿 王曦阳 何中军  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 单冠飞 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/211(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 文本的翻译方法、 装置、 电子设备和存储介 质 (57)摘要 本公开公开了一种文本的翻译方法、 装置、 电子设备和存储介质, 尤其涉及自然语言处理、 深度学习等人工智能技术领域。 其中, 方案为: 确 定待处理语句中包含的目标术语; 基于所述目标 术语, 遍历预设的数据库, 以获取所述目标术语 对应的候选释义; 将所述待处理语句与所述候选 释义进行匹配, 以确定所述待处理语句与所述候 选释义间的匹配度; 基于所述匹配度, 确定所述 目标术语对应的目标释义; 基于所述目标释义, 确定待处理语句对应的翻译语句。 由此, 在进行 文本翻译时, 可以根据待处理语句中包含的目标 术语与各个候选释义间的匹配度, 确定出准确可 靠的目标释义, 之后再基于目标释义, 对待处理 语句进行翻译处理, 从而提高了文本翻译的可靠 性和准确性。 权利要求书2页 说明书10页 附图4页 CN 114781409 A 2022.07.22 CN 114781409 A 1.一种文本的翻译方法, 其中, 包括: 确定待处 理语句中包 含的目标术语; 基于所述目标术语, 遍历预设的数据库, 以获取 所述目标术语对应的候选释义; 将所述待处理语句与 所述候选释义进行匹配, 以确定所述待处理语句与所述候选释义 间的匹配度; 基于所述匹配度, 确定所述目标术语对应的目标释义; 基于所述目标释义, 确定所述待处 理语句对应的翻译语句。 2.如权利要求1所述的方法, 其中, 所述基于所述匹配度, 确定所述目标术语对应的目 标释义, 包括: 将最高匹配度对应的候选释义确定为所述目标术语对应的目标释义。 3.如权利要求1所述的方法, 其中, 所述基于所述匹配度, 确定所述目标术语对应的目 标释义, 包括: 在最高匹配度对应的候选释义为多个的情况下, 确定所述目标术语对应的多个候选释 义中每个候选释义的权 重; 将所述多个候选释义中最大权重对应的候选释义, 确定为所述目标术语对应的目标释 义。 4.如权利要求3所述的方法, 其中, 在所述确定所述目标术语对应的多个候选释义中每 个候选释义的权 重之前, 还 包括: 确定每个参考术语以每个候选释义在语料库中出现的频率, 其中, 每个所述参考术语 对应多个候选释义; 根据每个所述参考术语以每个候选释义在语料库中出现的频率, 确定每个所述参考术 语中每个候选释义对应的权 重。 5.如权利要求1所述的方法, 其中, 所述将所述待处理语句与所述候选释义进行匹配, 以确定所述待处 理语句与所述 候选释义间的匹配度, 包括: 确定所述待处 理语句对应的第一句子向量、 及所述 候选释义对应的第二句子向量; 将所述第一句子向量与所述第 二句子向量进行匹配, 以确定所述待处理语句与所述候 选释义间的匹配度。 6.如权利要求1 ‑5任一所述的方法, 其中, 所述确定待处理语句中包含的目标术语, 包 括: 将所述待处 理语句分别与各参 考术语进行匹配; 在所述待处理语句中包含任一参考术语的情况下, 确定所述任一参考术语为所述待处 理语句中包 含的目标术语。 7.一种文本的翻译装置, 其中, 所述装置包括: 第一确定模块, 用于确定待处 理语句中包 含的目标术语; 获取模块, 用于所述目标术语, 遍历预设的数据库, 以获取所述目标术语对应的候选释 义; 匹配模块, 用于将所述待处理语句与所述候选释义进行匹配, 以确定所述待处理语句 与所述候选释义间的匹配度; 第二确定模块, 用于基于所述匹配度, 确定所述目标术语对应的目标释义;权 利 要 求 书 1/2 页 2 CN 114781409 A 2第三确定模块, 用于基于所述目标释义, 确定所述待处 理语句对应的翻译语句。 8.如权利要求7 所述的装置, 其中, 所述第二确定模块, 具体用于: 将最高匹配度对应的候选释义确定为所述目标术语对应的目标释义。 9.如权利要求7 所述的装置, 其中, 所述第二确定模块, 具体用于: 在最高匹配度对应的候选释义为多个的情况下, 确定所述目标术语对应的多个候选释 义中每个候选释义的权 重; 将所述多个候选释义中最大权重对应的候选释义, 确定为所述目标术语对应的目标释 义。 10.如权利要求9所述的装置, 其中, 所述第二确定模块, 还具体用于: 确定每个参考术语以每个候选释义在语料库中出现的频率, 其中, 每个所述参考术语 对应多个候选释义; 根据每个所述参考术语以每个候选释义在语料库中出现的频率, 确定每个所述参考术 语中每个候选释义对应的权 重。 11.如权利要求7 所述的装置, 其中, 所述匹配模块, 具体用于: 确定所述待处 理语句对应的第一句子向量、 及所述 候选释义对应的第二句子向量; 将所述第一句子向量与所述第 二句子向量进行匹配, 以确定所述待处理语句与所述候 选释义间的匹配度。 12.如权利要求7 ‑11任一所述的装置, 其中, 所述第一确定模块, 具体用于: 将所述待处 理语句分别与各参 考术语进行匹配; 在所述待处理语句中包含任一参考术语的情况下, 确定所述任一参考术语为所述待处 理语句中包 含的目标术语。 13.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑6中任一项所述的方法。 14.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑6中任一项所述的方法。 15.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1 ‑6中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114781409 A 3

.PDF文档 专利 文本的翻译方法、装置、电子设备和存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本的翻译方法、装置、电子设备和存储介质 第 1 页 专利 文本的翻译方法、装置、电子设备和存储介质 第 2 页 专利 文本的翻译方法、装置、电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。