说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210873471.8 (22)申请日 2022.07.22 (71)申请人 阿里云计算有限公司 地址 310012 浙江省杭州市西湖区转塘科 技经济区块12号 (72)发明人 付晗 刘畅 吴斌 谭剑 李飞飞  (74)专利代理 机构 北京太合九思知识产权代理 有限公司 1 1610 专利代理师 周剑峰 (51)Int.Cl. G06F 16/33(2019.01) G06F 40/211(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 语言转义方法、 装置、 设备及存 储介质 (57)摘要 本申请实施例提供语言转义方法、 装置、 设 备及存储介质。 所述方法包括: 对获取到的目标 语句进行拆分, 得到至少一个目标子语句; 确定 所述目标子语句中包含的关键词类型和关键词 子句; 根据所述目标子语句中包含的关键词类型 对应的语义约束规则, 对所述目标子语句中的关 键词子句进行修正; 对修正后的目标子语句进行 组合, 生成可被执行的机器语言。 通过上述方式, 能够有效提高自然语言转义准确性 以及用户使 用数据库查询的工作效率, 同时降低对使用数据 库查询工作人员的技 术能力要求。 权利要求书3页 说明书14页 附图4页 CN 115292448 A 2022.11.04 CN 115292448 A 1.一种语言转 义方法, 所述方法包括: 对获取到的目标语句进行拆分, 得到 至少一个目标子语句; 确定所述目标子语句中包 含的关键词类型和关键词子句; 根据所述目标子语句中包含的关键词类型对应的语义约束规则, 对所述目标子语句中 的关键词子句进行修 正; 对修正后的目标子语句进行组合, 生成可被执 行的机器 语言。 2.根据权利要求1所述的方法, 所述对获取到的目标语句进行拆分, 得到至少一个目标 子语句, 包括: 利用解码器对基于用户提供的自然语言编码得到的语义特征向量进行解码处理, 得到 包含有关键词、 操作内容和预测值的目标语句; 根据嵌套关系对所述目标语句进行拆分, 生成无嵌套关系的所述至少一个目标子语 句。 3.根据权利要求2所述的方法, 所述根据嵌套关系 对所述目标语句进行拆分, 生成无嵌 套关系的所述至少一个目标子语句, 包括: 根据所述目标语句中包含的嵌套标识, 确定存在嵌套关系的第 一目标子语句和第 二目 标子语句; 其中, 所述第二目标子语句嵌套在所述第一目标子语句中; 在所述第一目标子语句中所述嵌套标识所在的嵌套位置添加位置标识; 生成由所述第一目标子语句和所述第二目标子语句按照嵌套关系中的层级顺序组成 的序列。 4.根据权利要求2所述的方法, 得到 至少一个目标子语句之后, 还 包括: 根据所述目标子语句中包 含的关键词类型, 确定对应的所述语义约束规则。 5.根据权利要求2所述的方法, 当所述关键词类型为SELE CT类型时, 所述利用解码器对基于用户提供的自然语言编码得到的语义特征向量进行解码处理, 得到包含有关键词、 操作内容和预测值的目标语句, 包括: 获取数据库提供的数据表; 对所述语义特征向量进行解码得到的所述SELECT关键词关联的操作内容与所述数据 表中数据列进行匹配度分析; 根据所述匹配度大小从所述数据表中确定与所述操作内容匹配的目标 数据列; 基于所述目标数据列中的数据, 生成包含SELECT关键词、 所述操作内容和所述预测值 的目标语句。 6.根据权利要求2所述的方法, 当所述关键词类型为 WHERE类型时; 所述利用解码器对基于用户提供的自然语言编码得到的语义特征向量进行解码处理, 得到包含有关键词、 操作内容和预测值的目标语句, 包括: 获取数据库提供的数据表; 根据所述语义特征信息进行解码得到的WHERE关键词关联的预测值, 从所述数据表中 筛选出操作内容; 根据所述预测值与 所述筛选出操作内容的匹配度 大小, 确定与 所述预测值匹配的所述 筛选出操作内容, 以得到包含WHERE关键词、 所述预测值和所述筛选出操作内容的目标语 句。权 利 要 求 书 1/3 页 2 CN 115292448 A 27.根据权利要求4所述的方法, 所述根据所述目标子语句中包含的关键词类型对应的 语义约束规则, 对所述目标子语句中的关键词子句进行修 正, 包括: 当所述关键词类型为HAVING类型时, 若执行所述操作内容时的执行结果为数值常量, 则将HAVING子句中的所述预测值 替换为常量。 8.根据权利要求1至7中任一项所述的方法, 所述根据所述目标子语句中包含的关键词 类型对应的语义约束规则, 对所述目标子语句中各 所述关键词子句进行修 正, 包括: 若所述预测值为非嵌套值, 则计算所述预测值的第 一特征向量与所述数据表中第 一数 据列中任意 一个值的第二特 征向量之间的第一相似度值; 若所述第一相似度值大于第 一阈值, 则用所述任意一个值替换所述预测值以得修正后 的目标子语句。 9.根据权利要求8所述的方法, 所述方法还包括: 若所述相似度值小于第一阈值, 则计 算所述数据表中除所述第一数据列之外的任意一列中任意一个值的第三特征向量与所述 第一特征向量之间的第二相似度值; 若所述第二相似度值大于第 二阈值, 则将所述任意一列中任意一个值替换所述预测值 以得到修 正后的目标子语句。 10.根据权利要求5或6所述的方法, 所述根据所述目标子语句中包含的关键词类型对 应的语义约束规则, 对所述目标子语句中各 所述关键词子句进行修 正, 包括: 当所述关键词类型为ORDER  BY类型时, 若所述目标子语句中除ORDER  BY子句外的其他 子句包含有聚合 函数, 则将所述ORDER  BY子句转换为嵌套查询语句。 11.根据权利要求5或6所述的方法, 所述根据所述目标子语句中包含的关键词类型对 应的语义约束规则, 对所述目标子语句中各 所述关键词子句进行修 正, 包括: 当所述关键词类型为GROUP  BY类型时, 若SELECT子句不包含聚合函数和GROUP  BY子句 对应的数据列的列名, 则将所述GROUP  BY的列名替换为主键; 若未查找到所述主键, 则将所述SELECT子句对应的数据列复制到所述GROUP  BY对应的 数据列。 12.根据权利要求5或6所述的方法, 还 包括: 当所述关键词类型为FROM类型时, 基于所述修正后的目标子语句对应的数据表和其中 的数据列生成有向图; 基于所述有向图中的所述数据表和所述数据列, 以所述数据列或外键为根节点构造最 小生成树。 13.根据权利要求5或6所述的方法, 所述对修 正后的目标子语句进行组合, 包括: 若修改后的所述目标子语句中的SELECT子句与 WHERE子句具有相同的列名或主外键关 系, 则对修改后的目标子语句进行组合; 或者, 若修改后的所述目标子语句中的SELECT子句与 WHERE子句不具有相同的列名或主外键 关系, 则将WHERE子句对应的列名复制到所述SELECT子句, 对修改后的目标子语句进行组 合。 14.一种电子设备, 包括存 储器及处 理器; 其中, 所述存储器, 用于存 储程序; 所述处理器, 与所述存储器耦合, 用于执行所述存储器 中存储的所述程序, 以用于实现权 利 要 求 书 2/3 页 3 CN 115292448 A 3

.PDF文档 专利 语言转义方法、装置、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语言转义方法、装置、设备及存储介质 第 1 页 专利 语言转义方法、装置、设备及存储介质 第 2 页 专利 语言转义方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:01上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。