说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211163367.6 (22)申请日 2022.09.23 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 唐隆伟  (74)专利代理 机构 深圳市世联合知识产权代理 有限公司 4 4385 专利代理师 郝少剑 (51)Int.Cl. G06F 16/242(2019.01) G06F 16/22(2019.01) G06F 16/2453(2019.01) G06F 16/2457(2019.01)G06F 16/2455(2019.01) G06F 16/901(2019.01) (54)发明名称 基于用户特征进行HQL执行语句预测的方法 及其相关 设备 (57)摘要 本申请实施例属于人工智能及大数据领域, 应用于数据仓库构建领域中, 涉及一种基于用户 特征进行HQL执行语句预测的方法及其相关设 备, 包括将源 数据存入各数据事实表和各数据维 度表内; 获取外键字段和各数据事实表的主键字 段, 通过预设算法规则、 外键字段和主键字段得 到各数据事实表间的表间距离; 构建表间关联拓 扑图; 组装最优HQL执行语句; 获取若干个第一用 户的最优HQL执行语句, 进行预测模型预训练; 接 收第二用户发出的最优HQL执行语句组装请求, 基于预训练完成的预测模型, 获得第二用户的最 优HQL执行语句。 本方案实现轻代码化和自动化 的进行数据加工, 将这种自动化和用户特征捆绑 在一起, 基于用户驱动数据加工模型产生, 减少 重复构建的时耗。 权利要求书4页 说明书13页 附图6页 CN 115495471 A 2022.12.20 CN 115495471 A 1.一种基于用户特 征进行HQ L执行语句预测的方法, 其特 征在于, 包括下述 步骤: 获取源数据, 根据预设建模方式和存储规则对源数据进行存储, 将所述源数据存入相 应的各数据事实表和各数据维度 表内, 其中, 所述预设建模方式包括星 型模式、 雪花模式和 星座模式; 获取各所述数据事实表的主键字段, 并从对应的数据维度表中获取外键字段, 通过预 设算法规则、 所述外 键字段和所述主键 字段得到各数据事实表间的表间距离; 基于所述表间距离和所述主键字段, 对所述各数据事实表构建表间关联拓扑图, 其中, 所述表间关联拓扑图以所述主键 字段为拓扑节点; 基于第一用户的行为特征和所述表间关联拓扑图, 组装所述第一用户对应的最优HQL 执行语句, 其中, 所述行为特 征包括用户发出的HQ L执行语句组装请求; 获取若干个第一用户对应的最优HQL执行语句, 将所述若干个第一用户对应的最优HQL 执行语句作为结果集, 基于预设特征表单, 获取所述若干个第一用户对应的画像特征, 将所 述画像特 征作为输入集, 进行 预测模型 预训练; 接收第二用户发出的HQL执行语句组装请求, 基于所述特征表单获取所述第二用户对 应的画像特 征; 将所述画像特征输入预训练完成的预测模型, 获得所述第二用户对应的最优HQL执行 语句。 2.根据权利要求1所述的基于用户特征进行HQL执行语句预测的方法, 其特征在于, 所 述根据预设建模方式和存储规则对源数据进 行存储, 将所述源数据存入相应的各数据事实 表和各数据维度表内的步骤, 具体包括: 根据预设的数据类型分类规则, 对所述源数据进行分类, 将所述源数据中单元数据划 分为事实表数据和维度表数据两个种类; 根据相应的表格创建指令, 在预设数据存储区分别生成对应的数据事实表和数据维度 表; 按照所述存储规则将分类种类为所述事实表数据的单元数据存储进对应的数据事实 表; 按照所述存储规则将分类种类为所述维度表数据的单元数据存储进对应的数据维度 表; 其中, 所述存储规则, 具体包括: 所述数据事实表中存储当前数据事实表 的主键字段、 所述主键字段对应的数据指标字段和所述数据指标字段的维度信息, 所述数据维度表中存 储各数据事实表的主键字段和所述主键字段的维度信息, 每个所述主键字段对应一个数据 事实表, 所述数据维度表中用于存 储所述数据事实表的主键 字段的列, 作为所述外 键字段。 3.根据权利要求2所述的基于用户特征进行HQL执行语句预测的方法, 其特征在于, 所 述获取各所述数据事实表的主键字段, 并从对应的数据维度表中获取外键字段, 通过预设 算法规则、 所述外键字段和所述主键字段得到各数据事实表间的表间距离的步骤, 具体包 括: 步骤A: 预先选择各所述数据事实表中的任一个数据事实表, 获取所述数据事实表的主 键字段, 并将所述主键 字段设置为距离点 in; 步骤B: 基于当前主键 字段查询出存 储了所述当前主键 字段的所有数据维度表;权 利 要 求 书 1/4 页 2 CN 115495471 A 2步骤C: 获取所述所有数据维度表中用于做数据事实表的主键字段的外键字段及所述 外键字段的维度信息; 步骤D: 根据所述外键字段及外键字段的维度信息, 获取与所述当前主键字段相关联的 上一级或下一级主键字段, 并将所述主键字段设置为距离点in+1, 将所述主键字段更新为当 前主键字段; 步骤E: 采用循环的方式执行步骤B至步骤D, 对获取到的主键字段更新距离点, 直到所 述当前主键 字段无相关联的下一级 主键字段为止, 其中, in的初始值 为0, in+1=in+1。 4.根据权利要求3所述的基于用户特征进行HQL执行语句预测的方法, 其特征在于, 所 述基于所述表间距离和所述主键字段, 对所述各数据事实表构建表间关联拓扑图的步骤, 具体包括: 获取并遍历各 所述数据事实表的主键 字段对应的距离点; 以距离点为0的所述主键字段为起始拓扑节点, 按照距离点升序依次查找对应主键字 段作为下一级拓扑节点, 直到查找到距离点为最大值时对应主键字段所对应的拓扑节点, 依次连接所有查找到的拓扑节点, 完成所述表间关联拓扑图构建。 5.根据权利要求4所述的基于用户特征进行HQL执行语句预测的方法, 其特征在于, 所 述基于第一用户的行为特征和所述表间关联拓扑图, 组装所述第一用户对应的最优HQL执 行语句的步骤, 具体包括: 接收由第一用户发出的HQL执行语句组装请求, 其中, 所述HQL执行语句组装请求中包 括所述第一用户所需的目标数据索引信息, 其中, 所述索引信息为所述 目标数据对应的数 据事实表的主键 字段; 对所述HQL执行语句组装请求进行解析, 解析出所述目标数据索引信息, 根据 所述表间 关联拓扑图和所述目标 数据索引信息, 组装获取 所述目标 数据的最优HQ L执行语句; 将所述最优HQL执行语句作为返回值, 返回给 所述第一用户。 6.根据权利要求5所述的基于用户特征进行HQL执行语句预测的方法, 其特征在于, 所 述根据所述表间关联拓扑图和所述目标数据索引信息, 组装获取所述目标数据的最优HQL 执行语句的步骤, 具体包括: 步骤a: 获取用于缓存用户信息的数据事实表的主键 字段; 步骤b: 从所述表间关联拓扑图中查找所述主键字段对应的拓扑节点, 标记为第 一拓扑 节点, 获取 所述第一拓扑节点对应的距离点, 记为第一距离点; 步骤c: 根据所述目标数据的数据事实表的主键字段, 从所述表间关联拓扑图中查找所 述主键字段对应的拓扑节点, 标记为目标拓扑节 点, 获取所述目标拓扑节点对应的距离点, 记为第二距离点; 步骤d: 根据所述表间关联拓扑图, 构建从所述第 一距离点至所述第 二距离点的拓扑节 点路径, 获取 所述拓扑节点路径所包 含的节点个数; 步骤e: 判断所述第一距离点和所述第二距离点的差值是否满足预设等式公式: |ia‑ib| =c‑1, 其中, ia为第一距离点, ib为第二距离点, |ia‑ib|为所述第一距离点和第二距离点的 差值对应的绝对值, c为所述拓扑节点路径所包 含的的节点个数; 步骤f: 若所述第一距离点和所述第 二距离点的差值满足预设等式公式, 则最短路径确 定完成, 否则, 重复执 行步骤d至步骤e;权 利 要 求 书 2/4 页 3 CN 115495471 A 3

.PDF文档 专利 基于用户特征进行HQL执行语句预测的方法及其相关设备

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于用户特征进行HQL执行语句预测的方法及其相关设备 第 1 页 专利 基于用户特征进行HQL执行语句预测的方法及其相关设备 第 2 页 专利 基于用户特征进行HQL执行语句预测的方法及其相关设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:35:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。