(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211086716.9
(22)申请日 2022.09.07
(65)同一申请的已公布的文献号
申请公布号 CN 115186023 A
(43)申请公布日 2022.10.14
(73)专利权人 杭州安恒信息技 术股份有限公司
地址 310000 浙江省杭州市滨江区西兴街
道联慧街18 8号
(72)发明人 郝从顺 李思
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 姚莹丽
(51)Int.Cl.
G06F 16/25(2019.01)
G06F 16/245(2019.01)(56)对比文件
CN 114579673 A,202 2.06.03
CN 112948429 A,2021.0 6.11
CN 114090673 A,202 2.02.25
Karl Maso n等.An “On The Fly ”
Framework for Ef ficiently Generati ng
Synthetic Big Data Sets. 《2019 IE EE
Internati onal Conference o n Big Data (Big
Data)》 .2020,3 379-3387.
陈然等.电力交易市场数据中心建 设方案研
究. 《中国电机 工程学会电力市场专业委员会
2018年学术 年会暨全国电力交易机构联盟论坛
论文集》 .2018,20 6-212.
审查员 胡碧波
(54)发明名称
一种数据集 生成方法、 装置、 设备及 介质
(57)摘要
本申请公开了一种数据集生成方法、 装置、
设备及介质, 涉及数据可视化领域, 该方法包括:
通过预设第一信息获取接口获取数据集配置信
息; 所述数据集配置信息包括数据源信息、 数据
资源关联关系信息、 一般字段信息、 表达式字段
信息、 标签字段信息以及过滤器信息; 利用预设
的数据集生成器基于所述数据集配置信息中的
数据源信息确定数据源, 并基于所述数据集配置
信息中的数据资源关联关系信息与一般字段信
息从所述数据源中确定目标数据, 并对所述目标
数据进行组合封装, 以生成目标数据集; 将所述
目标数据集的数据集ID返回至预设客户端。 本发
明能够进行用户自定义的数据组合与封装, 可生
成用户自定义的多维度数据集。
权利要求书2页 说明书14页 附图7页
CN 115186023 B
2022.12.06
CN 115186023 B
1.一种数据集 生成方法, 其特 征在于, 包括:
通过预设第 一信息获取接口获取数据集配置信 息; 所述数据集配置信 息包括数据源信
息、 数据资源关联关系信息、 一般字段信息、 表达式字段信息、 标签字段信息以及过滤器信
息;
利用预设的数据集生成器基于所述数据集配置信 息中的数据源信 息确定数据源, 并基
于所述数据集配置信息中的数据资源关联关系信息与一般字段信息从所述数据源中确定
目标数据, 并对所述目标 数据进行组合封装, 以生成目标 数据集;
将所述目标 数据集的数据集 ID返回至预设客户端;
其中, 所述生成目标数据集之后, 还包括: 从所述目标数据集中确定维度信息以及度量
信息; 基于所述数据集配置信息、 维度信息以及度量信息生成数据集元数据; 相应的, 将所
述目标数据集的数据集ID返回至预设客户端, 包括: 将所述目标数据集的数据集ID和所述
数据集元 数据返回至预设客户端。
2.根据权利要求1所述的数据集生成方法, 其特征在于, 所述通过预设第 一信息获取接
口获取数据集配置信息, 包括:
通过预设第 一信息获取接口获取数据源信 息、 数据资源关联关系信 息、 一般字段信 息、
表达式字段信息、 标签字段信息以及过滤器信息; 其中, 所述数据源信息、 所述数据资源关
联关系信息、 所述一般字段信息为必选信息; 所述表达式字段信息、 所述标签字段信息以及
所述过滤器信息为可选信息 。
3.根据权利要求2所述的数据集生成方法, 其特征在于, 所述基于所述数据集配置信 息
中的数据资源关联关系信息与一般字段信息从所述数据源中确定目标数据, 并对所述目标
数据进行组合封装, 以生成目标 数据集, 包括:
基于所述数据集配置信息中的数据资源关联关系信息与一般字段信息对所述目标数
据进行关联与组合, 以生成第一数据集;
对所述第一数据集进行维度与数据分析, 以确定所述第一数据集中的维度数据, 并利
用预设维度拆分方法对所述维度数据进行维度拆分, 以确定拆分后数据, 并基于所述拆分
后数据生成第二数据集;
基于所述数据集配置信 息中的过滤器信 息对所述第 二数据集进行校验与 过滤, 以生成
第三数据集;
基于所述数据集配置信息中的表达式字段信息和标签字段信息对所述第三数据集进
行表达式执 行和标签生成, 以生成目标 数据集。
4.根据权利要求1所述的数据集生成方法, 其特征在于, 所述通过预设第 一信息获取接
口获取数据集配置信息之后, 还 包括:
利用预设格式校验器对所述数据集配置信息中的各个 配置项进行格式校验;
在所述格式校验通过后, 利用预设配置解析器确定所述数据集配置信 息对应的数据源
信息, 并建立与所述数据源之间的连接链路, 然后基于所述数据源信息中的目标数据资源
信息确定所述数据源中是否存在所述目标 数据资源信息对应的目标 数据资源;
若所述数据源中存在所述目标数据资源信 息对应的目标数据资源, 则执行所述利用预
设的数据集 生成器基于所述数据集配置信息中的数据源信息确定数据源的步骤;
若所述数据源中不存在所述目标数据资源信 息对应的目标数据资源, 则禁止执行所述权 利 要 求 书 1/2 页
2
CN 115186023 B
2利用预设的数据集 生成器基于所述数据集配置信息中的数据源信息确定数据源的步骤。
5.根据权利要求1所述的数据集生成方法, 其特征在于, 所述通过预设第 一信息获取接
口获取数据集配置信息, 包括:
通过预设第一信息获取接口获取JSON格式的数据集配置信息;
相应的, 所述基于所述数据集配置信 息、 维度信息以及度量信 息生成数据集元数据, 包
括:
基于所述数据集配置信息、 维度信息以及度量信息以JSON格式生成数据集元 数据。
6.根据权利要求1至5任一项所述的数据集生成方法, 其特征在于, 所述将所述目标数
据集的数据集 ID返回至预设客户端之后, 还 包括:
通过预设第 二信息获取接口获取包含目标查询数据集ID、 查询类型以及查询体的数据
查询信息; 所述查询类型包括聚合查询类型或一般查询类型; 所述查询 体中包括 目标度量
或目标维度的ID、 目标查询数据的分页信息、 排序信息以及格式化信息;
利用预设查询解析器对所述数据查询信息中的各个 配置项进行格式校验;
在所述格式校验通过后, 判断所述数据查询信息中的目标查询数据集ID是否存在, 并
判断所述 查询体中所述目标度量或目标维度的ID是否存在;
若所述数据查询信息中的目标查询数据集ID、 所述目标度量或目标维度的ID均存在,
则确定目标查询数据, 并基于所述 查询类型生成查询语法树;
利用预设查询执行器基于所述查询语法树与所述目标查询数据的分页信 息、 排序信 息
以及格式化信息生成结果 集, 并将所述结果 集返回至预设客户端。
7.一种数据集 生成装置, 其特 征在于, 包括:
数据集配置信息获取模块, 用于通过预设第一信息获取接口获取数据集配置信息; 所
述数据集配置信息包括数据源信息、 数据资源关联关系信息、 一般字段信息、 表达式字段信
息、 标签字段信息以及过 滤器信息;
目标数据集生成模块, 用于利用预设的数据集生成器基于所述数据集配置信 息中的数
据源信息确定数据源, 并基于所述数据集配置信息中的数据资源关联关系信息与一般字段
信息从所述数据源中确定目标 数据, 并对所述目标 数据进行组合封装, 以生成目标 数据集;
数据集ID返回模块, 用于将所述目标 数据集的数据集 ID返回至预设客户端;
其中, 所述数据集生成装置, 还用于从所述目标数据集中确定维度信 息以及度量信 息;
基于所述数据集配置信息、 维度信息以及度量信息生 成数据集元数据; 相应的, 数据集ID返
回模块, 具体用于将所述目标 数据集的数据集 ID和所述数据集元 数据返回至预设客户端。
8.一种电子设备, 其特征在于, 包括处理器和存储器; 其中, 所述处理器执行所述存储
器中保存的计算机程序时实现如权利要求1至 6任一项所述的数据集 生成方法。
9.一种计算机可读存储介质, 其特征在于, 用于存储计算机程序; 其中, 所述计算机程
序被处理器执行时实现如权利要求1至 6任一项所述的数据集 生成方法。权 利 要 求 书 2/2 页
3
CN 115186023 B
3
专利 一种数据集生成方法、装置、设备及介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:00:42上传分享